Tôi bắt đầu đào một chút vào hàm plot.lm , hàm này cung cấp sáu ô cho lm, chúng là:
- một lô của phần dư chống lại các giá trị được trang bị
- một biểu đồ tỷ lệ vị trí của sqrt (| phần dư |) so với các giá trị được trang bị
- một âm mưu QQ bình thường, một âm mưu về khoảng cách của Cook so với các nhãn hàng
- một âm mưu của phần dư chống lại đòn bẩy
- một âm mưu về khoảng cách của Cook chống lại đòn bẩy / (1 đòn bẩy)
Và tôi đang tự hỏi những phần mở rộng phổ biến / hữu ích nào khác của các ô hiện tại tồn tại cho các mô hình tuyến tính và làm thế nào chúng có thể được thực hiện trong R? (liên kết đến các bài viết của gói cũng được hoan nghênh)
Vì vậy, hàm boxcox (từ {MASS}) là một ví dụ về một biểu đồ chẩn đoán hữu ích khác (và câu trả lời như vậy sẽ rất tuyệt), tuy nhiên, tôi tò mò hơn về các biến thể / phần mở rộng trên các lô chẩn đoán mặc định hiện có cho lm trong R (mặc dù nói chung nhận xét khác về chủ đề luôn được hoan nghênh).
Dưới đây là một số ví dụ đơn giản về những gì tôi muốn nói:
#Some example code for all of us to refer to
set.seed(2542)
x1 <- rnorm(100)
x2 <- runif(100, -2,2)
eps <- rnorm(100,0,2)
y <- 1 + 2*x1 + 3*x2 + eps
y[1:4] <- 14 # adding some contaminated points
fit <- lm(y~x1+x2)
#plot(y~x1+x2)
#summary(fit)
Để vẽ các phần dư so với từng tiềm năng x
plot(resid(fit)~x1); abline (h = 0)
plot(resid(fit)~x2); abline (h = 0)
# plot(resid(fit)~x1+x2) # you can also use this, but then you wouldn't be able to use the abline on any plot but the last one
Để thêm dòng 0-1 (dòng này được gọi bằng tiếng Anh như thế nào?!) Vào qqplot để xem qqline lệch khỏi nó bao nhiêu
plot(fit, which = 2); abline(0,1, col = "green")
Để vẽ đồ thị qq bằng cách sử dụng phần dư sinh viên bên ngoài
# plot(fit, which = 2); abline(0,1, col = "green") # The next command is just like this one
qqnorm(rstandard(fit), ylim = c(-2.2,4.2)); qqline(rstudent(fit), lty = 2) ;abline(0,1, col = "green")
qqnorm(rstudent(fit), ylim = c(-2.2,4.2)); qqline(rstudent(fit), lty = 2) ;abline(0,1, col = "green")
# We can note how the "bad" points are more extreme when using the rstudent