Các câu trả lời được đưa ra đang cho tôi một số ý tưởng về những gì đang diễn ra ở đây. Tôi tin rằng có thể đã có một số sai lầm do tai nạn. Xem câu chuyện sau có hợp lý không: Để bắt đầu, tôi nghĩ có lẽ có mối quan hệ chặt chẽ giữa X & Y trong dữ liệu (đây là một số mã và cốt truyện):
set.seed(5)
wage <- rlnorm(1000, meanlog=2.3, sdlog=.5)
something_else <- .7*wage + rnorm(1000, mean=0, sd=1)
plot(wage, something_else, pch=3, col="red", main="Plot X vs. Y")
Nhưng do nhầm lẫn Y đã được dự đoán chỉ từ trung bình. Kết hợp điều này, phần dư từ mô hình duy nhất trung bình được vẽ dựa trên X, mặc dù mục đích của nó là âm mưu chống lại các giá trị được trang bị (mã & lô):
meanModel <- lm(something_else~1)
windows()
plot(wage, meanModel$residuals, pch=3, col="red",
main="Plot of residuals from Mean only Model against X")
abline(h=0, lty="dotted")
Chúng ta có thể khắc phục điều này bằng cách khớp mô hình thích hợp và vẽ các phần dư từ đó (mã & lô):
appropriateModel <- lm(something_else~wage)
windows()
plot(appropriateModel$fitted.values, appropriateModel$residuals, pch=3, col="red",
main="Plot of residuals from the appropriate\nmodel against fitted values")
lines(lowess(appropriateModel$residuals~appropriateModel$fitted.values))
Đây có vẻ như chỉ là những kiểu ngốc nghếch tôi đã làm khi tôi bắt đầu.