Tôi đang tìm cách giải thích (trực quan) giải thích tương quan tuyến tính đơn giản cho sinh viên năm thứ nhất.
Cách cổ điển để hình dung sẽ là đưa ra một biểu đồ phân tán Y ~ X với đường hồi quy thẳng.
Gần đây, tôi nảy ra ý tưởng mở rộng loại đồ họa này bằng cách thêm vào cốt truyện thêm 3 hình ảnh, để lại cho tôi: cốt truyện phân tán của y ~ 1, sau đó là y ~ x, Resid (y ~ x) ~ x và cuối cùng phần dư (y ~ x) ~ 1 (tập trung vào giá trị trung bình)
Dưới đây là một ví dụ về một hình dung như vậy:
Và mã R để sản xuất nó:
set.seed(345)
x <- runif(50) * 10
y <- x +rnorm(50)
layout(matrix(c(1,2,2,2,2,3 ,3,3,3,4), 1,10))
plot(y~rep(1, length(y)), axes = F, xlab = "", ylim = range(y))
points(1,mean(y), col = 2, pch = 19, cex = 2)
plot(y~x, ylab = "", )
abline(lm(y~x), col = 2, lwd = 2)
plot(c(residuals(lm(y~x)) + mean(y))~x, ylab = "", ylim = range(y))
abline(h =mean(y), col = 2, lwd = 2)
plot(c(residuals(lm(y~x)) + mean(y))~rep(1, length(y)), axes = F, xlab = "", ylab = "", ylim = range(y))
points(1,mean(y), col = 2, pch = 19, cex = 2)
Điều này dẫn tôi đến câu hỏi của tôi: Tôi sẽ đánh giá cao bất kỳ đề xuất nào về cách biểu đồ này có thể được tăng cường (bằng văn bản, nhãn hiệu hoặc bất kỳ loại hình ảnh trực quan nào khác). Thêm mã R có liên quan cũng sẽ tốt đẹp.
Một hướng là thêm một số thông tin của R ^ 2 (bằng văn bản hoặc bằng cách nào đó thêm các dòng thể hiện độ lớn của phương sai trước và sau khi giới thiệu x) Một tùy chọn khác là làm nổi bật một điểm và cho thấy nó "tốt hơn" giải thích "nhờ đường hồi quy. Bất kỳ đầu vào sẽ được đánh giá cao.
require(mlbench) ; cor( mlbench.smiley()$x ); plot(mlbench.smiley()$x)