Tính không đồng nhất và tính bình thường


12

Tôi có một hồi quy tuyến tính khá tốt, tôi đoán vậy (đó là cho một dự án đại học nên tôi không thực sự phải siêu chính xác).

Điểm là, nếu tôi vẽ các phần dư so với các giá trị dự đoán, có (theo giáo viên của tôi) một gợi ý về tính không đồng nhất.

Nhưng nếu tôi vẽ sơ đồ QQ của phần dư, thì rõ ràng chúng thường được phân phối. Hơn nữa, thử nghiệm Shapiro trên phần dư có giá trị là , vì vậy tôi nghĩ không có nghi ngờ gì về phần dư thực sự được phân phối bình thường.0,8p0,8

Câu hỏi: Làm thế nào có thể có sự không đồng nhất trên các giá trị dự đoán nếu phần dư được phân phối bình thường?


1
Một bổ sung rất ngắn để @whubers câu trả lời tuyệt vời: Bạn có thể sử dụng các ncvTestchức năng của gói xe cho Rtiến hành một thử nghiệm chính thức cho các biến ngẫu nhiên. Trong ví dụ của whuber, lệnh ncvTest(fit)mang lại giá trị gần như bằng 0 và cung cấp bằng chứng mạnh mẽ chống lại phương sai lỗi không đổi (tất nhiên là được dự kiến). p
COOLSerdash

Câu trả lời:


16

Một cách để tiếp cận câu hỏi này là xem xét ngược lại: làm thế nào chúng ta có thể bắt đầu với các phần dư được phân phối bình thường và sắp xếp chúng thành không đồng nhất? Từ quan điểm này, câu trả lời trở nên rõ ràng: liên kết các phần dư nhỏ hơn với các giá trị dự đoán nhỏ hơn.

Để minh họa, đây là một công trình rõ ràng.

Nhân vật

Dữ liệu ở bên trái rõ ràng là không đồng nhất so với sự phù hợp tuyến tính (hiển thị màu đỏ). Điều này được dẫn về nhà bởi phần dư so với cốt truyện dự đoán ở bên phải. Nhưng - bằng cách xây dựng - tập hợp các phần dư không có thứ tự gần với phân phối bình thường, như biểu đồ của chúng ở giữa cho thấy. (Giá trị p trong thử nghiệm tính chuẩn của Shapiro-Wilk là 0,60, thu được bằng Rlệnh được shapiro.test(residuals(fit))ban hành sau khi chạy mã bên dưới.)

Dữ liệu thực cũng có thể trông như thế này. Đạo đức là tính không đồng nhất đặc trưng cho mối quan hệ giữa kích thước còn lại và dự đoán trong khi tính quy tắc không cho chúng ta biết gì về phần dư có liên quan đến bất cứ điều gì khác.


Đây là Rmã cho công trình này.

set.seed(17)
n <- 256
x <- (1:n)/n                       # The set of x values
e <- rnorm(n, sd=1)                # A set of *normally distributed* values
i <- order(runif(n, max=dnorm(e))) # Put the larger ones towards the end on average
y <- 1 + 5 * x + e[rev(i)]         # Generate some y values plus "error" `e`.
fit <- lm(y ~ x)                   # Regress `y` against `x`.
par(mfrow=c(1,3))                  # Set up the plots ...
plot(x,y, main="Data", cex=0.8)
abline(coef(fit), col="Red")
hist(residuals(fit), main="Residuals")
plot(predict(fit), residuals(fit), cex=0.8, main="Residuals vs. Predicted")

2
ok vì vậy bạn đang nói rằng nếu tôi liên kết phần dư thấp với giá trị dự đoán cao, tính không đồng nhất có thể phát sinh ngay cả khi phần dư được phân phối bình thường? Tôi nghĩ rằng tôi đã có nó, mặc dù tôi thực sự nên nghĩ nhiều hơn về nó .. dù sao cũng cảm ơn bạn!
Kiến

... hoặc phần dư thấp với giá trị dự đoán thấp (như trong ví dụ ở đây) hoặc thậm chí theo những cách phức tạp hơn. Chẳng hạn, độ không đồng nhất tồn tại khi cường độ trung bình của phần dư dao động với giá trị dự đoán. (Hầu hết các thử nghiệm chính thức về tính không đồng nhất sẽ không phát hiện ra điều này, nhưng các sơ đồ chẩn đoán thông thường sẽ hiển thị rõ ràng.)
whuber

0

Trong hồi quy bình phương tối thiểu (WLS) có trọng số, đó là các yếu tố ngẫu nhiên của phần dư ước tính mà bạn có thể muốn thấy được phân phối bình thường, mặc dù điều đó thường không quan trọng lắm. Phần dư ước tính có thể được xác định, như được hiển thị trong trường hợp hồi quy đơn giản (một biến hồi quy và thông qua gốc), ở cuối trang 1 và nửa dưới của trang 2 và 7 trong https://www.researchgate.net/publication / 263036348_ProperIES_of_ Weighted_Least_Squares_Regression_for_Cutoff_Sampling_in_Est traiment_Surveys Dù sao, điều này có thể giúp hiển thị nơi mà sự bình thường có thể đi vào hình ảnh.


Chào mừng đến với trang web, @JimKnaub. Chúng tôi muốn có bạn ở bên để cho mượn chuyên môn của bạn cho câu hỏi không thường xuyên. Tại sao không đăng ký tài khoản của bạn? Bạn có thể tìm hiểu làm thế nào trong phần Tài khoản của tôi trong trung tâm trợ giúp của chúng tôi . Vì bạn là người mới ở đây, bạn có thể muốn tham quan chúng tôi , nơi có thông tin cho người dùng mới.
gung - Phục hồi Monica

3
Chúng tôi đang cố gắng xây dựng một kho lưu trữ thông tin thống kê chất lượng cao vĩnh viễn dưới dạng câu hỏi và câu trả lời. Vì vậy, chúng tôi cảnh giác với các câu trả lời phụ thuộc vào các liên kết, do linkrot. Bạn có thể đăng một trích dẫn đầy đủ & tóm tắt thông tin (ví dụ: số liệu / giải thích) từ liên kết để thông tin sẽ hữu ích ngay cả khi liên kết bị chết?
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.