Những nguy hiểm của việc vi phạm giả định homoscedasticity cho hồi quy tuyến tính là gì?


28

Ví dụ, hãy xem xét tập ChickWeightdữ liệu trong R. Phương sai rõ ràng tăng theo thời gian, vì vậy nếu tôi sử dụng hồi quy tuyến tính đơn giản như:

m <- lm(weight ~ Time*Diet, data=ChickWeight)

Những câu hỏi của tôi:

  1. Những khía cạnh của mô hình sẽ được đặt câu hỏi?
  2. Là những vấn đề giới hạn ngoại suy ngoài Timephạm vi?
  3. Làm thế nào khoan dung là hồi quy tuyến tính để vi phạm giả định này (nghĩa là làm thế nào nó không đồng nhất để gây ra vấn đề)?

1
Bên cạnh những điều được đề cập trong các câu trả lời, khoảng dự đoán của bạn cũng sẽ không có phạm vi bảo hiểm phù hợp.
Glen_b -Reinstate Monica

Câu trả lời:


22

Mô hình tuyến tính (hoặc "bình phương tối thiểu thông thường") vẫn có thuộc tính không thiên vị trong trường hợp này.

Khi đối mặt với sự không đồng nhất về các thuật ngữ lỗi, bạn vẫn có các ước tính tham số không thiên vị nhưng bạn mất đi ma trận hiệp phương sai: suy luận của bạn (tức là kiểm tra tham số) có thể bị tắt. Cách khắc phục phổ biến là sử dụng một phương pháp mạnh mẽ để tính toán ma trận hiệp phương sai hay các lỗi tiêu chuẩn. Cái nào bạn sử dụng phụ thuộc vào miền nhưng phương pháp của White là một sự khởi đầu.

Và để hoàn thiện, mối tương quan nối tiếp của các thuật ngữ lỗi là tồi tệ hơn vì nó sẽ dẫn đến các ước tính tham số sai lệch.


Ước tính mạnh mẽ các lỗi tiêu chuẩn (như phương pháp của White) giúp kiểm tra / khoảng tin cậy trên các tham số, nhưng không giúp với các khoảng dự đoán?
kjetil b halvorsen

Hiệp phương sai của vectơ tham số được sử dụng trong tính toán dự đoán để khoảng dự đoán của bạn cũng sẽ bị sai lệch nói chung.
Mustafa S Eisa

Chính xác. Nắm giữ không thiên vị, suy luận có thể được tắt. Hai ký sinh trùng khác là chính xác mặc dù.
Dirk Eddelbuettel

1
Cảm ơn bạn đã nắm bắt được nó, và rõ ràng (thay vì âm thầm, hoặc "lái xe qua", downvote). Tôi chỉ đơn giản là một chút cẩu thả trong việc sử dụng thuật ngữ của tôi. Tốt hơn rồi.
Dirk Eddelbuettel

23

Homoscedasticity là một trong những giả định Gauss Markov được yêu cầu để OLS trở thành công cụ ước lượng không thiên vị tuyến tính tốt nhất (BLUE).

β

Tóm tắt ngắn gọn thông tin từ các trang web ở trên, tính không đồng nhất không đưa ra sai lệch trong ước tính các hệ số của bạn. Tuy nhiên, với độ không đồng nhất, bạn không thể ước tính đúng ma trận phương sai - hiệp phương sai. Do đó, các lỗi tiêu chuẩn của các hệ số là sai. Điều này có nghĩa là người ta không thể tính toán bất kỳ thống kê t và giá trị p nào và do đó không thể kiểm tra giả thuyết. Nhìn chung, OLS không đồng nhất sẽ mất hiệu quả và không còn màu xanh nữa.

Tuy nhiên, sự không đồng nhất không phải là kết thúc của thế giới. May mắn thay, sửa lỗi cho dị thể không khó. Công cụ ước tính sandwich cho phép bạn ước tính các lỗi tiêu chuẩn phù hợp cho các hệ số. Tuy nhiên, tính toán các lỗi tiêu chuẩn thông qua công cụ ước tính sandwich có chi phí. Công cụ ước tính không hiệu quả lắm và sai số chuẩn có thể rất lớn. Một cách để lấy lại một số hiệu quả là phân cụm các lỗi tiêu chuẩn nếu có thể.

Bạn có thể tìm thấy thông tin chi tiết hơn về chủ đề này trên các trang web tôi đã giới thiệu ở trên.


12

Sự vắng mặt của homoscedasticity có thể đưa ra các ước tính lỗi tiêu chuẩn không đáng tin cậy của các tham số. Ước tính tham số là không thiên vị. Nhưng các ước tính có thể không hiệu quả (không phải màu xanh). Bạn có thể tìm thấy một số chi tiết trong liên kết sau


12

đăng nhập(Y)Yβs không chính xác và dẫn đến một tổng số lỗi tuyệt đối không cạnh tranh. Đôi khi thiếu hằng số phương sai báo hiệu một vấn đề mô hình cơ bản hơn.

Yđăng nhập(Y)


1

Có những thông tin tốt ở đây trong các câu trả lời khác, đặc biệt là câu hỏi đầu tiên của bạn. Tôi nghĩ rằng tôi sẽ thêm một số thông tin miễn phí liên quan đến hai câu hỏi cuối cùng của bạn.

  1. Các vấn đề liên quan đến tính không đồng nhất không chỉ giới hạn ở phép ngoại suy. Vì chúng chủ yếu liên quan đến khoảng tin cậy, giá trị p và giới hạn dự đoán là không chính xác, nên chúng áp dụng trong toàn bộ phạm vi dữ liệu của bạn.
  2. 4×
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.