Câu trả lời:
Hậu quả của sự không đồng nhất là:
Công cụ ước tính bình phương nhỏ nhất (OLS) bình thường vẫn nhất quán nhưng không còn hiệu quả .
Ước tính trong đó là không một ước lượng phù hợp nữa cho ma trận hiệp phương sai của ước lượng của bạn . Nó có thể là cả thiên vị và không nhất quán. Và trong thực tế, nó có thể đánh giá thấp phương sai. σ 2=1 b
Điểm (1) có thể không phải là vấn đề chính; mọi người thường sử dụng công cụ ước tính OLS bình thường. Nhưng điểm (2) phải được giải quyết. Phải làm sao
Bạn cần các lỗi tiêu chuẩn phù hợp không đồng nhất . Cách tiếp cận tiêu chuẩn là dựa vào các giả định mẫu lớn, kết quả tiệm cận và ước tính phương sai của bằng cách sử dụng:
SS=1
Điều này mang lại cho các lỗi tiêu chuẩn phù hợp không đồng nhất. Chúng còn được gọi là lỗi tiêu chuẩn Huber-White, lỗi tiêu chuẩn mạnh, công cụ ước tính "sandwich", v.v ... Bất kỳ gói thống kê tiêu chuẩn cơ bản nào cũng có tùy chọn cho lỗi tiêu chuẩn mạnh. Sử dụng nó!
Nếu độ không đồng nhất đủ lớn, ước tính OLS thông thường có thể có những vấn đề thực tế lớn. Mặc dù vẫn là một công cụ ước tính nhất quán, bạn có thể có các vấn đề mẫu nhỏ trong đó toàn bộ ước tính của bạn được điều khiển bởi một vài quan sát phương sai cao. (Đây là những gì @ seanv507 đang ám chỉ trong các bình luận). Công cụ ước tính OLS không hiệu quả ở chỗ nó mang lại nhiều trọng lượng hơn cho các quan sát phương sai cao hơn là tối ưu. Ước tính có thể cực kỳ ồn ào.
Một vấn đề với việc cố gắng khắc phục sự kém hiệu quả là bạn có thể không biết ma trận hiệp phương sai cho các thuật ngữ lỗi, do đó sử dụng một cái gì đó như GLS có thể khiến mọi thứ trở nên tồi tệ hơn nếu ước tính của ma trận hiệp phương sai lỗi là rác.
Ngoài ra, các lỗi tiêu chuẩn Huber-White tôi đưa ra ở trên có thể có vấn đề lớn trong các mẫu nhỏ. Có một tài liệu dài về chủ đề này. Ví dụ. xem Imbens và Kolesar (2016), "Lỗi tiêu chuẩn mạnh mẽ trong các mẫu nhỏ: Một số lời khuyên thiết thực."
Nếu đây là tự nghiên cứu, điều thực tế tiếp theo cần xem xét là các lỗi tiêu chuẩn gộp. Những điều này đúng cho tương quan tùy ý trong các cụm.
Vâng, câu trả lời ngắn gọn về cơ bản là mô hình của bạn sai
Vì vậy, trong trường hợp xảy ra sự cố không đồng nhất với việc ước tính ma trận phương sai hiệp phương sai, dẫn đến sai số chuẩn của các hệ số, từ đó dẫn đến sai số thống kê và giá trị p. Nói ngắn gọn, nếu các thuật ngữ lỗi của bạn không có phương sai không đổi thì bình phương tối thiểu thông thường không phải là cách hiệu quả nhất để ước tính. Có một cái nhìn vào câu hỏi liên quan này .
"Độ không đồng nhất" gây khó khăn cho việc ước tính độ lệch chuẩn thực sự của các lỗi dự báo. Điều này có thể dẫn đến khoảng tin cậy quá rộng hoặc quá hẹp (đặc biệt là chúng sẽ quá hẹp đối với các dự đoán ngoài mẫu, nếu phương sai của các lỗi tăng theo thời gian).
Ngoài ra, mô hình hồi quy có thể tập trung quá nhiều vào một tập hợp con dữ liệu.
Tài liệu tham khảo tốt: Kiểm tra các giả định của hồi quy tuyến tính