Tại sao chẩn đoán dựa trên dư?
Bởi vì nhiều giả định liên quan đến phân phối có điều kiện của , chứ không phải phân phối vô điều kiện của nó. Điều đó tương đương với một giả định về các lỗi mà chúng tôi ước tính bằng số dư.Y
Trong hồi quy tuyến tính đơn giản, người ta thường muốn xác minh nếu các giả định nhất định được đáp ứng để có thể thực hiện suy luận (ví dụ: phần dư được phân phối bình thường).
Giả định quy tắc thực tế không phải là về phần dư mà là về thuật ngữ lỗi. Thứ gần nhất với những thứ bạn có là phần dư, đó là lý do tại sao chúng tôi kiểm tra chúng.
Có hợp lý không khi kiểm tra các giả định bằng cách kiểm tra xem các giá trị được trang bị có được phân phối bình thường không?
x
Ví dụ, tôi vừa chạy hồi quy dữ liệu mô phỏng, trong đó tất cả các giả định đã được chỉ định chính xác. Ví dụ, tính quy phạm của các lỗi đã được thỏa mãn. Đây là những gì xảy ra khi chúng tôi cố gắng kiểm tra tính quy tắc của các giá trị được trang bị:
x
yxxy
y
Yy−y−x−
Các giả định là gì, làm thế nào để chúng ta kiểm tra chúng và khi nào chúng ta cần thực hiện chúng?
(Thực tế có một số giả định khác mà tôi chưa đề cập, chẳng hạn như lỗi phụ gia, rằng các lỗi này có ý nghĩa bằng không, v.v.)
Nếu bạn chỉ quan tâm đến việc ước tính mức độ phù hợp của đường bình phương nhỏ nhất và không nói các lỗi tiêu chuẩn, bạn không cần phải thực hiện hầu hết các giả định này. Ví dụ, phân phối lỗi ảnh hưởng đến suy luận (kiểm tra và khoảng) và nó có thể ảnh hưởng đến hiệu quả của ước tính, nhưng dòng LS vẫn là không thiên vị tuyến tính tốt nhất chẳng hạn; vì vậy trừ khi phân phối quá tệ đến mức không bình thường đến mức tất cả các công cụ ước tính tuyến tính đều xấu, thì đó không hẳn là vấn đề nếu các giả định về thuật ngữ lỗi không giữ được.