Tại sao chẩn đoán dựa trên dư?


11

Trong hồi quy tuyến tính đơn giản, người ta thường muốn xác minh nếu các giả định nhất định được đáp ứng để có thể thực hiện suy luận (ví dụ: phần dư được phân phối bình thường).

Có hợp lý để kiểm tra các giả định bằng cách kiểm tra xem các giá trị được trang bị có được phân phối bình thường không?

Câu trả lời:


19

Tại sao chẩn đoán dựa trên dư?

Bởi vì nhiều giả định liên quan đến phân phối có điều kiện của , chứ không phải phân phối vô điều kiện của nó. Điều đó tương đương với một giả định về các lỗi mà chúng tôi ước tính bằng số dư.Y

Trong hồi quy tuyến tính đơn giản, người ta thường muốn xác minh nếu các giả định nhất định được đáp ứng để có thể thực hiện suy luận (ví dụ: phần dư được phân phối bình thường).

Giả định quy tắc thực tế không phải là về phần dư mà là về thuật ngữ lỗi. Thứ gần nhất với những thứ bạn có là phần dư, đó là lý do tại sao chúng tôi kiểm tra chúng.

Có hợp lý không khi kiểm tra các giả định bằng cách kiểm tra xem các giá trị được trang bị có được phân phối bình thường không?

x

Ví dụ, tôi vừa chạy hồi quy dữ liệu mô phỏng, trong đó tất cả các giả định đã được chỉ định chính xác. Ví dụ, tính quy phạm của các lỗi đã được thỏa mãn. Đây là những gì xảy ra khi chúng tôi cố gắng kiểm tra tính quy tắc của các giá trị được trang bị:

chẩn đoán bình thường trên trang bị

x

yxxy

chẩn đoán chuẩn trên giá trị y thô

y

Yyyx


Các giả định là gì, làm thế nào để chúng ta kiểm tra chúng và khi nào chúng ta cần thực hiện chúng?

  • x

  • E(Y)xx

  • Var(Y|x)xxx

  • Độc lập có điều kiện / độc lập của lỗi. Các hình thức phụ thuộc cụ thể có thể được kiểm tra (ví dụ, tương quan nối tiếp). Nếu bạn không thể lường trước được hình thức phụ thuộc, sẽ hơi khó kiểm tra.

  • Y

(Thực tế có một số giả định khác mà tôi chưa đề cập, chẳng hạn như lỗi phụ gia, rằng các lỗi này có ý nghĩa bằng không, v.v.)

Nếu bạn chỉ quan tâm đến việc ước tính mức độ phù hợp của đường bình phương nhỏ nhất và không nói các lỗi tiêu chuẩn, bạn không cần phải thực hiện hầu hết các giả định này. Ví dụ, phân phối lỗi ảnh hưởng đến suy luận (kiểm tra và khoảng) và nó có thể ảnh hưởng đến hiệu quả của ước tính, nhưng dòng LS vẫn là không thiên vị tuyến tính tốt nhất chẳng hạn; vì vậy trừ khi phân phối quá tệ đến mức không bình thường đến mức tất cả các công cụ ước tính tuyến tính đều xấu, thì đó không hẳn là vấn đề nếu các giả định về thuật ngữ lỗi không giữ được.


Tôi đã thêm một số sơ đồ vào câu trả lời của tôi.
Glen_b -Reinstate Monica

2
Đây là một câu trả lời tuyệt vời. Nếu bạn muốn nhiều hơn, tôi bao gồm một phần lãnh thổ tương tự ở đây: Điều gì xảy ra nếu phần dư được phân phối bình thường nhưng Y thì không?
gung - Phục hồi Monica

@gung Tôi tự đá mình vì không liên kết với nó trước.
Glen_b -Reinstate Monica

1
@Glen: Bố trí rất tốt. Tôi đã có cùng một sự nhầm lẫn trong một thời gian dài nhờ vào sự đối xử không tốt của chủ đề trong sách giáo khoa và gần như rất nhiều tài nguyên trên internet. Mặt khác, phân phối vô điều kiện của Y hầu như luôn được kiểm tra để suy ra một mô hình cho phân phối có điều kiện, đặc biệt là trong bối cảnh chuỗi thời gian. Có một lý do lý thuyết đằng sau nó? Tôi đã cố gắng hỏi nó như một câu hỏi nhưng tôi nghĩ không thể diễn đạt đúng: stats.stackexchange.com/questions/74886/ợi
Cagdas Ozgenc

@CagdasOzgenc Lý do duy nhất tôi có thể nghĩ ra để làm điều đó là bởi vì nó dễ thực hiện trước khi bạn có một mô hình. Câu trả lời bạn có tại câu hỏi được liên kết đó trông giống như một câu trả lời tốt cho tôi khi nó được đăng.
Glen_b -Reinstate Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.