Là hồi quy với lỗi sinh viên-t vô dụng?


10

Xin vui lòng xem chỉnh sửa.

Khi bạn có dữ liệu với đuôi nặng, thực hiện hồi quy với các lỗi của sinh viên có vẻ như là một điều trực quan để làm. Trong khi khám phá khả năng này, tôi đã xem bài báo này:

Breusch, TS, Robertson, JC, & Wales, AH (ngày 01 tháng 11 năm 1997). Trang phục mới của hoàng đế: một bài phê bình về mô hình hồi quy đa biến. Statistica Neerlandica, 51, 3.) ( liên kết , pdf )

Điều này lập luận rằng tham số tỷ lệ và mức độ của tham số tự do không thể xác định được đối với nhau theo một nghĩa nào đó và do điều này thực hiện hồi quy với các lỗi t không làm gì vượt quá hồi quy tuyến tính tiêu chuẩn.

Zellner (1976) đã đề xuất một mô hình hồi quy trong đó vectơ dữ liệu (hoặc vectơ lỗi) được biểu diễn dưới dạng nhận thức từ phân phối t Student đa biến. Mô hình này đã thu hút sự chú ý đáng kể vì dường như mở rộng giả định Gaussian thông thường để cho phép phân phối lỗi nặng hơn. Một số kết quả trong tài liệu chỉ ra rằng các quy trình suy luận tiêu chuẩn cho mô hình Gaussian vẫn phù hợp theo giả định phân phối rộng hơn, dẫn đến tuyên bố về tính mạnh mẽ của các phương pháp tiêu chuẩn. Chúng tôi chỉ ra rằng, mặc dù về mặt toán học, hai mô hình là khác nhau, vì mục đích suy luận thống kê, chúng không thể phân biệt được. Ý nghĩa thực nghiệm của mô hình t đa biến hoàn toàn giống với mô hình Gaussian. Do đó, đề xuất về đại diện phân phối dữ liệu rộng hơn là giả mạo và các tuyên bố về tính mạnh mẽ là sai lệch. Những kết luận này được đưa ra từ cả hai quan điểm thường xuyên và Bayes.

Điều này làm tôi ngạc nhiên.

Tôi không có sự tinh tế toán học để đánh giá tốt các đối số của họ, vì vậy tôi có một vài câu hỏi: Có đúng là việc thực hiện hồi quy với các lỗi t thường không hữu ích? Nếu chúng đôi khi hữu ích, tôi đã hiểu nhầm giấy hay nó gây hiểu nhầm? Nếu chúng không hữu ích, đây có phải là một thực tế nổi tiếng? Có cách nào khác để tính toán dữ liệu với đuôi nặng không?

Chỉnh sửa : Khi đọc kỹ hơn, đoạn 3 và phần 4, có vẻ như bài báo dưới đây không nói về những gì tôi đã nghĩ về hồi quy của sinh viên (lỗi là sự phân tán độc lập). Thay vào đó, các lỗi được rút ra từ một phân phối duy nhất và không độc lập. Nếu tôi hiểu chính xác, sự thiếu độc lập này chính xác là lý do giải thích tại sao bạn không thể ước tính quy mô và mức độ tự do một cách độc lập.

Tôi đoán bài báo này cung cấp một danh sách các giấy tờ để tránh đọc.


bạn có chắc chắn rằng bạn được phép phân phối giấy qua dropbox. kiểm tra tốt hơn
Toby El Tejedor

Tôi nghĩ rằng phân phối laplace cung cấp cho bạn cơ hội để điều trị đuôi nặng ở một mức độ nào đó.
Toby El Tejedor

Câu trả lời:


5

Chỉnh sửa của bạn là chính xác. Các kết quả được trình bày trong bài viết chỉ áp dụng cho các lỗi đa biến. Nếu bạn đang sử dụng lỗi t độc lập, thì bạn an toàn.

Tôi không nghĩ rằng bài báo là nổi tiếng, nhưng tôi nghĩ nó là chính xác.

Tài liệu thống kê có đầy đủ các "khái quát hóa", trong nhiều trường hợp là tái tham số hóa, biến đổi một thành một hoặc đôi khi vô dụng vì chúng không đóng góp đáng kể trong việc khái quát một số tính chất của mô hình được đề cập.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.