Là lỗi tiêu chuẩn bootstrapping và khoảng tin cậy thích hợp trong hồi quy khi giả định homoscedasticity bị vi phạm?


13

Nếu trong hồi quy OLS tiêu chuẩn, hai giả định bị vi phạm (phân phối sai số bình thường, đồng nhất hóa), thì có phải bootstrapping lỗi tiêu chuẩn và khoảng tin cậy là một phương án thích hợp để đạt được kết quả có ý nghĩa đối với tầm quan trọng của hệ số hồi quy không?

Các thử nghiệm quan trọng với các lỗi tiêu chuẩn khởi động và khoảng tin cậy vẫn "hoạt động" với độ không đồng nhất?

Nếu có, khoảng tin cậy áp dụng nào có thể được sử dụng trong kịch bản này (phần trăm, BC, BCA)?

Cuối cùng, nếu bootstrapping phù hợp trong kịch bản này, tài liệu liên quan cần được đọc và trích dẫn để đi đến kết luận này là gì? Bất kỳ gợi ý sẽ được đánh giá rất cao!


1
Nếu có vi phạm như vậy, tôi không nghĩ bootstrapping chữa được. Thay vào đó, tại sao không thử chuyển đổi (ghi nhật ký) dữ liệu để tiến gần hơn đến tính quy tắc và sử dụng một lỗi tiêu chuẩn mạnh mẽ như từ gói bánh sandwich trong R?
B_Miner

Bootstrap hoạt động tốt nếu bạn điều chỉnh sơ đồ lấy mẫu lại theo tình huống mà bạn gặp phải.
Glen_b -Reinstate Monica

Câu trả lời:


20

Có ít nhất ba cách tiếp cận (có thể nhiều hơn) để thực hiện bootstrap cho hồi quy tuyến tính với dữ liệu độc lập, nhưng không được phân phối giống hệt nhau. (Nếu bạn có các vi phạm khác về các giả định "tiêu chuẩn", ví dụ: do tự động tương quan với dữ liệu chuỗi thời gian hoặc phân cụm do thiết kế lấy mẫu, mọi thứ thậm chí còn phức tạp hơn).

  1. (yj*,xj*){(yTôi,xTôi)}
  2. eTôi= =yTôi-xTôi'β^xj*ej*
  3. Bạn có thể thực hiện bootstrap hoang dã trong đó bạn lấy mẫu lại dấu của phần dư, điều khiển cho giây thứ hai có điều kiện (và, với một số điều chỉnh bổ sung, cho khoảnh khắc thứ ba cũng có điều kiện). Đây sẽ là thủ tục tôi muốn giới thiệu (với điều kiện bạn có thể hiểu và bảo vệ nó cho người khác khi được hỏi, "Bạn đã làm gì để kiểm soát sự không đồng nhất? Làm sao bạn biết rằng nó hoạt động?").

Tài liệu tham khảo cuối cùng là Wu (1986) , nhưng Biên niên sử không chính xác là cuốn sách ảnh đang đọc.

CẬP NHẬT dựa trên các câu hỏi tiếp theo của OP được hỏi trong các bình luận:

Số lượng bản sao có vẻ lớn đối với tôi; cuộc thảo luận tốt duy nhất về tham số bootstrap này mà tôi biết là trong cuốn sách Giới thiệu về Bootstrap của Efron & Tibshirani .

M) về so sánh giữa sửa chữa bootstrap và heteroskedasticity.


Cảm ơn sự giúp đỡ của bạn! Xin cho phép tôi một câu hỏi tiếp theo: Các giả định duy nhất mà tôi vi phạm là phân phối lỗi bình thường và các giả định đồng nhất. Ngoài ra, tôi chỉ quan tâm xem liệu hệ số hồi quy của tôi có phải là sig hay không. theo hướng mong đợi hoặc không. Độ lớn của hiệu ứng không quan trọng. Tôi nghĩ rằng những gì tôi đã làm cho đến nay là tùy chọn của bạn 1. Tôi đã khởi động các lỗi tiêu chuẩn và được tạo ra trong các khoảng tin cậy được khởi động thêm. Tôi đã làm điều đó bằng cách sử dụng Stata: vce (bootstrap, reps (2500) bca), estat bootstrap. Điều đó có chữa được vi phạm giả định của tôi không?
David

Tôi không chẩn đoán dữ liệu chỉ dựa trên cú pháp của bạn và sẽ không có ai. Kích thước của tập dữ liệu của bạn là gì? reps(2500)có lẽ là quá mức cần thiết, ít nhất là đối với các lỗi tiêu chuẩn; Tôi nghĩ reps(500)là OK cho hầu hết các mục đích thực tế. Cuốn sách giới thiệu giới thiệu của Efron & Tibshirani có một phần về số lượng bản sao. Họ cũng có cả một chương về hồi quy, vì vậy đó có thể là một tài liệu tham khảo tốt khác để bạn xem xét.
StasK

Cảm ơn câu trả lời nhanh của bạn. Bộ dữ liệu là ~ 250. Các câu hỏi về số lần sao chép sang một bên (cảm ơn bạn đã liên kết!), Bạn có đồng ý rằng các lỗi tiêu chuẩn đã được khởi động (bằng cách lấy lại toàn bộ các quan sát) và / hoặc khoảng tin cậy của bootstraoped (ví dụ: phần trăm hoặc độ lệch đã được sửa) sẽ được một cách thích hợp để xác định tầm quan trọng (hoặc thiếu) của hệ số hồi quy do vi phạm tính đồng nhất và phân phối bình thường của giả định lỗi? Cảm ơn rất nhiều cho đầu vào của bạn!
David

Vâng, tôi sẽ nói rằng tốt hơn. Nếu bạn sử dụng Stata mặc dù bạn có thể nhận được câu trả lời rất giống nhau bằng cách sử dụng robusttùy chọn hồi quy của mình. est storecả kết quả và est tab, sehọ để so sánh cạnh nhau.
StasK

Cảm ơn bạn StasK. Tôi cũng đã thấy nhận xét sau đây mà bạn đã thực hiện ở một nơi khác trên trang web này: "Bootstrap đơn giản với việc lấy lại mẫu ⇔ Công cụ ước tính mạnh mẽ không đồng nhất của White". Trong bối cảnh câu hỏi của tôi như đã nêu ở trên: Có những bài báo được xuất bản làm cho điểm này?
David
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.