Tại sao sức mạnh của một giả thuyết kiểm tra là một mối quan tâm khi chúng ta có thể bootstrap bất kỳ mẫu đại diện nào để làm cho n tiếp cận vô cùng?


7

Tại sao chúng ta quan tâm đến sức mạnh của một bài kiểm tra giả thuyết nếu chúng ta không còn sống trong thời đại mà máy tính hoạt động chậm và quá tốn kém để bootstrap / làm một bài kiểm tra hoán vị trên bất cứ thứ gì cũng không tham số?

Là phân tích sức mạnh không liên quan nếu tôi có thể kiểm tra giả thuyết bootstrap / hoán vị?

Chúng ta có thể làm cho vô cùng "cỡ mẫu" với bootstrapping để sức mạnh tăng lên do kết quả của bootstrapping?

Câu trả lời:


22

Lượng thông tin liên quan đến các giả thuyết mà bạn có chỉ đơn giản là thông tin trong dữ liệu gốc.

Lấy mẫu lại thông tin đó, cho dù bootstrapping, kiểm tra hoán vị hoặc bất kỳ việc lấy mẫu nào khác, không thể thêm thông tin đã có ở đó.

Điểm của bootstrapping là ước tính phân phối lấy mẫu của một số lượng, về bản chất bằng cách sử dụng cdf mẫu như một xấp xỉ của cdf dân số mà từ đó nó được rút ra.

Như thường được hiểu, mỗi mẫu bootstrap có cùng kích thước với mẫu ban đầu (vì lấy mẫu lớn hơn sẽ không cho bạn biết về độ biến thiên của mẫu ở cỡ mẫu bạn có). Những gì khác nhau là số lượng các mẫu bootstrap như vậy.

Việc tăng số lượng mẫu bootstrap mang lại cảm giác "chính xác" hơn về sự gần đúng đó, nhưng nó không thêm bất kỳ thông tin nào chưa có ở đó.

Với thử nghiệm bootstrap, bạn có thể giảm lỗi mô phỏng trong tính toán giá trị p, nhưng bạn không thể thay đổi giá trị p cơ bản mà bạn đang tính gần đúng (chỉ là một hàm của mẫu); ước tính của bạn về nó chỉ là ít ồn ào.

Ví dụ: giả sử tôi thực hiện kiểm tra thử nghiệm một mẫu đã khởi động (với phương án thay thế một phía) và xem xét điều gì xảy ra khi chúng tôi tăng số lượng mẫu bootstrap:

biểu đồ phân phối bootstrap của t-statstic, với 1000 và 10000 mẫu bootstrap

Đường màu xanh rất gần với 2 cho thấy thống kê t cho mẫu của chúng tôi, mà chúng tôi thấy là cao bất thường (giá trị p ước tính là tương tự trong cả hai trường hợp, nhưng sai số chuẩn ước tính của giá trị p đó lớn hơn khoảng 30% cho cái thứ hai)

Một bức tranh tương tự về mặt chất lượng - nhiễu hơn so với các phiên bản ít nhiễu hơn của các hình dạng phân phối cơ bản giống hệt nhau - sẽ dẫn đến việc lấy mẫu phân phối hoán vị của một số thống kê.

Chúng tôi thấy rằng thông tin đã không thay đổi; hình dạng cơ bản của phân phối bootstrap của thống kê là như nhau, chỉ là chúng ta có một ý tưởng ít ồn ào hơn về nó (và do đó ước tính giá trị p ít ồn hơn một chút).

-

Để thực hiện phân tích công suất với kiểm tra bootstrap hoặc hoán vị là một mẹo nhỏ vì bạn phải chỉ định những điều bạn không cần phải giả định trong thử nghiệm, chẳng hạn như hình dạng phân phối cụ thể của dân số. Bạn có thể đánh giá sức mạnh theo một số giả định phân phối cụ thể. Có lẽ bạn không có ý tưởng đặc biệt tốt về phân phối đó là gì, hoặc bạn đã có thể sử dụng thông tin đó để giúp xây dựng bài kiểm tra (ví dụ: bằng cách bắt đầu với thứ gì đó có sức mạnh tốt để phân phối phản ánh những gì bạn hiểu về nó, sau đó có lẽ củng cố nó phần nào). Tất nhiên bạn có thể điều tra một loạt các phân phối ứng cử viên có thể và một loạt các lựa chọn thay thế, tùy thuộc vào hoàn cảnh.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.