Khi nào / tại sao xu hướng trung tâm của một mô phỏng lấy mẫu lại khác biệt rõ rệt với giá trị quan sát được?


8

Có nên luôn luôn mong đợi xu hướng trung tâm (nghĩa là trung bình và / hoặc trung vị) của một mẫu bootstrapping tương tự như giá trị quan sát được?

Trong trường hợp cụ thể này, tôi có các phản hồi được phân phối theo cấp số nhân cho các đối tượng trong hai điều kiện (Tôi không chạy thử nghiệm, tôi chỉ có dữ liệu). Tôi đã được giao nhiệm vụ khởi động kích thước kích thước hiệu ứng (theo Cohen's d, công thức một mẫu, tức là trong đó ước tính mẫu về độ lệch chuẩn dân số. được cung cấp trong Rosenthal & Rosnow (2008) trên trang 398, phương trình 13,27. Họ sử dụng trong mẫu số vì nó đúng về mặt lịch sử, tuy nhiên thực tiễn tiêu chuẩn đã xác định sai d là sử dụng , và vì vậy tôi đã theo dõi lỗi đó trong tính toán trên . σsMD¯sDσs

Tôi đã chọn ngẫu nhiên cả hai bên tham gia (nghĩa là người tham gia RT có thể được lấy mẫu nhiều lần) và qua các đối tượng (người tham gia có thể được lấy mẫu nhiều lần) sao cho ngay cả khi người tham gia 1 được lấy mẫu hai lần, thì RT của họ trong cả hai mẫu đều không có khả năng chính xác bằng nhau Đối với mỗi tập dữ liệu ngẫu nhiên / được lấy mẫu lại, tôi tính lại d. Trong trường hợp này . Những gì tôi đang quan sát là một xu hướng cho giá trị quan sát được của Cohen thường gần với tỷ lệ phần trăm 97,5 hơn so với tỷ lệ phần trăm của các giá trị quan sát được mô phỏng. Nó cũng có xu hướng gần với 0 hơn trung vị của bootstrap (bằng 5% đến 10% mật độ của phân phối mô phỏng).Nsim=10000

Điều gì có thể giải thích cho điều này (ghi nhớ mức độ ảnh hưởng mà tôi đang quan sát)? Có phải do nó 'dễ dàng hơn' khi lấy mẫu lại để có được nhiều phương sai cực đoan hơn so với những gì được quan sát liên quan đến sự cực đoan của phương tiện khi lấy mẫu lại? Đây có thể là một sự phản ánh của dữ liệu đã được mát xa quá mức / cắt có chọn lọc? Là cách tiếp cận lấy mẫu này giống như một bootstrap? Nếu không, phải làm gì khác để đưa ra một CI?

Câu trả lời:


4

Bất kỳ thống kê phi tuyến nào (một tổ hợp phi tuyến tính của thống kê tuyến tính như phương tiện mẫu) có độ lệch mẫu nhỏ. Cohen's rõ ràng không phải là ngoại lệ: về cơ bản nó là khá phi tuyến tính, ít nhất là theo các điều khoản trong mẫu số. Mỗi khoảnh khắc có thể được coi là một công cụ ước tính không thiên vị về những gì nó được ước tính: Tuy nhiên, bởi Jensen ' Bất bình đẳng không có cách nào trên Trái đất bạn có được một công cụ ước tính không thiên vị về số lượng dân số trong một tổ hợp phi tuyến. Như vậyd = m 1 - m 2d m1=1

d=m1m2m3m42
m1=1n1igroup 1yi,m2=1n2igroup 2yi,m3=1n1+n2iyi2,m4=1n1+n2iyi,
E[d] quần thể trong các mẫu hữu hạn, mặc dù độ lệch thường là theo thứ tự . Bài viết trên Wikipedia về kích thước hiệu ứng đề cập đến những thành kiến ​​mẫu nhỏ khi thảo luận về Hedges ' .dO(1/n)g

Tôi tưởng tượng rằng Cohen có phạm vi giới hạn (trong trường hợp cực đoan, nếu không có biến thiên trong các nhóm, thì phải bằng , phải không?), Do đó phân phối mẫu của nó phải bị lệch, điều này góp phần vào sai lệch mẫu hữu hạn (một số chức năng của độ lệch của phân phối lấy mẫu thường là hệ số nhân trước mà tôi đã đề cập ở trên). Bạn càng ở gần các giới hạn của phạm vi cho phép, độ lệch càng rõ rệt.dd±21/n

Bootstrap làm gì, thật kỳ diệu khi xem xét rằng đó là một phương pháp đơn giản như vậy, nó có cho bạn khả năng ước tính độ lệch mẫu hữu hạn này thông qua so sánh trung bình bootstrap và ước tính từ mẫu ban đầu. (Hãy ghi nhớ rằng trừ khi bạn thực hiện các điều chỉnh đặc biệt về cách lấy mẫu bootstrap, cái trước sẽ chịu sự biến đổi của Monte Carlo.) Tôi đã cung cấp các giải thích chi tiết và kỹ thuật hơn trong một câu hỏi bootstrap khác có thể đáng đọc hơn.

Bây giờ nếu có độ lệch dương, nghĩa là ước tính dựa trên mẫu ban đầu bị sai lệch so với dân số , thì bootstrap sẽ chế giễu và đưa ra các ước tính, trung bình, thậm chí cao hơn ước tính mẫu. Nó không thực sự tệ như âm thanh của nó, vì sau đó bạn có thể định lượng độ lệch và trừ nó khỏi ước tính ban đầu. Nếu ước tính ban đầu về số lượng là và bootstrap trung bình của bản sao bootstrap là , thì ước tính sai lệch là và ước tính điều chỉnh sai lệch là .dθ^nθ¯nb^n=θ¯nθ^nθ^nb^n=2θ^nθ¯n


1
Tôi đã nhận thức được rằng Cohen d là một thống kê thiên vị. Tôi đánh giá cao các chi tiết liên quan đến lý do tại sao nó được thiên vị. Tuy nhiên, tôi có một chút hoài nghi rằng nó thiên vị ở mức độ tôi đang quan sát. Bài viết Wikipedia không định nghĩa 'a' trong phương trình được tham chiếu. Ngoài ra, phương trình được tham chiếu và của bạn xuất hiện để tham chiếu hai phiên bản mẫu của Cohen's d. Vì vậy, tôi không chắc chắn mức độ thiên vị mà tôi nên mong đợi trong trường hợp này và liệu câu trả lời của bạn có bao gồm sự khác biệt mà tôi đang thấy hay không.
russellpierce

Tôi cũng không rõ về cách kết hợp hai đoạn cuối của bạn. Bootstrap sẽ cho phép bạn ước tính sai lệch nhưng nó cũng sẽ mang lại kết quả sai lệch hơn so với mẫu ban đầu?
russellpierce

Không có trong các công thức của tôi - là những gì mà bạn đang đề cập đến? Tôi đã cập nhật đoạn cuối để trình bày cách lấy các ước tính bootstrap đã sửa. Tôi không phải là chuyên gia về kích thước hiệu ứng và bạn không cung cấp bất kỳ liên kết nào, vì vậy tôi đã sử dụng thông tin tốt nhất có sẵn cho tôi, đó là Wikipedia. Nếu 1 mẫu Cohen là bất kỳ tương tự, và cũng không tuyến tính, sau đó giải thích của tôi áp dụng chất lượng. aad
StasK

Công thức g của Hedge trong bài viết được liên kết sử dụng . Tôi sẽ cập nhật câu hỏi của mình để bao gồm một tài liệu tham khảo của Cohen. Nó thực sự là phi tuyến tính. Phản hồi của bạn dự đoán sai lệch , nhưng sự khác biệt quan sát được cực kỳ nhiều hơn thế, vì vậy tôi không nghĩ rằng câu trả lời của bạn bao gồm vấn đề tôi đang gặp. Tôi đã cung cấp thêm chi tiết ở trên - có thể là tôi đã không thực hiện đúng quy trình bootstrap. aO(1/n)
russellpierce

1 / n 1 - 10 8 / n a i x J ( a )O(1/n) chỉ là tỷ lệ. Tôi đã thấy một số kết quả khá ngớ ngẩn khi xuất hiện hằng số trước thuật ngữ đó (đừng hiểu sai ý tôi, việc nâng rất nặng này tạo ra các hằng số này, khó khăn hơn so với việc thiết lập tỷ lệ), vì vậy toàn bộ điều này có vẻ như cho xác suất được cho là hội tụ đến 1. trong công thức Wikipedia chỉ là một chỉ số giả, như trong tổng hợp hoặc khi tích hợp; Bất cứ ai đã viết bài báo chỉ dán nó ở đó để cho thấy rằng là một tốc ký cho tỷ lệ của các hàm gamma. 1/n1108/naixJ(a)
StasK
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.