Có nên luôn luôn mong đợi xu hướng trung tâm (nghĩa là trung bình và / hoặc trung vị) của một mẫu bootstrapping tương tự như giá trị quan sát được?
Trong trường hợp cụ thể này, tôi có các phản hồi được phân phối theo cấp số nhân cho các đối tượng trong hai điều kiện (Tôi không chạy thử nghiệm, tôi chỉ có dữ liệu). Tôi đã được giao nhiệm vụ khởi động kích thước kích thước hiệu ứng (theo Cohen's d, công thức một mẫu, tức là trong đó ước tính mẫu về độ lệch chuẩn dân số. được cung cấp trong Rosenthal & Rosnow (2008) trên trang 398, phương trình 13,27. Họ sử dụng trong mẫu số vì nó đúng về mặt lịch sử, tuy nhiên thực tiễn tiêu chuẩn đã xác định sai d là sử dụng , và vì vậy tôi đã theo dõi lỗi đó trong tính toán trên . σs
Tôi đã chọn ngẫu nhiên cả hai bên tham gia (nghĩa là người tham gia RT có thể được lấy mẫu nhiều lần) và qua các đối tượng (người tham gia có thể được lấy mẫu nhiều lần) sao cho ngay cả khi người tham gia 1 được lấy mẫu hai lần, thì RT của họ trong cả hai mẫu đều không có khả năng chính xác bằng nhau Đối với mỗi tập dữ liệu ngẫu nhiên / được lấy mẫu lại, tôi tính lại d. Trong trường hợp này . Những gì tôi đang quan sát là một xu hướng cho giá trị quan sát được của Cohen thường gần với tỷ lệ phần trăm 97,5 hơn so với tỷ lệ phần trăm của các giá trị quan sát được mô phỏng. Nó cũng có xu hướng gần với 0 hơn trung vị của bootstrap (bằng 5% đến 10% mật độ của phân phối mô phỏng).
Điều gì có thể giải thích cho điều này (ghi nhớ mức độ ảnh hưởng mà tôi đang quan sát)? Có phải do nó 'dễ dàng hơn' khi lấy mẫu lại để có được nhiều phương sai cực đoan hơn so với những gì được quan sát liên quan đến sự cực đoan của phương tiện khi lấy mẫu lại? Đây có thể là một sự phản ánh của dữ liệu đã được mát xa quá mức / cắt có chọn lọc? Là cách tiếp cận lấy mẫu này giống như một bootstrap? Nếu không, phải làm gì khác để đưa ra một CI?