Làm thế nào để xây dựng khoảng tin cậy 95% của chênh lệch giữa các trung vị?


27

Vấn đề của tôi: thử nghiệm ngẫu nhiên nhóm song song có phân phối rất sai lệch về kết quả chính. Tôi không muốn sử dụng tính quy tắc và sử dụng 95% TCTD dựa trên bình thường (nghĩa là sử dụng 1,96 X SE).

Tôi cảm thấy thoải mái khi thể hiện thước đo của xu hướng trung tâm là trung vị, nhưng câu hỏi của tôi là làm thế nào để xây dựng 95% CI về sự khác biệt về trung vị giữa hai nhóm.

Điều đầu tiên bạn nghĩ đến là bootstrapping (lấy mẫu lại với sự thay thế, xác định trung vị trong mỗi hai nhóm và trừ đi từng nhóm, lặp lại 1000 lần và sử dụng CI 95% được điều chỉnh theo Bias). Đây có phải là cách tiếp cận chính xác? Bất cứ một đề nghị nào khác?


3
Đó là điều đầu tiên tôi nghĩ đến. Làm thế nào lớn một mẫu bạn có?
jbowman

40 người trong mỗi hai nhóm = 80 tổng số.
pmgjones

3
Bạn có thể xem xét khoảng tin cậy và ước lượng không đối xứng cho sự khác biệt của các tham số vị trí dựa trên công cụ ước tính Hodges - Lehmann . Như đã giải thích trong trang trợ giúp dành cho R wilcox.test()(dưới Details), điều này có liên quan chặt chẽ đến sự khác biệt về trung vị, nhưng không hoàn toàn giống nhau.
caracal

2
Liên quan đến việc bootstrapping trung vị, có thể đáng để đọc về bootstrap được làm mịn.
caracal

@caracal: Đây là một điểm tốt. Cả bootstrap thông thường hoặc được làm mịn đều có độ bao phủ tiệm cận chính xác, nhưng xác suất bao phủ của bootstrap được làm mịn hội tụ với tốc độ nhanh hơn một chút. Nếu tôi nhớ chính xác, cho bootstrap thông thường và cho bootstrap được làm mịn. Có một cuộc thảo luận ngắn gọn về điều này với các tài liệu tham khảo thêm trong Hồi quy lượng tử của Koenker (2005). |P(mI^n)0.95|=O(n1/3)O(n2/5)
paul

Câu trả lời:


10

Thủ tục bootstrap mà bạn mô tả phải hợp lệ. Tuy nhiên, điều quan trọng cần ghi nhớ là, giống như 95% CI dựa trên bình thường, khoảng tin cậy của bootstrap chỉ được đảm bảo có phạm vi bảo hiểm chính xác theo triệu chứng. Một điều tuyệt vời khi làm việc với trung bình hoặc các lượng tử khác là bạn có thể xây dựng các khoảng tin cậy mẫu hữu hạn chính xác theo các giả định rất yếu. Ý tưởng cơ bản là dưới giá trị trung bình của là , chỉ số cho là biến ngẫu nhiên 0,5 Bernoulli. Bạn có thể sử dụng quan sát này để tạo một thống kê kiểm tra với phân phối mẫu hữu hạn đã biết. Xem Chernozhukov, Hansen, Jansson (2009) để biết thêm chi tiết.ymy<m


1
Bạn có thể vui lòng giải thích những gì bạn có nghĩa là nó chỉ có giá trị không có triệu chứng? Tôi đặc biệt không chắc chắn những gì không có ý nghĩa trong bối cảnh này. Cảm ơn!
pmgjones

@pmgjones: Khoảng tin cậy 95%, , đối với một số tham số sao cho cho tất cả các có thể (hoặc thực sự là tất cả các quy trình tạo dữ liệu có thể) . Tôi đã viết để nhấn mạnh rằng khoảng đó là một số chức năng của mẫu của bạn. Đối với khoảng tin cậy của bootstrap hoặc dựa trên bình thường, không đúng khi (ngoại trừ các quy trình tạo dữ liệu rất đặc biệt). Tuy nhiên, bạn có thể chỉ ra rằng . Đây là những gì tôi muốn nói khi bootstrap chỉ có giá trị bất hợp pháp. I^nmP(mI^n)=0.95mI^nP(mI^n)=0.95limnP(mI^n)=0.95
paul

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.