Tôi đã tự hỏi làm thế nào các CIs bootstrap (và BCa trong barticular) thực hiện trên dữ liệu phân phối bình thường. Dường như có rất nhiều công việc kiểm tra hiệu suất của chúng trên các loại phân phối khác nhau, nhưng không thể tìm thấy bất cứ điều gì trên dữ liệu phân phối thông thường. Vì có vẻ như là một điều rõ ràng để nghiên cứu đầu tiên, tôi cho rằng các bài báo đã quá cũ.
Tôi đã thực hiện một số mô phỏng Monte Carlo bằng gói khởi động R và thấy các TCTD bootstrap phù hợp với các TCTD chính xác, mặc dù đối với các mẫu nhỏ (N <20), chúng có xu hướng tự do hơn một chút (các TCTD nhỏ hơn). Đối với các mẫu đủ lớn, về cơ bản chúng giống nhau.
Điều này khiến tôi tự hỏi liệu có lý do chính đáng nào để không luôn luôn sử dụng bootstrapping. Với những khó khăn trong việc đánh giá xem một phân phối có bình thường hay không, và nhiều cạm bẫy đằng sau điều này, có vẻ hợp lý khi không quyết định và báo cáo các CIs bootstrap bất kể phân phối. Tôi hiểu động cơ của việc không sử dụng các thử nghiệm phi tham số một cách có hệ thống, vì chúng có ít năng lượng hơn, nhưng các mô phỏng của tôi cho tôi biết đây không phải là trường hợp của các TCTD bootstrap. Chúng thậm chí còn nhỏ hơn.
Một câu hỏi tương tự khiến tôi băn khoăn là tại sao không phải lúc nào cũng sử dụng trung vị làm thước đo của xu hướng trung tâm. Mọi người thường khuyên nên sử dụng nó để mô tả dữ liệu không được phân phối thông thường, nhưng vì trung vị giống như giá trị trung bình của dữ liệu được phân phối thông thường, tại sao lại tạo ra sự khác biệt? Nó có vẻ khá có lợi nếu chúng ta có thể thoát khỏi các thủ tục để quyết định xem một phân phối có bình thường hay không.
Tôi rất tò mò về suy nghĩ của bạn về những vấn đề này, và liệu chúng đã được thảo luận trước đây chưa. Tài liệu tham khảo sẽ được đánh giá cao.
Cảm ơn!
Pierre