Giả sử tôi có hai điều kiện và kích thước mẫu của tôi cho hai điều kiện là cực kỳ thấp. Giả sử tôi chỉ có 14 quan sát trong điều kiện đầu tiên và 11 quan sát khác. Tôi muốn sử dụng thử nghiệm t để kiểm tra xem sự khác biệt trung bình có khác biệt đáng kể với nhau không.
Đầu tiên, tôi hơi bối rối về giả định tính chuẩn của bài kiểm tra t, đó có thể là lý do tại sao tôi không hoàn toàn nhận được bootstrapping. Là giả định cho phép thử t rằng (A) dữ liệu được lấy mẫu từ một quần thể bình thường, hoặc (B) rằng các bản phân phối mẫu của bạn có các thuộc tính Gaussian? Nếu nó là (B) thì đó không thực sự là một giả định, phải không? Bạn chỉ có thể vẽ biểu đồ dữ liệu của bạn và xem nó có bình thường hay không. Nếu kích thước mẫu của tôi thấp, tôi sẽ không có đủ điểm dữ liệu để xem liệu phân phối mẫu của tôi có bình thường hay không.
Đây là nơi tôi nghĩ bootstrapping xuất hiện. Tôi có thể bootstrap để xem mẫu của tôi có bình thường không? Tại lần đầu tiên tôi nghĩ bootstrapping rằng sẽ luôn dẫn đến một bản phân phối bình thường, nhưng đây không phải là trường hợp ( Cần Bootstrap Định cỡ ảnh được sử dụng để tính toán một khoảng tin cậy cho phương sai của Tập dữ liệu? Statexchange statexchange ). Vì vậy, một lý do bạn sẽ bootstrap là để chắc chắn hơn về tính quy phạm của dữ liệu mẫu của bạn, đúng không?
Tại thời điểm này tôi hoàn toàn bối rối. Nếu tôi thực hiện kiểm tra t trong R với hàm t.test và tôi đặt các vectơ mẫu đã khởi động thành hai mẫu độc lập, giá trị t của tôi đơn giản trở nên cực kỳ quan trọng. Tôi không làm bài kiểm tra bootstrapping phải không? Tôi không phải, bởi vì tất cả các bootstrapping đang làm chỉ là làm cho giá trị t của tôi lớn hơn, điều này sẽ không xảy ra trong mọi trường hợp chứ? Có phải mọi người không thực hiện kiểm tra t trên các mẫu bootstrapping?
Cuối cùng, lợi ích của khoảng tin cậy điện toán trên bootstrap so với khoảng tin cậy điện toán trên mẫu ban đầu của chúng tôi là gì? Những khoảng tin cậy này cho tôi biết rằng khoảng tin cậy trên dữ liệu mẫu ban đầu là gì?
Tôi đoán rằng tôi đã nhầm lẫn về (A) tại sao nên sử dụng bootstrap nếu nó sẽ làm cho giá trị t của tôi trở nên quan trọng hơn, (B) không chắc chắn về cách sử dụng bootstrapping chính xác khi chạy thử nghiệm t-test mẫu độc lập và (C) không chắc chắn làm thế nào để báo cáo biện minh, thực hiện và kết quả của bootstrapping trong các tình huống kiểm tra t độc lập.