Tôi có hai mẫu bị sai lệch nhiều và đang cố gắng sử dụng bootstrapping để so sánh phương tiện của chúng bằng cách sử dụng thống kê t.
Các thủ tục chính xác để làm điều đó là gì?
Quá trình tôi đang sử dụng
Tôi lo ngại về sự phù hợp của việc sử dụng lỗi tiêu chuẩn của dữ liệu gốc / quan sát trong bước cuối cùng khi tôi biết rằng điều này thường không được phân phối.
Đây là các bước của tôi:
- Bootstrap - mẫu ngẫu nhiên có thay thế (N = 1000)
Nhận khoảng tin cậy thông qua:
- Nhìn vào nơi khoảng tin cậy giảm để xác định xem có sự khác biệt đáng kể về phương tiện không (tức là khác không)
Tôi cũng đã xem xét tổng xếp hạng Wilcoxon nhưng nó không cho kết quả rất hợp lý do phân phối sai lệch rất nhiều (ví dụ: phân vị thứ 75 == 95). Vì lý do này, tôi muốn khám phá thêm bài kiểm tra bootstrapping.
Vì vậy, câu hỏi của tôi là:
- Đây có phải là một phương pháp thích hợp?
- Có phù hợp để sử dụng SE của dữ liệu được quan sát khi tôi biết nó bị sai lệch nhiều không?
Có thể trùng lặp: Phương pháp nào được ưa thích, thử nghiệm bootstrapping hoặc thử nghiệm dựa trên xếp hạng không theo tỷ lệ?