Tôi đang đánh giá hiệu quả của 5 phương pháp khác nhau để dự đoán một kết quả nhị phân cụ thể (gọi chúng là 'Thành công' và 'Thất bại'). Các dữ liệu trông giống như vậy:
Method Sample_Size Success Percent_Success
1 28 4 0.14
2 19 4 0.21
3 24 7 0.29
4 21 13 0.61
5 22 9 0.40
Tôi muốn thực hiện một thử nghiệm trong số 5 phương pháp này để đánh giá tính ưu việt tương đối của các phương pháp. Nói cách khác, tôi muốn sắp xếp các phương thức theo thứ tự hiệu suất như phương pháp 1> phương pháp 2> ... phương pháp 5. Để tránh vấn đề nhiều so sánh, tôi dự định thực hiện một bài kiểm tra hoán vị dọc theo các dòng sau:
Bước 1: Tập hợp tất cả dữ liệu sao cho kích thước mẫu tổng thể là 114 với tổng số 37 thành công.
Bước 2: Chia ngẫu nhiên dữ liệu thành 5 nhóm với các cỡ mẫu tương ứng là 28, 19, 24, 21 và 22.
Bước 3: Tăng bộ đếm nếu thứ tự được quan sát của Percent_Success từ bước 2 phù hợp với thứ tự dữ liệu của tôi.
Bước 4: Lặp lại bước 2 và 3 nhiều lần (giả sử 10000).
Giá trị p mong muốn = Giá trị bộ đếm cuối cùng / 10000.
Câu hỏi:
Thủ tục trên có ổn không?
Có điều gì trong R cho phép tôi thực hiện bài kiểm tra trên không?
Bất kỳ đề xuất cải tiến hoặc phương pháp thay thế sẽ hữu ích.