Tôi sợ rằng những câu hỏi liên quan đã không trả lời tôi. Chúng tôi đánh giá hiệu suất của> 2 phân loại (học máy). Giả thuyết Null của chúng tôi là các màn trình diễn không khác nhau. Chúng tôi thực hiện các xét nghiệm tham số (ANOVA) và không tham số (Friedman) để đánh giá giả thuyết này. Nếu chúng quan trọng, chúng tôi muốn tìm hiểu phân loại nào khác nhau trong một nhiệm vụ hậu hoc.
Câu hỏi của tôi có hai mặt:
1) Việc hiệu chỉnh giá trị p sau khi thử nghiệm so sánh nhiều có cần thiết không? Trang Wikipedia tiếng Đức trên "Alphafehler Kumulierung" nói rằng vấn đề chỉ xảy ra nếu nhiều giả thuyết được kiểm tra trên cùng một dữ liệu. Khi so sánh các phân loại (1,2), (1,3), (2,3), dữ liệu chỉ trùng lặp một phần. Nó vẫn được yêu cầu để sửa các giá trị p?
2) Hiệu chỉnh giá trị P thường được sử dụng sau khi thử nghiệm cặp đôi với thử nghiệm t. Có phải cũng cần thiết khi làm các bài kiểm tra sau đại học chuyên ngành, chẳng hạn như bài kiểm tra HSD của Nemenyi (không tham số) hoặc Tukey không? Câu trả lời này nói "không" cho Tukey's HSD: Thử nghiệm Tukey HSD có đúng với nhiều so sánh không? . Có một quy tắc hay tôi phải tìm kiếm điều này cho mọi bài kiểm tra sau đại học tiềm năng?
Cảm ơn!