Câu hỏi hay! Trước tiên, hãy làm sáng tỏ một số nhầm lẫn tiềm năng. Dunn của thử nghiệm (Dunn, 1964) một cách chính xác là: một thống kê kiểm tra mà là một analog phi tham vào cặp t một bài kiểm tra sẽ tiến hành bài hoc cho một ANOVA. Nó tương tự như phép thử tổng thứ hạng Mann-Whitney-Wilcoxon, ngoại trừ việc (1) nó sử dụng một thước đo của phương sai gộp được ngụ ý bởi giả thuyết khống về thử nghiệm Kruskal-Wallis và (2) nó sử dụng cùng một thứ hạng dữ liệu gốc của một người được sử dụng trong thử nghiệm Kruskal-Wallis.
Dunn cũng đã phát triển cái thường được gọi là điều chỉnh Bonferroni cho nhiều so sánh (Dunn, 1961), đây là một trong nhiều phương pháp để kiểm soát tỷ lệ lỗi thông minh gia đình (FWER) đã được phát triển và chỉ đơn giản là đòi hỏi phải chia (thử nghiệm một đầu) hoặc (thử nghiệm hai đuôi) theo số lượng so sánh cặp đôi đang thực hiện. Số lượng so sánh cặp tối đa mà người ta có thể thực hiện với biến là , do đó, đó là 17 * 16/2 = 136 so sánh cặp có thể, ngụ ý rằng bạn có thể từ chối giả thuyết khống cho bất kỳ thử nghiệm đơn lẻ nào nếu . Mối quan tâm của bạn về sức mạnhαα / 2kk ( k - 1 ) / 2p ≤ alpha / 2 / 136 do đó được bảo hành cho phương pháp này.
Tuy nhiên, các phương pháp khác để kiểm soát FWER tồn tại với sức mạnh thống kê nhiều hơn. Ví dụ, các phương pháp từng bước Holm và Holm-Sidak (Holm, 1979) không xuất huyết theo cách mà phương pháp Bonferroni thực hiện. Ngoài ra, bạn cũng có thể nhắm đến việc kiểm soát tỷ lệ phát hiện sai (FDR), và các phương pháp này Thay đổi Stewamini-Hochberg (1995), và Stewamini-Yekutieli (2001) Nói chung đưa ra nhiều quyền lực thống kê hơn bằng cách giả sử rằng một số giả thuyết không có giá trị là sai (tức là bằng cách xây dựng ý tưởng rằng không phải tất cả các từ chối đều là từ chối sai thành các tiêu chí từ chối được sửa đổi liên tục). Những điều chỉnh này và nhiều so sánh khác được triển khai cụ thể cho thử nghiệm của Dunn trong Stata trong gói dunntest (trong loại Statanet describe dunntest, from(https://alexisdinno.com/stata)
) và trong R trong gói dunn.test .
Ngoài ra, có một cách khác để kiểm tra Dunn (dựa trên thống kê kiểm tra z gần đúng ): bài kiểm tra Conover-Iman (độc quyền) cho bài kiểm tra Kruskal-Wallis bị từ chối (dựa trên phân phối t , và đó là mạnh hơn thử nghiệm của Dunn; Conover & Iman, 1979; Convover, 1999). Người ta cũng có thể sử dụng các phương thức để điều khiển FWER hoặc FDR bằng các thử nghiệm Conover-Iman, được triển khai cho Stata trong gói conovertest (trong loại Stata net describe conovertest, from(https://alexisdinno.com/stata)
) và cho R trong gói conover.test .
Người giới thiệu
Stewamini, Y. và Hochberg, Y. (1995). Kiểm soát tỷ lệ phát hiện sai: Cách tiếp cận thực tế và mạnh mẽ đối với nhiều thử nghiệm . Tạp chí của Hiệp hội Thống kê Hoàng gia . Sê-ri B (Phương pháp luận), 57 (1): 289 Ảo300.
Stewamini, Y. và Yekutieli, D. (2001). Việc kiểm soát tỷ lệ phát hiện sai trong nhiều thử nghiệm dưới sự phụ thuộc . Biên niên sử thống kê , 29 (4): 1165 trừ1188.
Chuyển đổi, WJ (1999). Thực hành thống kê phi trắc nghiệm . Wiley, Hoboken, NJ, phiên bản thứ 3.
Conover, WJ và Iman, RL (1979). Về thủ tục so sánh nhiều . Báo cáo kỹ thuật LA-7677-MS, Phòng thí nghiệm khoa học Los Alamos.
Dunn, OJ (1961). Nhiều so sánh giữa các phương tiện . Tạp chí của Hiệp hội Thống kê Hoa Kỳ , 56 (293): 52 Hàng64.
Dunn, OJ (1964). Nhiều so sánh sử dụng tổng xếp hạng . Technometrics , 6 (3): 241 bóng252.
Holm, S. (1979). Một thủ tục kiểm tra tuần tự đơn giản từ chối nhiều . Tạp chí Thống kê Scandinavia , 6 (65-70): 1979.