Nhiều so sánh với nhiều nhóm

Tôi muốn xác định xem sử dụng nhiều phép thử so sánh có phù hợp với dữ liệu của tôi không. Tôi đã sử dụng thử nghiệm Kruskal-Wallis để xác định xem có sự khác biệt về ức chế trung bình giữa nhóm khác nhau hay không. Phân tích cho thấy có sự khác biệt đáng kể và bây giờ tôi muốn sử dụng quy trình so sánh nhiều lần (có lẽ là của Dunn vì tôi có cỡ mẫu không bằng nhau) để xem nhóm nào khác với các nhóm còn lại. $17$

Tôi đã tự hỏi vì tôi có nhiều nhóm ( ) điều này sẽ làm cho một bài kiểm tra so sánh có rất ít sức mạnh hoặc không phù hợp để thực hiện cho tập dữ liệu này? $k = 17$

— Matt
nguồn

+1 cho câu trả lời @Alexis, nhưng bạn thực sự nên tự hỏi mình có thực sự cần kiểm tra tất cả các kết hợp theo cặp của 17 nhóm không. Bạn sẽ làm gì với 136 so sánh ?? Liệt kê tất cả chúng trong một bài báo?

— amip

@amoeba nêu lên một điểm tuyệt vời về giao tiếp. Tôi nghĩ 17 nhóm ở đâu đó gần ranh giới của kết quả truyền thông. Điều đó nói rằng, hãy xem phần mềm được trích dẫn của tôi: nó có hai định dạng đầu ra sắp xếp các kết quả chính xác như thế này.

— Alexis

Câu hỏi hay! Trước tiên, hãy làm sáng tỏ một số nhầm lẫn tiềm năng. Dunn của thử nghiệm (Dunn, 1964) một cách chính xác là: một thống kê kiểm tra mà là một analog phi tham vào cặp t một bài kiểm tra sẽ tiến hành bài hoc cho một ANOVA. Nó tương tự như phép thử tổng thứ hạng Mann-Whitney-Wilcoxon, ngoại trừ việc (1) nó sử dụng một thước đo của phương sai gộp được ngụ ý bởi giả thuyết khống về thử nghiệm Kruskal-Wallis và (2) nó sử dụng cùng một thứ hạng dữ liệu gốc của một người được sử dụng trong thử nghiệm Kruskal-Wallis.

Dunn cũng đã phát triển cái thường được gọi là điều chỉnh Bonferroni cho nhiều so sánh (Dunn, 1961), đây là một trong nhiều phương pháp để kiểm soát tỷ lệ lỗi thông minh gia đình (FWER) đã được phát triển và chỉ đơn giản là đòi hỏi phải chia (thử nghiệm một đầu) hoặc (thử nghiệm hai đuôi) theo số lượng so sánh cặp đôi đang thực hiện. Số lượng so sánh cặp tối đa mà người ta có thể thực hiện với biến là , do đó, đó là 17 * 16/2 = 136 so sánh cặp có thể, ngụ ý rằng bạn có thể từ chối giả thuyết khống cho bất kỳ thử nghiệm đơn lẻ nào nếu . Mối quan tâm của bạn về sức mạnh $\alpha$ $\alpha/2$ $k$ $k(k-1)/2$ $p \le \alpha/2/136$ do đó được bảo hành cho phương pháp này.

Tuy nhiên, các phương pháp khác để kiểm soát FWER tồn tại với sức mạnh thống kê nhiều hơn. Ví dụ, các phương pháp từng bước Holm và Holm-Sidak (Holm, 1979) không xuất huyết theo cách mà phương pháp Bonferroni thực hiện. Ngoài ra, bạn cũng có thể nhắm đến việc kiểm soát tỷ lệ phát hiện sai (FDR), và các phương pháp này Thay đổi Stewamini-Hochberg (1995), và Stewamini-Yekutieli (2001) Nói chung đưa ra nhiều quyền lực thống kê hơn bằng cách giả sử rằng một số giả thuyết không có giá trị là sai (tức là bằng cách xây dựng ý tưởng rằng không phải tất cả các từ chối đều là từ chối sai thành các tiêu chí từ chối được sửa đổi liên tục). Những điều chỉnh này và nhiều so sánh khác được triển khai cụ thể cho thử nghiệm của Dunn trong Stata trong gói dunntest (trong loại Statanet describe dunntest, from(https://alexisdinno.com/stata)) và trong R trong gói dunn.test .

Ngoài ra, có một cách khác để kiểm tra Dunn (dựa trên thống kê kiểm tra z gần đúng ): bài kiểm tra Conover-Iman (độc quyền) cho bài kiểm tra Kruskal-Wallis bị từ chối (dựa trên phân phối t , và đó là mạnh hơn thử nghiệm của Dunn; Conover & Iman, 1979; Convover, 1999). Người ta cũng có thể sử dụng các phương thức để điều khiển FWER hoặc FDR bằng các thử nghiệm Conover-Iman, được triển khai cho Stata trong gói conovertest (trong loại Stata net describe conovertest, from(https://alexisdinno.com/stata)) và cho R trong gói conover.test .

Người giới thiệu

Stewamini, Y. và Hochberg, Y. (1995). Kiểm soát tỷ lệ phát hiện sai: Cách tiếp cận thực tế và mạnh mẽ đối với nhiều thử nghiệm . Tạp chí của Hiệp hội Thống kê Hoàng gia . Sê-ri B (Phương pháp luận), 57 (1): 289 Ảo300.

Stewamini, Y. và Yekutieli, D. (2001). Việc kiểm soát tỷ lệ phát hiện sai trong nhiều thử nghiệm dưới sự phụ thuộc . Biên niên sử thống kê , 29 (4): 1165 trừ1188.

Chuyển đổi, WJ (1999). Thực hành thống kê phi trắc nghiệm . Wiley, Hoboken, NJ, phiên bản thứ 3.

Conover, WJ và Iman, RL (1979). Về thủ tục so sánh nhiều . Báo cáo kỹ thuật LA-7677-MS, Phòng thí nghiệm khoa học Los Alamos.

Dunn, OJ (1961). Nhiều so sánh giữa các phương tiện . Tạp chí của Hiệp hội Thống kê Hoa Kỳ , 56 (293): 52 Hàng64.

Dunn, OJ (1964). Nhiều so sánh sử dụng tổng xếp hạng . Technometrics , 6 (3): 241 bóng252.

Holm, S. (1979). Một thủ tục kiểm tra tuần tự đơn giản từ chối nhiều . Tạp chí Thống kê Scandinavia , 6 (65-70): 1979.

— Alexis
nguồn