Có sự khác biệt trong các giả định và các giả thuyết được thử nghiệm.
ANOVA (và kiểm tra t) rõ ràng là một thử nghiệm về sự bình đẳng của các phương tiện của các giá trị. Kruskal-Wallis (và Mann-Whitney) có thể được xem về mặt kỹ thuật như là một so sánh của các cấp bậc trung bình .
Do đó, về các giá trị ban đầu, Kruskal-Wallis là nhiều hơn tổng quát hơn so với phương tiện: nó kiểm tra xem xác suất quan sát ngẫu nhiên từ mỗi nhóm có khả năng cao hơn hoặc thấp hơn một quan sát ngẫu nhiên từ một nhóm khác hay không. Số lượng dữ liệu thực tế làm cơ sở cho sự so sánh đó không phải là sự khác biệt về phương tiện cũng như sự khác biệt về trung vị, (trong hai trường hợp mẫu), nó thực sự là trung vị của tất cả các khác biệt theo cặp - sự khác biệt giữa Hodges-Lehmann giữa mẫu.
Tuy nhiên, nếu bạn chọn đưa ra một số giả định hạn chế, thì Kruskal-Wallis có thể được coi là một thử nghiệm về sự bình đẳng của phương tiện dân số, cũng như lượng tử (ví dụ như trung bình), và thực sự là một loạt các biện pháp khác. Đó là, nếu bạn cho rằng các phân phối nhóm theo giả thuyết null là như nhau và theo phương án khác, thay đổi duy nhất là phân phối thay đổi (một cái gọi là " vị trí ca thay thế "), sau đó nó cũng là một thử nghiệm về sự bình đẳng của các phương tiện dân số (và, đồng thời, của các trung vị, các phân vị thấp hơn, v.v.).
[Nếu bạn thực hiện giả định đó, bạn có thể có được ước tính và khoảng thời gian cho các ca tương đối, giống như bạn có thể làm với ANOVA. Chà, cũng có thể đạt được các khoảng mà không cần giả định đó, nhưng chúng khó diễn giải hơn.]
Nếu bạn nhìn vào câu trả lời ở đây , đặc biệt là về cuối, nó sẽ thảo luận về sự so sánh giữa thử nghiệm t và Wilcoxon-Mann-Whitney, mà (khi thực hiện các thử nghiệm hai đuôi ít nhất) tương đương với ANOVA và Kruskal-Wallis áp dụng để so sánh chỉ có hai mẫu; nó cung cấp thêm một chút chi tiết, và phần lớn cuộc thảo luận đó được chuyển đến Kruskal-Wallis vs ANOVA.
Nó không hoàn toàn rõ ràng những gì bạn có nghĩa là một sự khác biệt thực tế. Bạn thường sử dụng chúng theo cách tương tự. Khi cả hai bộ giả định được áp dụng, chúng thường có xu hướng cho các loại kết quả khá giống nhau, nhưng chắc chắn chúng có thể cho các giá trị p khá khác nhau trong một số tình huống.
Chỉnh sửa: Đây là một ví dụ về sự giống nhau của suy luận ngay cả ở các mẫu nhỏ - đây là vùng chấp nhận chung cho các thay đổi vị trí giữa ba nhóm (nhóm thứ hai và thứ ba so với nhóm thứ nhất) được lấy mẫu từ các phân phối bình thường (với kích thước mẫu nhỏ) đối với một tập dữ liệu cụ thể, ở mức 5%:
Có thể nhận thấy rất nhiều tính năng thú vị - vùng chấp nhận lớn hơn một chút cho KW trong trường hợp này, với ranh giới của nó bao gồm các đoạn đường thẳng đứng, ngang và chéo (không khó để hiểu tại sao). Hai khu vực cho chúng ta biết những điều rất giống nhau về các thông số quan tâm ở đây.