thử nghiệm Mann Whitney trên dữ liệu trong đó các giả định không được thỏa mãn hoặc gần như mạnh mẽ như thử nghiệm t trên dữ liệu khi các giả định được thỏa mãn?
Một cụm từ như 'mạnh mẽ' không thực sự hoạt động như một tuyên bố chung.
Sức mạnh không đặc biệt có thể so sánh trên các mô hình phân phối khác nhau. Kích thước của một hiệu ứng nhất định có ý nghĩa khác nhau trong các phần khác nhau của phân phối. Hãy tưởng tượng bạn có một bản phân phối khá đỉnh, nhưng có một cái đuôi nặng nề; bằng biện pháp nào để chúng ta nói một kích thước sai lệch cụ thể tương tự như một cái gì đó có trung tâm 'phẳng' hơn và đuôi nhỏ hơn? Một độ lệch nhỏ có thể dễ dàng nhận được, nhưng độ lệch lớn có thể (so với khả năng phân phối khác mà chúng tôi đang cố gắng so sánh sức mạnh) khó hơn.
Với hai bộ phân phối bình thường có thể có, một cặp có sd lớn và một cặp có sd nhỏ, thật dễ dàng để nói 'tốt, sức mạnh sẽ chỉ mở rộng với độ lệch chuẩn; nếu chúng ta xác định kích thước hiệu ứng của mình theo số lượng độ lệch chuẩn, chúng ta có thể liên quan đến hai đường cong sức mạnh '.
Nhưng bây giờ với các bản phân phối có hình dạng khác nhau , không có sự lựa chọn quy mô rõ ràng. Chúng ta phải đưa ra một số lựa chọn về cách so sánh chúng. Những lựa chọn chúng tôi thực hiện sẽ xác định cách họ "so sánh".
Ví dụ: làm cách nào để so sánh sức mạnh khi dữ liệu là Cauchy với sức mạnh khi dữ liệu được nói là beta (2,2)? Một kích thước hiệu ứng tương đương là gì? Cauchy dưới đây có nhiều phân phối giữa -1 và 1 và ít hơn phân phối giữa -3 và 3 so với phân phối khác. Phạm vi liên vùng của họ là khác nhau, ví dụ. Cơ sở của chúng tôi để so sánh là gì?
Nếu bạn có thể giải quyết câu hỏi hóc búa đó, bây giờ hãy xem xét nếu một trong các bản phân phối bị lệch sang trái và phần còn lại là lưỡng kim, hoặc bất kỳ vô số khả năng nào khác.
Bạn vẫn có thể tính toán công suất theo bất kỳ giả định cụ thể nào, nhưng so sánh một thử nghiệm qua các giả định phân phối khác nhau thay vì hai thử nghiệm theo giả định phân phối nhất định về mặt khái niệm là rất khó.