Một phương pháp làm giảm tính bảo thủ của một số thống kê kiểm tra rời rạc
(hoặc nói chung hơn, chỉ cần có thêm sự lựa chọn về mức độ quan trọng)
Tùy thuộc vào thử nghiệm, một cách tiếp cận hữu ích đôi khi không yêu cầu ngẫu nhiên là thêm một phần nhỏ của một thống kê hợp lý khác để phá vỡ mối quan hệ.
Ví dụ, hãy tưởng tượng chúng tôi đã thử nghiệm tau của Kendall nhưng trong các mẫu có kích thước nhỏ đến trung bình, nó vẫn khá rời rạc, do đó khó đạt được mức ý nghĩa mong muốn.
Để cụ thể, giả sử bạn muốn một mức gần với trong bài kiểm tra hai đuôi, với .n = 7α=10%n=7
Các mức ý nghĩa có thể đạt được là 6,9% hoặc 13,6%; không phải là rất gần với những gì cần thiết!
Một điều chúng ta có thể làm là thêm một phần rất nhỏ của một thống kê khác, một điều không hoàn toàn tương quan với điều chúng ta có; điều này có nghĩa là nhiều thỏa thuận đưa ra số liệu thống kê đã được gắn trước đó không còn bị ràng buộc nữa, mặc dù giá trị của chúng gần nhau.
Ví dụ: nếu chúng ta sử dụng rho của Spearman để phá vỡ mối quan hệ, ví dụ bằng cách xem , các giá trị gần như giống hệt trước đây, nhưng mức ý nghĩa có thể đạt được hiện tại là 8,9% và 10,9% - không hoàn hảo , nhưng tốt hơn nhiều so với trước đây - và trong trường hợp này, thống kê vẫn được phân phối miễn phí.0.999τ+0.001ρ
Lưu ý rằng trọng lượng trên có thể được làm nhỏ như mong muốn.ρ
Đây là một minh họa - màu đen là ECDF của tương quan Kendall ban đầu, trong khi màu đỏ là phiên bản 'phá vỡ quan hệ'. Tôi đã làm cho sự đóng góp tương đối của Spearman lớn hơn nhiều ở đây (trọng lượng 0,1) để bạn có thể thấy rõ hơn hiệu quả:
Hãy phóng to khu vực gần mức 2,5% và 5% ở đầu bên trái (một đuôi, để tương ứng với 5% và 10% hai đuôi):
Như chúng ta thấy, chúng ta có thể tiến gần hơn đến mức ý nghĩa mong muốn theo cách này, trong khi vẫn giữ lại tất cả các thuộc tính mong muốn khác cho bất kỳ mức độ gần nào chúng ta muốn.
Có nhiều điều chỉnh khác nhau để làm cho kết quả thậm chí giống Kendall hơn (ví dụ: để thiết lập nó để kỳ vọng điều chỉnh nhỏ cho tương quan Kendall ở mỗi tương quan Kendall là 0, nhưng đó hiếm khi là vấn đề đối với tôi).
[Nếu bạn thực sự không biết Kendall và Spearman nào bạn muốn sử dụng cho mối tương quan không theo tỷ lệ, thì một hỗn hợp thậm chí còn có phân phối trông bình thường hơn nhiều (mặc dù hơi khó để xử lý phương sai của nó nếu bạn không tìm ra bản phân phối chính xác - một tính năng hay của việc sử dụng một phiên bản với gần như tất cả một hoặc một thống kê khác là bạn có thể sử dụng một xấp xỉ bình thường hiện có dễ dàng hơn, ngay cả khi đó không phải là một bản phân phối đẹp).]
Cách tiếp cận tương tự này để có được mức ý nghĩa (và giá trị p) đẹp hơn có thể hoạt động với các thử nghiệm khác; Tôi đã thấy nó được sử dụng với một bài kiểm tra dấu hiệu (phá vỡ mối quan hệ với một thống kê cấp bậc đã ký thay đổi kích thước phù hợp) chẳng hạn.