Kendall Tau hay Spearman's rho?


69

Trong trường hợp nào người ta nên thích cái này hơn cái kia?

Tôi tìm thấy một người tuyên bố một lợi thế cho Kendall, vì lý do sư phạm , còn có lý do nào khác không?


Xem thêm một số liệu thống kê câu hỏi liên quan.stackexchange.com / q /8112 / 3277 .
ttnphns

1
Thật không may, liên kết trong câu hỏi của bạn đã chết. Tôi giả sử bạn đang đề cập đến Noether (2007, Dạy thống kê ) . Bạn có muốn chỉnh sửa nó trong?
S. Kolassa - Tái lập Monica

Câu trả lời:


40

Tôi thấy rằng tương quan Spearman chủ yếu được sử dụng thay cho tương quan tuyến tính thông thường khi làm việc với các điểm có giá trị nguyên trên thang đo, khi nó có số điểm vừa phải có thể hoặc khi chúng tôi không muốn dựa vào các giả định về các mối quan hệ bivariate . So với hệ số Pearson, cách giải thích của Kendall dường như ít trực tiếp hơn so với rho của Spearman, theo nghĩa là nó định lượng sự khác biệt giữa% các cặp tương hợp và bất hòa giữa tất cả các sự kiện cặp đôi có thể xảy ra. Theo hiểu biết của tôi, Kendall giống với Goodman-Kruskal Gamma .

Tôi vừa duyệt một bài báo từ Larry Winner trong J. Statistics Education. (2006) trong đó thảo luận về việc sử dụng cả hai biện pháp, Kết quả cuộc đua Cup NASCAR Winston cho giai đoạn 1975-2003 .

Tôi cũng tìm thấy câu trả lời của @onestop về mối tương quan của Pearson hoặc Spearman với dữ liệu không bình thường thú vị về mặt này.

Đáng chú ý, tau Kendall của (các một phiên bản) có kết nối đến Somers' D (và C Harrell của) được sử dụng cho mô hình tiên đoán (xem ví dụ: Giải thích từ Somers' D dưới bốn mô hình đơn giản bởi RB Newson và tài liệu tham khảo 6 trong đó, và bài viết của Newson được công bố trên Tạp chí Stata 2006). Tổng quan về các bài kiểm tra tổng xếp hạng được cung cấp trong Tính toán hiệu quả các khoảng tin cậy của Jackknife cho thống kê xếp hạng , được công bố trong JSS (2006).


Cảm ơn chl cho câu trả lời, tôi đã chấp nhận nó cho phạm vi tuyệt đối của nó. Tốt nhất, Tal
Tal Galili

Spearman được sử dụng trên hai biến số nguyên thường xuyên so sánh về các mối quan hệ, dường như được xử lý tốt hơn bởi tau của Kendall.
vinnief

29

Tôi giới thiệu quý ông đáng kính với câu trả lời trước đây của tôi : "... khoảng tin cậy cho Spearman's S S kém tin cậy và ít diễn giải hơn khoảng tin cậy đối với tham số Kend của Kendall", theo Kendall & Gibbons (1990).


1
Tôi nghĩ lời cảm ơn là do Roger Newson, vì tôi chỉ trích dẫn từ bài viết của anh ấy.
vào

22

Một lần nữa câu trả lời có phần triết lý; sự khác biệt cơ bản là Spearman's Rho là một nỗ lực để mở rộng ý tưởng R ^ 2 (= "giải thích phương sai") đối với các tương tác phi tuyến, trong khi Tau của Kendall dự định là một thống kê thử nghiệm cho thử nghiệm tương quan phi tuyến. Vì vậy, Tau nên được sử dụng để kiểm tra các mối tương quan phi tuyến, Rho là phần mở rộng R (hoặc cho những người quen thuộc với R ^ 2 - giải thích Tau cho khán giả không nghi ngờ trong thời gian giới hạn là đau đớn).


6
bạn có thể vui lòng giải thích "tương tác phi tuyến tính". Spearman Rho dường như phản ánh một thước đo về hệ số hiệu lực về mặt tâm lý học. Tôi không biết về bản chất của Tau.
Subhash C. Davar

Tôi không hiểu điều tâm lý của bạn.
Léo Léopold Hertz

1
"Tương tác phi tuyến tính" bởi vì tất cả những gì quan trọng là thứ tự, không phải là mối tương quan tuyến tính. Ví dụ: và có tương quan Pearson bằng 0 trong khi tau của Kendall hoặc Spearman's rho sẽ có điểm 1.xx2
Yohan Obadia

1
Điều đó chỉ đúng khi x không âm.
aocall

17

Dưới đây là một trích dẫn từ Andrew Gilpin (1993) ủng hộ của Kendall τ trên Spearman ρ vì những lý do lý thuyết:

"[Kendall ] tiếp cận một phân phối chuẩn nhanh hơn , như , kích thước mẫu, tăng; và cũng dể làm hơn về mặt toán học, đặc biệt là khi quan hệ có mặt." τρNτ

Tài liệu tham khảo

Gilpin, AR (1993). Bảng chuyển đổi Tau của Kendall thành Spearman's Rho trong phạm vi đo lường mức độ ảnh hưởng của phân tích tổng hợp. Đo lường giáo dục và tâm lý, 53 (1), 87-92.


3

FWIW, một trích dẫn từ Myers & Well (thiết kế nghiên cứu và phân tích thống kê, ấn bản thứ hai, 2003, trang 510). Nếu bạn vẫn quan tâm đến các giá trị p;

Seigel và Castellan (1988, thống kê phi tham số cho các ngành khoa học hành vi) chỉ ra rằng, mặc dù và Spearman thường sẽ có các giá trị khác nhau khi được tính cho cùng một bộ dữ liệu, khi các thử nghiệm quan trọng cho và Spearman dựa trên phân phối lấy mẫu của họ, họ sẽ mang lại giá trị p giống nhau .τρτρ


Bạn có biết nếu họ cung cấp bất kỳ hỗ trợ cho khiếu nại này? Tôi không thấy làm thế nào nó thực sự có thể đúng nói chung (chúng có thể khá giống nhau, nhưng tôi thực sự không thấy cách khẳng định rằng chúng sẽ giống nhau có thể giữ vững). [Tôi tự hỏi nếu Siegel và Castellan thực sự nói chính xác điều đó, hoặc một cái gì đó hơi khác nhau.]
Glen_b

Tôi đã kiểm tra Siegel & Castellan (2ed p253). Họ nói điều gì đó hơi khác một chút ... nhưng thực tế nó hơi tệ hơn so với cách diễn đạt ở trên, ngay cả khi thêm "xấp xỉ" (tệ hơn vì họ hạn chế trường hợp dưới dạng null, nhưng vì họ đang điều chỉnh dữ liệu Dù sao đi nữa, đối với một đơn hàng cố định , tất cả các thứ tự xếp hạng có thể có của đều có khả năng như nhau theo H0.) Thực tế là họ nghĩ rằng điều hòa trên null sau khi điều chỉnh các vấn đề dữ liệu là một điều đáng lo ngại. Tôi tự hỏi liệu họ có ý định nói điều gì khác hay họ thực sự hiểu lầmxy
Glen_b

Để làm ví dụ, lấy n = 7 và giá trị p chính xác. Đặt x = 1,2,3,4,5,6,7 và để y = 2,1,4,3,7,6,5 ... spearman cho p = 0,048, Kendall cho 0,136 ... đó là hoàn toàn không giống nhau Một cách sắp xếp khác nhau cho cùng một giá trị cho kendall nhưng spearman có p = 0,02. Có rất nhiều ví dụ và kích cỡ mẫu khác nhau
Glen_b

3
Đây là một âm mưu cho trường hợp n = 8. Như bạn thấy có rất nhiều biến thể giữa các giá trị p cho hai thước đo tương quan: i.stack.imgur.com/5JMbj.png ... Tôi có thể viết lên một câu hỏi và trả lời về điều này
Glen_b

1
Dưới đây là hai tập dữ liệu mẫu (sau khi xếp hạng) hiển thị hai trường hợp (lần này với n = 9) trong đó các giá trị p tương quan Spearman là như nhau, nhưng giá trị p tương quan Kendall hoàn toàn khác nhau: i.stack.imgur. com / 3ILD8.png
Glen_b
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.