Khi tôi chạy một vài ví dụ, các giá trị p cho rho và cho phép kiểm tra t về tương quan Pearson của các cấp bậc luôn khớp, lưu cho vài chữ số cuối
Chà, bạn đã chạy sai ví dụ rồi!
a = c(1,2,3,4,5,6,7,8,9)
b = c(1,2,3,4,5,6,7,8,90)
cor.test(a,b,method='pearson')
Pearson's product-moment correlation
data: a and b
t = 2.0528, df = 7, p-value = 0.0792
alternative hypothesis: true correlation is not equal to 0
95 percent confidence interval:
-0.08621009 0.90762506
sample estimates:
cor
0.6130088
cor.test(a,b,method='spearman')
Spearman's rank correlation rho
data: a and b
S = 0, p-value = 5.511e-06
alternative hypothesis: true rho is not equal to 0
sample estimates:
rho
1
Các vectơ a
và b
có một mối tương quan tốt, nhưng khác xa so với tuyến tính hoàn hảo (Pearson). Tuy nhiên, họ có mối tương quan xếp hạng hoàn hảo . Xem - với Spearman's , trong trường hợp này, vấn đề không phải là nếu chữ số cuối cùng là 8.1, 9, 90 hoặc 9000 (hãy thử!), Nó chỉ quan trọng nếu nó lớn hơn 8 . Đó là những gì một thứ hạng tương quan khác biệt tạo ra. ρb
Ngược lại, trong khi a
và b
có tương quan xếp hạng hoàn hảo, hệ số tương quan Pearson của chúng nhỏ hơn 1. Điều này cho thấy tương quan Pearson không phản ánh thứ hạng.
Một tương quan Pearson phản ánh một hàm tuyến tính, một tương quan xếp hạng đơn giản là một hàm đơn điệu. Trong trường hợp dữ liệu bình thường, cả hai sẽ rất giống nhau và tôi nghi ngờ đây là lý do tại sao dữ liệu của bạn không cho thấy sự khác biệt lớn giữa Spearman và Pearson.
Đối với một ví dụ thực tế, xem xét những điều sau đây; bạn muốn xem người cao cân nặng hơn. Vâng, đó là một câu hỏi ngớ ngẩn ... nhưng hãy cho rằng đây là điều bạn quan tâm. Bây giờ, khối lượng không quy mô tuyến tính với trọng lượng, vì người cao cũng rộng hơn người nhỏ; vì vậy trọng lượng không phải là một hàm tuyến tính của chiều cao. Ai đó cao hơn bạn 10% (trung bình) nặng hơn 10%. Đây là lý do tại sao chỉ số cơ thể / khối lượng sử dụng khối lập phương trong mẫu số.
Do đó, bạn sẽ giả sử một mối tương quan tuyến tính để phản ánh không chính xác mối quan hệ chiều cao / cân nặng. Ngược lại, mối tương quan xếp hạng không nhạy cảm với các định luật khó chịu của vật lý và sinh học trong trường hợp này; nó không phản ánh nếu mọi người phát triển nặng hơn theo chiều cao khi họ tăng chiều cao, nó chỉ phản ánh nếu những người cao hơn (thứ hạng cao hơn trên một thang đo) nặng hơn (thứ hạng cao hơn trên thang đo khác).
Một ví dụ điển hình hơn có thể là bảng xếp hạng câu hỏi giống như Likert, chẳng hạn như mọi người đánh giá thứ gì đó là "hoàn hảo / tốt / đàng hoàng / tầm thường / xấu / khủng khiếp". "Hoàn hảo" khác xa với "đàng hoàng" như "đàng hoàng" là từ "xấu" trên thang đo , nhưng chúng ta có thể thực sự nói rằng khoảng cách giữa hai người là như nhau không? Một mối tương quan tuyến tính không nhất thiết là thích hợp. Thứ hạng tương quan là tự nhiên hơn.
Để giải quyết trực tiếp hơn câu hỏi của bạn: không, giá trị p cho tương quan Pearson và Spearman không được tính khác nhau . Phần lớn là khác nhau về cả hai, về mặt khái niệm cũng như số lượng, nhưng nếu thống kê kiểm tra là tương đương, giá trị p sẽ tương đương.
Về câu hỏi về một giả định về tính quy tắc trong tương quan Pearson, xem điều này .
Tổng quát hơn, những người khác đã xây dựng tốt hơn nhiều so với tôi có thể liên quan đến chủ đề tương quan tham số và không tham số (cũng xem ở đây ), và điều này có nghĩa gì về các giả định phân phối.