Nó chỉ ra điều gì khi tương quan Spearman là một lượng xác định nhỏ hơn Pearson?


12

Tôi có một loạt các bộ dữ liệu liên quan. Các mối tương quan pearson giữa các cặp của chúng thường lớn hơn tương quan spearman. Điều đó cho thấy bất kỳ mối tương quan nào là tuyến tính, nhưng người ta có thể mong đợi rằng ngay cả khi quả lê và mũi nhọn giống nhau. Điều đó có nghĩa là gì khi có một khoảng cách nhất định giữa tương quan giữa pearson và spearman và pearson lớn hơn? Đây dường như là một tính năng nhất quán trên các tập dữ liệu của tôi.


Câu hỏi rất giống với câu trả lời tuyệt vời ở đây
Colin T Bowers

Câu trả lời:


14

Tương quan Spearman chỉ là tương quan Pearson bằng cách sử dụng các cấp bậc (thống kê đơn hàng) thay vì các giá trị số thực tế. Câu trả lời cho câu hỏi của bạn là họ không đo lường điều tương tự. Pearson: xu hướng tuyến tính, Spearman: xu hướng đơn điệu. Rằng tương quan Pearson cao hơn chỉ có nghĩa là tương quan tuyến tính lớn hơn tương quan xếp hạng. Điều này có lẽ là do các quan sát có ảnh hưởng trong các đuôi của phân phối có ảnh hưởng lớn so với các giá trị được xếp hạng của chúng. Các thử nghiệm liên kết sử dụng tương quan Pearson có sức mạnh cao hơn khi độ tuyến tính giữ trong dữ liệu.


1
Tôi biết rằng spearman chỉ là lê trên hàng ngũ. Tôi cần phải xem liệu có thể có bất kỳ tuyến đường nào khác có thể gây ra điều này không, nhưng các quan sát đuôi có ảnh hưởng tương quan tuyến tính hơn so với phần lớn dữ liệu, nhưng việc mất ảnh hưởng khi thay thế bằng xếp hạng của chúng chắc chắn sẽ gây ra tôi nhìn thấy
John Robertson

0

Pearson Correlation giả định một số giả định cho nó là chính xác: 1) Mỗi ​​biến thường được phân phối; 2) Tính đồng nhất, phương sai của mỗi biến không đổi; và 3) Độ tuyến tính, nghĩa là một biểu đồ phân tán mô tả mối quan hệ cho thấy các điểm dữ liệu được phân cụm đối xứng xung quanh đường hồi quy.

Spearman Correlation là một sự thay thế không đối xứng với Pearson dựa trên thứ hạng của các quan sát. Spearman Correlation cho phép bạn thư giãn cả ba giả định về tập dữ liệu của bạn và rút ra các mối tương quan vẫn chính xác một cách hợp lý.

Dữ liệu của bạn ngụ ý là nó có thể phá vỡ một hoặc nhiều giả định được đề cập về mặt vật chất để hai mối tương quan khác nhau đáng kể.

Cho rằng bạn có một khoảng cách lớn giữa hai mối tương quan, bạn nên điều tra xem các biến của tập dữ liệu của bạn có được phân phối bình thường, homoscedastic và tuyến tính trong một biểu đồ phân tán hay không.

Cuộc điều tra trên sẽ tạo điều kiện thuận lợi cho quyết định của bạn về việc hệ số tương quan Spearman hay Pearson là đại diện hơn.


2
Có lẽ bạn đang nghĩ đến bài kiểm tra suy luận liên quan bằng cách sử dụng phân phối , không phải là biện pháp mô tả. Tuy nhiên, bài kiểm tra này thường được mô tả là có các giả định khác với các giả định mà bạn đã nêu. Ví dụ, tính quy tắc bivariate, một giả định mạnh hơn so với các phân phối bình thường riêng lẻ. Vui lòng cung cấp tài liệu tham khảo cho báo cáo của bạn. t
caracal

4
Sai. Suy luận về tương quan Pearson không yêu cầu bất kỳ giả định nào trong số những giả định này. Người ta có thể có mối quan hệ độ cong với dữ liệu không đồng nhất, dữ liệu không bình thường và thử nghiệm tương quan Pearson (tương đương với suy luận trên mô hình hồi quy tuyến tính) được cung cấp để phát hiện xu hướng thứ tự đầu tiên. Việc giải thích tương quan Pearson là sức mạnh của xu hướng thứ nhất vẫn còn. Có một vài trường hợp trong đó xu hướng thứ tự đầu tiên được đo bằng tương quan Pearson không đủ để phân tích.
AdamO
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.