So sánh các hệ số tương quan


11

Tôi có hai bộ dữ liệu mà tôi có ở mức ~ 250.000 giá trị cho 78 và 35 mẫu. Một số mẫu là thành viên của một gia đình và điều này có thể có ảnh hưởng của dữ liệu. Tôi đã tính toán tương quan cặp đôi và nó thay đổi trong khoảng 0,7 đến 0,95 nhưng tôi muốn biết liệu có sự khác biệt đáng kể về hệ số tương quan giữa các gia đình không? Cách tốt nhất để làm việc này là gì? Cảm ơn

Câu trả lời:


6

Một cách chung để so sánh hai hệ số tương quan là sử dụng phương pháp biến đổi z của Fisher, nói rằng gần như bình thường với trung bình và độ lệch chuẩn . Nếu các mẫu là độc lập, thì bạn biến đổi từng hệ số tương quan và sự khác biệt giữa hai tương quan được chuyển đổi sẽ là bình thường với trung bình và độ lệch chuẩn . Từ đó, bạn có thể tạo thành một -statistic và thực hiện kiểm tra như trong một mẫu -test hai mẫu thông thường .ρ^1,ρ^2arctanh(ρ^)arctanh(ρ)1/n3arctanh(ρ1)arctanh(ρ2)1/(n13)+1/(n23)zz


2

Mặc dù câu trả lời của @ Macro rất hay, nhưng nó đòi hỏi một giả định về sự phụ thuộc (trong) của số liệu thống kê. Một cách tiếp cận khác là sử dụng bootstrapping. Ý tưởng sẽ là giữ một biến cố định và xáo trộn biến khác, tính toán tương quan cho từng mẫu của bạn và lấy sự khác biệt của chúng. Lặp lại nhiều lần để có được phân phối và sử dụng phân phối này để kiểm tra giả thuyết rằng các mối tương quan là như nhau. Cấu trúc của tập dữ liệu của bạn không rõ ràng đối với tôi, vì vậy thật khó để cung cấp thêm chi tiết.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.