Phân phối tương quan mẫu


8

Giả sử tôi có một lượng lớn các điểm dữ liệu và mối tương quan của Pearson là(x,y)

corr(X,Y)=ρ

Tôi có thể nói gì một cách hợp lý về mối tương quan mà tôi mong đợi để quan sát trong một mẫu có kích thước n ? Nếu tương quan mẫu là ρs , thì mức chênh lệchρs bao nhiêu? Là ρs thiên vị?

Nếu chúng tôi đưa ra một số giả định như tính quy tắc, chúng tôi có thể tính hàm khả năng chính xác của ρs là hàm của ρ không?

(Cuối cùng, tôi tự hỏi về vấn đề liệu một mối tương quan cao được quan sát có phải là một con sán hay không, và tất cả những gì tôi có là kích thước mẫu và mối tương quan.)


2
onestop cung cấp một câu trả lời hy vọng sẽ cung cấp cho bạn đủ để tiếp tục. Nếu bạn thực sự muốn biết về sự phân bố của chính hệ số tương quan mẫu, thì tham chiếu xác định là: Hotelling, H. (1953). Ánh sáng mới về hệ số tương quan và các biến đổi của nó. Tạp chí của Hiệp hội Thống kê Hoàng gia, Sê-ri B, 15, 193-232. Lưu ý rằng đây không phải là đọc nhẹ.
Wolfgang

Tôi không nghĩ đồ thị của bạn là đúng. Tôi vừa mới vẽ một số biểu đồ phân phối xuất phát từ công thức Fisher cho thấy nó được căn giữa chính xác. Trên thực tế, điều khá rõ ràng từ công thức là nó phải không thiên vị đối với . Bạn có thể gửi lõi toán học của mã của bạn? N
onestop

@onestop Chắc chắn rồi. Đã thêm mã Mathicala.
Đánh dấu Eichenlaub

Đó không phải là cách pdf biến đổi - nó phức tạp hơn một chút. Xem en.wikipedia.org/wiki/
Kẻ

@onestop Tất nhiên rồi. Cảm ơn bạn. Tôi nhận ra có một vấn đề sau khi tôi đăng mã, nhưng tôi sẽ mất một thời gian để tìm ra cách khắc phục.
Đánh dấu Eichenlaub

Câu trả lời:


7

Để trích dẫn bài viết Wikipedia về chuyển đổi Fisher :

Nếu có phân phối chuẩn bivariate và nếu các cặp được sử dụng để tạo hệ số tương quan mẫu độc lập với thì được phân phối bình thường với giá trị trung bình và lỗi tiêu chuẩn trong đó là cỡ mẫu.( X i , Y i ) r i = 1 , Rời , n , z = 1(X,Y)(Xi,Yi)rTôi= =1,Giáo dục,n,1

z= =12ln1+r1-r= =hồ quang(r)
112ln1+ρ1-ρ,1N-3,N

xin lỗi vì không chấp nhận Khi tôi cố gắng sử dụng câu trả lời này, tôi thấy nó không hoạt động cho tình huống tôi quan tâm (hệ số tương quan cao).
Đánh dấu Eichenlaub

@Mark, tôi đã thực hiện một số mô phỏng với R, mọi thứ đều khá tốt cho tương quan 0,75
mpiktas

@mpiktas Vâng, bạn nói đúng, cảm ơn bạn. Tôi đã làm một lỗi trong máy tính xách tay của tôi.
Đánh dấu Eichenlaub

1
Phân phối chính xác được biết: nó được đưa ra bởi một hàm siêu bội .
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.