Ý nghĩa của hệ số tương quan trung bình


11

Tuyên bố miễn trừ trách nhiệm: nếu bạn thấy câu hỏi này quá giống với câu hỏi khác, tôi rất vui khi được hợp nhất. Tuy nhiên, tôi không tìm thấy câu trả lời thỏa đáng ở bất kỳ nơi nào khác (và chưa có "danh tiếng" để bình luận hoặc upvote), vì vậy tôi nghĩ rằng tốt nhất nên tự mình đặt câu hỏi mới.

Câu hỏi của tôi là này. Đối với mỗi 12 đối tượng người, tôi đã tính hệ số tương quan (Spearman's rho) giữa 6 cấp độ của một biến độc lập X và các quan sát tương ứng của biến phụ thuộc Y. (Lưu ý: các cấp độ X không bằng nhau giữa các đối tượng.) Giả thuyết không có giá trị là trong dân số nói chung, mối tương quan này bằng không. Tôi đã thử nghiệm giả thuyết này theo hai cách:

  1. Sử dụng thử nghiệm t mẫu một mẫu về các hệ số tương quan thu được từ 12 đối tượng của tôi.

  2. Bằng cách căn giữa các mức X của tôi và các quan sát của Y sao cho mỗi người tham gia, trung bình (X) = 0 và trung bình (Y) = 0, sau đó tính toán một mối tương quan trên dữ liệu tổng hợp (72 cấp độ X và 72 quan sát của Y) .

Bây giờ, từ việc đọc về làm việc với các hệ số tương quan (ở đây và ở nơi khác) tôi đã bắt đầu nghi ngờ liệu cách tiếp cận đầu tiên có hợp lệ hay không. Đặc biệt, tôi đã thấy các phương trình sau bật lên ở một số nơi, được trình bày (dường như) như là một bài kiểm tra t cho các hệ số corelation trung bình:

t=rSEr=n21r2

trong đó sẽ là hệ số tương quan trung bình (và giả sử chúng ta đã đạt được điều này bằng cách sử dụng phép biến đổi của Fisher trên các hệ số theo từng đối tượng trước tiên) và số lượng quan sát. Theo trực giác, điều này có vẻ sai đối với tôi vì nó không bao gồm bất kỳ thước đo nào về tính biến thiên giữa các chủ đề. Nói cách khác, nếu tôi có 3 hệ số tương quan, tôi sẽ nhận được cùng một thống kê t cho dù chúng là [0,1, 0,5, 0,9] hay [0,45 0,5 0,55] hoặc bất kỳ phạm vi giá trị nào có cùng giá trị trung bình (và )rnn=3

Do đó, tôi nghi ngờ rằng phương trình trên thực tế không áp dụng khi kiểm tra tầm quan trọng của trung bình các hệ số tương quan, nhưng khi kiểm tra tầm quan trọng của một hệ số tương quan duy nhất dựa trên quan sát của 2 biến.n

Bất cứ ai ở đây có thể vui lòng xác nhận trực giác này hoặc giải thích tại sao nó sai? Ngoài ra, nếu công thức này không áp dụng cho trường hợp của tôi, có ai biết một / phương pháp đúng không? Hoặc có lẽ bài kiểm tra số 2 của riêng tôi đã hợp lệ? Bất kỳ trợ giúp đều được đánh giá rất cao (bao gồm cả gợi ý cho các câu trả lời trước đây mà tôi có thể đã bỏ lỡ hoặc giải thích sai).


2
Pearson's không nhạy cảm với các phép biến đổi định tâm và chia tỷ lệ, vì vậy tôi nghĩ rằng việc định tâm không liên quan đến câu hỏi của bạn. Ví dụ: cor ( ) = cor ( ) = cor ( ) = cor ( ). rX,YX,YY¯X,Y+1000X,Y×1000
Alexis

Tôi đồng ý với bạn. Đó là lý do tại sao tôi diễn giải định tâm là "căn giữa từng biến riêng biệt trước khi đặt chúng lại với nhau".
Federico Tedeschi

1
@FedericoTedeschi Không "định tâm từng biến riêng biệt trước khi đặt chúng lại với nhau" nghĩa là nghĩa là gì? YY¯
Alexis

@Alexis Tôi đã trả lời bạn ở cuối câu trả lời của tôi (sẽ mất quá lâu để viết nó trong một bình luận, và tôi cũng đã phải sửa nó nhiều lần do vấn đề WYSINWYG).
Federico Tedeschi

Câu trả lời:


2

Cách tiếp cận tốt hơn để phân tích dữ liệu này là sử dụng (còn gọi là mô hình hiệu ứng hỗn hợp, mô hình phân cấp) với subjecthiệu ứng ngẫu nhiên (chặn ngẫu nhiên hoặc chặn ngẫu nhiên + độ dốc). Để tóm tắt một câu trả lời khác nhau của tôi:

Đây thực chất là một hồi quy mô hình hóa một mối quan hệ tổng thể duy nhất trong khi cho phép mối quan hệ đó khác nhau giữa các nhóm (các đối tượng con người). Cách tiếp cận này được hưởng lợi từ việc gộp một phần và sử dụng dữ liệu của bạn hiệu quả hơn.


-1

Tôi giả sử rằng biến số ( và ) là giống nhau cho tất cả các cá nhân (thực sự tôi không chắc tôi hiểu ý của bạn khi nói rằng các cấp độ không bằng nhau giữa các đối tượng: Tôi hy vọng bạn là đề cập đến tính độc lập giữa các phạm vi của các biến, chứ không phải về các biến được đo cho từng cá nhân). Có, công thức bạn đưa ra áp dụng cho hệ số tương quan giữa hai biến.126 X6 Y

Ở điểm 2 của bạn, bạn nói về việc chuẩn hóa: Tôi nghĩ rằng điều này sẽ có ý nghĩa nếu bạn làm điều đó cho từng biến riêng biệt. Tuy nhiên, ngay cả như vậy, vấn đề với phương pháp này là nó không kiểm soát được sự phụ thuộc bên trong cá nhân.62

Tôi tin rằng cách tiếp cận 1 của bạn cũng không hợp lệ, bởi vì đây sẽ là một thử nghiệm trong số biến có phân phối chỉ với bậc tự do, vì vậy tôi không nghĩ bạn có thể áp dụng Định lý giới hạn trung tâm trong trường hợp này.6t10

Có thể, với số lượng lớn hơn, bạn có thể sử dụng cách tiếp cận hiệu ứng ngẫu nhiên, cho phép độ dốc ngẫu nhiên và đồng thời kiểm tra cả hệ số trung bình null (của trên ) và không tồn tại hệ số ngẫu nhiên. Tôi tin tuy nhiên 6 biến và 12 quan sát là không đủ để làm điều đó.XiYi

Tôi khuyên bạn nên xem thử nghiệm trên 6 giá trị (trở thành 12 nếu bạn cũng xem xét các giá trị bên dưới đường chéo) của ma trận tương quan giữa biến (cả và ), tức là các giá trị trên đường chéo thứ 2 (và tương đương với góc phần tư thứ 3). Vì vậy, tôi sẽ thực hiện một thử nghiệm tỷ lệ khả năng giữa mô hình bị hạn chế và không bị hạn chế.12XY

@Alexis Hiểu biết của tôi là việc định tâm , , bằng cách thay thế chúng bằng sẽ có ý nghĩa (tôi nghĩ cũng sẽ hợp lý khi chia chúng cho của họ ). Theo cách này, các biến và (được tạo bằng cách xem xét như thể chúng là sự xuất hiện của một biến duy nhất và tương tự đối với ) đều có một bình. Ngược lại, nếu chúng ta xây dựng hai biến trước (được tạo bằng cách xem xétX1,,X6Y1,,Y6X1=X1X1¯,,X6=X6X6¯,Y1=Y1Y1¯,,Y6=Y6Y6¯SEXYXi,1i6Yi0X,YXi,1i6như thể chúng là sự xuất hiện của một biến duy nhất và tương tự đối với ), thì tất nhiên trừ đi giá trị trung bình (và cũng được chia cho SE của và ) sẽ không thay đổi mọi thứ.YiXY

CHỈNH SỬA 01/01/18

Đặt chỉ ra biến và ( ) cá nhân. Sau đó, giả sử chúng ta có:ij1j12

X1j=Y1j=10,j ;

X2j=Y2j=8,j ;

X3j=Y3j=6,j ;

X4j=Y4j=4,j ;

X5j=Y5j=2,j ;

X6j=Y6j=j,j .

Mối tương quan trong trường hợp này nên là .0.5428

Nếu chúng ta căn giữa từng biến, cho rằng, với , cả và không có biến thể, chúng ta có: . Đối với , chúng tôi nhận được các giá trị (nghĩa là đối với 's: và hoàn toàn ngược lại với ). Vì và , chúng tôi nhận được: , ngụ ý một mối tương quan của .1i5XiYiXij=Yij=0i=6X6j=j6.5,Yj6=(13j)6.5=6.5jX5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.5Y0=0j6.5=(6.5j)Xij=Yiji,jX=Y1


Tôi đồng ý với bạn, nếu chúng tôi làm theo thủ tục thứ hai. Đó là lý do tại sao tôi tin Ruben van Bergen có nghĩa là những gì tôi đã mô tả trong quy trình đầu tiên. Trong trường hợp này, chúng ta có: , nhưng thì không nói chung là đúng Tôi đang chỉnh sửa bài viết của mình để hiển thị một ví dụ phản tác dụng. cor(Xi,Yi)=cor(Xi,Yi),icor(X,Y)=cor(X,Y)
Federico Tedeschi

Các giá trị cho tương quan là: ; . Không quan trọng là sự tương quan có thực sự là , vì nó rõ ràng khác với . 0.5428X=10,10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,1,2,3,4,5,6,7,8,9,10,11,12Y=10,10,10,10,10,10,10,10,10,10,10,8,8,8,8,8,8,8,8,8,8,8,8,6,6,6,6,6,6,6,6,6,6,6,6,4,4,4,4,4,4,4,4,4,4,4,4,2,2,2,2,2,2,2,2,2,2,2,2,12,11,10,9,8,7,6,5,4,3,2,10.54281
Federico Tedeschi

Mối tương quan giữa và là . Thực tế bạn nói rằng và dẫn đến là đúng, nhưng điều này chỉ đúng có nghĩa là , đó là điều tôi đã viết. X=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.5X=0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,5.5,4.5,3.5,2.5,1.5,0.5,0.5,1.5,2.5,3.5,4.5,5.51X=1,,12Y=12,,1cor(X,Y)=cor(X,Y)=1cor(Xi,Yi)=cor(Xi,Yi)
Federico Tedeschi

Tất nhiên : đây là hệ quả của sự bất biến của mối tương quan với các phép biến đổi tuyến tính. Đây là điều tôi đã đồng ý trong nhận xét đầu tiên của mình, "Tôi đồng ý với bạn. Đó là lý do tại sao tôi diễn giải trung tâm là" tập trung từng biến riêng biệt trước khi đặt chúng lại với nhau "." - Federico Tedeschi 27/12/17 lúc 10:27cor(X;Y)=cor(XX¯;YY¯)
Federico Tedeschi

Có lẽ, tôi không hiểu "tập trung từng biến riêng biệt trước khi đặt chúng lại với nhau" nghĩa là gì. Đối với tôi, có nghĩa là là "định tâm mỗi biến riêng trước khi đặt chúng lại với nhau ". Bạn có thể giúp tôi hiểu sự hiểu biết rõ ràng khác nhau của chúng tôi? XX¯X1X¯,X2X¯,,XnX¯
Alexis
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.