Chúng ta có thể so sánh tương quan giữa các nhóm bằng cách so sánh độ dốc hồi quy không?


10

Trong câu hỏi này, họ hỏi làm thế nào để so sánh Pearson r cho hai nhóm độc lập (chẳng hạn như nam và nữ). Trả lời và ý kiến ​​đề xuất hai cách:

  1. Sử dụng công thức nổi tiếng của Fisher bằng cách sử dụng "z-tranifying" của r;
  2. Sử dụng so sánh độ dốc (hệ số hồi quy).

Cái sau có thể được thực hiện dễ dàng chỉ thông qua mô hình tuyến tính bão hòa: , trong đó XY là các biến tương quan và G là biến giả (0 so với 1) chỉ ra hai nhóm . Độ lớn của d (hệ số hạn tương tác) chính xác là sự khác biệt về hệ số b sau khi mô hình Y = a + b X được tiến hành theo hai nhóm riêng lẻ và ( dY=a+bX+cG+dXGXYGdbY=a+bXdDo đó, ý nghĩa của việc kiểm tra sự khác biệt về độ dốc giữa các nhóm.

Bây giờ, độ dốc hoặc hồi quy coef. chưa phải là một coef tương quan. Nhưng nếu chúng ta tiêu chuẩn hóa Y - riêng biệt trong hai nhóm - thì d sẽ bằng với chênh lệch r trong nhóm 1 trừ r trong nhóm 0 và do đó, tầm quan trọng của nó sẽ là kiểm tra sự khác biệt giữa hai tương quan: chúng ta đang kiểm tra độ dốc nhưng nó xuất hiện [như thể -?] chúng tôi đang thử nghiệm mối tương quan.XYd

Là tôi đã viết đúng?

Nếu có, đã để lại câu hỏi thử nghiệm tương quan tốt hơn - câu hỏi này được mô tả hay câu hỏi của Fisher? Đối với họ sẽ mang lại kết quả không giống nhau. Bạn nghĩ sao?

Chỉnh sửa sau: Cảm ơn @Wolfgang vì đã trả lời Tôi vẫn cảm thấy nhớ tôi tại sao bài kiểm tra của Fisher lại đúng hơn một bài kiểm tra cho r so với cách tiếp cận so sánh độ dốc dưới tiêu chuẩn được mô tả ở trên. Vì vậy, nhiều câu trả lời được chào đón. Cảm ơn bạn.

Câu trả lời:


10

Tất cả những gì bạn đã viết là chính xác. Bạn luôn có thể kiểm tra những thứ như thế với một ví dụ đồ chơi. Đây là một ví dụ với R:

library(MASS)

rho <- .5  ### the true correlation in both groups

S1 <- matrix(c( 1,   rho,   rho, 1), nrow=2)
S2 <- matrix(c(16, 4*rho, 4*rho, 1), nrow=2)

cov2cor(S1)
cov2cor(S2)

xy1 <- mvrnorm(1000, mu=c(0,0), Sigma=S1)
xy2 <- mvrnorm(1000, mu=c(0,0), Sigma=S2)

x <- c(xy1[,1], xy2[,1])
y <- c(xy1[,2], xy2[,2])
group <- c(rep(0, 1000), rep(1, 1000))

summary(lm(y ~ x + group + x:group))

Những gì bạn sẽ thấy rằng sự tương tác là rất quan trọng, mặc dù mối tương quan thực sự là giống nhau trong cả hai nhóm. Tại sao điều đó xảy ra? Bởi vì các hệ số hồi quy thô trong hai nhóm không chỉ phản ánh sức mạnh của mối tương quan, mà cả tỷ lệ của X (và Y) trong hai nhóm. Vì các tỷ lệ khác nhau, sự tương tác là đáng kể. Đây là một điểm quan trọng, vì người ta thường tin rằng để kiểm tra sự khác biệt trong mối tương quan, bạn chỉ cần kiểm tra sự tương tác trong mô hình trên. Tiếp tục đi:

summary(lm(xy2[,2] ~ xy2[,1]))$coef[2] - summary(lm(xy1[,2] ~ xy1[,1]))$coef[2]

Điều này sẽ cho bạn thấy rằng sự khác biệt trong các hệ số hồi quy cho mô hình được trang bị riêng trong hai nhóm sẽ cung cấp cho bạn giá trị chính xác giống như thuật ngữ tương tác.

Điều chúng tôi thực sự quan tâm là sự khác biệt trong các mối tương quan:

cor(xy1)[1,2]
cor(xy2)[1,2]
cor(xy2)[1,2] - cor(xy1)[1,2]

Bạn sẽ thấy rằng sự khác biệt này về cơ bản là bằng không. Hãy chuẩn hóa X và Y trong hai nhóm và chỉnh lại mô hình đầy đủ:

x <- c(scale(xy1[,1]), scale(xy2[,1]))
y <- c(scale(xy1[,2]), scale(xy2[,2]))
summary(lm(y ~ x + x:group - 1))

Lưu ý rằng tôi không bao gồm đánh chặn hoặc hiệu ứng chính của nhóm ở đây, bởi vì chúng là số không theo định nghĩa. Bạn sẽ thấy rằng hệ số cho x bằng với tương quan cho nhóm 1 và hệ số cho tương tác bằng với sự khác biệt trong tương quan cho hai nhóm.

Bây giờ, cho câu hỏi của bạn liệu có nên sử dụng phương pháp này tốt hơn so với sử dụng thử nghiệm sử dụng phép biến đổi r-to-z của Fisher.

BIÊN TẬP

ρ1=ρ2=0ρ1=ρ20α±1

Kết luận: Nếu bạn muốn kiểm tra sự khác biệt về tương quan, hãy sử dụng phép biến đổi r-to-z của Fisher và kiểm tra sự khác biệt giữa các giá trị đó.


Liệu chuyển đổi Fisher có bất kỳ lợi thế so với các thử nghiệm khác?
đánh dấu999

Hóa ra tôi đã hơi quá nhanh. Xem các chỉnh sửa của tôi. Điều đó hy vọng sẽ trả lời câu hỏi của bạn.
Wolfgang

Vì vậy, @Wolfgang, bạn cho rằng phương pháp so sánh độ dốc dưới tiêu chuẩn là so sánh hợp lệ của r. Thay thế nổi tiếng của Fisher thực sự là một xấp xỉ của điều đó. Tôi đã hiểu bạn phải không?
ttnphns

Xem các chỉnh sửa của tôi. Tôi đã quá nhanh chóng với kết luận ban đầu của mình.
Wolfgang

@Wolfgang, sau đó đã thêm EDIT của câu trả lời của bạn nói rằng Fisher tốt hơn. Cách tiếp cận so sánh độ dốc dưới tiêu chuẩn là không thỏa đáng vì "lỗi tiêu chuẩn ... khi bạn chuẩn hóa ... không xem xét tiêu chuẩn hóa này". Vui lòng giải thích cho tôi cách họ nên tính đến tiêu chuẩn hóa để phương pháp so sánh độ dốc dưới tiêu chuẩn trở nên hợp lệ như thử nghiệm của Fisher.
ttnphns
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.