Có sự khác biệt nào giữa và không?


21

Hệ số tương quan thường được viết bằng chữ nhưng đôi khi thì không. Tôi tự hỏi nếu thực sự có một sự khác biệt giữa và ? có thể có nghĩa gì khác hơn một hệ số tương quan?r 2 R 2 rRr2R2r


7
Tôi ngạc nhiên khi câu hỏi này bị hạ thấp - nó rõ ràng và được chỉ định rõ ràng, và bao gồm một vấn đề trong đó thuật ngữ được sử dụng theo những cách không nhất quán. Tệ hơn, vì nó phân biệt chữ hoa chữ thường, đây là một chủ đề khó tìm kiếm để làm rõ! Bên cạnh thực tế là có thể được sử dụng cho hai điều hoàn toàn khác nhau, tình hình trở nên tồi tệ hơn khi chúng ta xem xét mô hình mà không cần điều kiện đánh chặn, khi , hệ số xác định, thậm chí không giống như bình phương của . Không có gì ngạc nhiên khi mọi người có thể tìm thấy các ký hiệu khó hiểu. R 2 RrR2R
Cá bạc

Câu trả lời:


18

Ký hiệu về vấn đề này dường như thay đổi một chút.

được sử dụng trong bối cảnh nhiều tương quan và được gọi là "hệ số tương quan nhiều". Đó là mối tương quan giữa các câu trả lời quan sát Y Y trang bị bởi các mô hình. Các Y thường được dự đoán từ nhiều biến dự đoán X i , ví dụ như Y = β 0 + β 1 X 1 + β 2 X 2 nơi đánh chặn và hệ số độ dốc beta tôi đã được ước tính từ dữ liệu. Lưu ý rằng 0RYY^Y^XiY^= =β^0+β^1X1+β^2X2β^tôi .0R1

Ký hiệu là "hệ số tương quan mẫu" được sử dụng trong trường hợp bivariate - tức là có hai biến XY - và nó thường có nghĩa là mối tương quan giữa XY trong mẫu của bạn. Bạn có thể điều này như là một ước lượng tương quan ρ giữa hai biến trong quần thể rộng lớn hơn. Để tương quan hai biến, không cần thiết phải xác định cái nào là yếu tố dự đoán và cái nào là phản ứng. Thật vậy, nếu bạn tìm thấy mối tương quan giữa YX thì nó sẽ giống như tương quan giữa XY , bởi vì mối tương quan là đối xứngrXYXYρYXXY. Lưu ý rằng khi ký hiệu r được sử dụng theo cách này, với r < 0 (tương quan âm) nếu hai biến có mối quan hệ giảm tuyến tính (khi một biến tăng lên, biến còn lại có xu hướng giảm).-1r1rr<0

Trường hợp ký hiệu trở nên không nhất quán là khi có hai biến Yhồi quy tuyến tính đơn giản được thực hiện. Đây có nghĩa là xác định một biến, Y , là biến phản ứng, và người kia, X , là biến dự đoán, và phù hợp mô hình Y = β 0 + β 1 X . Một số người cũng sử dụng các biểu tượng r để chỉ ra mối tương quan giữa YY trong khi những người khác (cho phù hợp với nhiều hồi quy) ghi RXYYXY^= =β^0+β^1XrYY^R. Lưu ý rằng mối tương quan giữa các phản ứng được quan sát và phù hợp nhất thiết phải lớn hơn hoặc bằng không. Đây là một lý do tôi không thích việc sử dụng các biểu tượng trong trường hợp này: mối tương quan giữa XY có thể là tiêu cực, trong khi tương quan giữa YY là tích cực (trong thực tế, nó sẽ chỉ đơn giản là mô đun của tương quan giữa XY ) cả hai có thể được viết bằng ký hiệu r . Tôi đã thấy một số sách giáo khoa và các bài viết trên Wikipedia, chuyển đổi gần như hoán đổi cho nhau giữa hai ý nghĩa của r và thấy nó khó hiểu một cách không cần thiết. Tôi thích sử dụng ký hiệu RrXYYY^XYrrRcho mối tương quan giữa Y trong cả hai hồi quy đơn và nhiều.YY^

Trong cả hai đơn giản và nhiều regresion, sau đó chừng nào có là một thuật ngữ đánh chặn được trang bị trong các mô hình, giữa YY chỉ đơn giản là căn bậc hai của hệ số xác định R 2RYY^R2 (thường được gọi là "tỷ lệ sai giải thích" hoặc giống). Trong trường hợp hồi quy tuyến tính đơn giản cụ thể, thì R2= =r2 trong đó tôi đang viết cho tương quan giữa XY , và R 2 có thể biểu thị hệ số xác định hồi quy hoặc bình phương tương quan giữarXYR2 Y . Kể từ - 1 r 1 0 R 1 , phương tiện này mà R = | r | . Vì vậy, ví dụ, nếu bạn nhận được một sự tương quan giữa X Y của r = - 0,7 sau đó mối tương quan giữa Y và được trang bị Y từ đơn giản tuyến tính hồi quy Y = β 0 + β 1 XYY^-1r10R1R= =|r|XYr= =-0,7YY^Y= =β^0+β^1Xsẽ là và hệ số xác định sẽ là R 2 = 0,49 tức là gần một nửa biến thể trong phản ứng sẽ được giải thích bằng mô hình của bạn.R= =0,7R2= =0,49

Nếu không có thuật ngữ chặn được đưa vào mô hình, thì ký hiệu không rõ ràng. Nó thường được coi là hệ số xác định, nhưng điều này thường sẽ được tính theo cách khác với thông thường , vì vậy hãy cẩn thận khi đọc đầu ra từ phần mềm thống kê của bạn. Khi đó, nó không còn giống như bình phương của nhiều tương quan R , cũng không phải trong trường hợp bivariate sẽ bằng r 2 !R2Rr2

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.