Tại sao giữa hai biến đại diện cho tỷ lệ phương sai được chia sẻ?


8

Đầu tiên, tôi đánh giá cao các cuộc thảo luận về thường gây ra sự giải thích về (nghĩa là hệ số xác định trong hồi quy). Vấn đề tôi đang tìm cách trả lời là khái quát hóa cho tất cả các trường hợp tương quan giữa hai biến.R 2r2R2

Vì vậy, tôi đã rất bối rối về phương sai được chia sẻ trong một thời gian dài. Tôi đã có một vài lời giải thích được đưa ra nhưng tất cả đều có vẻ có vấn đề:

  1. Nó chỉ là một thuật ngữ khác cho hiệp phương sai. Đây không phải là trường hợp, vì tài liệu phân tích nhân tố phân biệt giữa PCA và EFA bằng cách nói rằng tài khoản sau cho phương sai được chia sẻ và cái trước không (PCA rõ ràng kế toán cho hiệp phương sai ở chỗ nó hoạt động trên ma trận hiệp phương sai, nên đã chia sẻ phương sai phải là một khái niệm riêng biệt).

  2. Đây là hệ số tương quan bình phương ( ). Xem:r2

Điều này làm cho ý nghĩa hơn một chút. Vấn đề ở đây là giải thích như thế nào mà ngụ ý nó được chia sẻ đúng. Ví dụ: một cách hiểu về 'phương sai chia sẻ' là . không làm giảm điều đó, hoặc thực sự là một khái niệm dễ trực quan [ ; đó là một đối tượng 4 chiều].r 2 c o v ( A , B ) 2 / ( v a r ( A ) × v a r ( B ) )cov(A,B)/[var(A)+var(B)]r2cov(A,B)2/(var(A)×var(B))

Các liên kết trên cả hai đều cố gắng giải thích nó thông qua sơ đồ Ballentine. Họ không giúp đỡ. Thứ nhất, các vòng tròn có kích thước bằng nhau (dường như rất quan trọng đối với hình minh họa vì một số lý do), điều này không giải thích cho các phương sai không bằng nhau. Người ta có thể giả sử đó là sơ đồ Ballentine cho các biến được tiêu chuẩn hóa, do đó phương sai bằng nhau, trong trường hợp đó, phân đoạn chồng chéo sẽ chiếm sự hiệp phương sai giữa hai biến được tiêu chuẩn hóa (tương quan). Vì vậy, , không .r 2rr2

TL; DR: Giải thích về phương sai được chia sẻ nói điều này:

Bằng cách bình phương hệ số, bạn biết có bao nhiêu phương sai, tính theo tỷ lệ phần trăm, hai biến chia sẻ.

Tại sao đó là trường hợp?


1
Cả hai điểm ("hiệp phương sai" và "bình phương") là những cách hiểu đúng. Tôi khuyên bạn nên câu trả lời của tôi: là tích của hai độ lớn tương đối của hiệp phương sai và là xác suất gần đúng. r2
ttnphns

1
Trong EFA, họ thường nói "phương sai chung", không phải "phương sai chung". Phương sai chung là lĩnh vực của tổng cộng. Mặt khác, thuật ngữ "phương sai được chia sẻ" không hoàn toàn được xác định (câu hỏi của bạn là về cách xác định nó).
ttnphns

1
Biểu đồ Venn (Ballentine) không liên quan chính xác đến khái niệm vì cường độ hiệp phương sai không phải là vùng giao nhau của hai đường tròn (phương sai). Hiệp phương sai phụ thuộc vào cả hai phương sai. Kích thước của hiệp phương sai có thể lớn hơn kích thước của phương sai nhỏ hơn (điều chắc chắn không thể hiển thị trên Venn bằng giao điểm). r2
ttnphns

1
Điều đó đưa chúng ta trở lại định nghĩa hồi quy của là . Vì vậy, nếu tình huống là homoscedastic, bạn có thể dễ dàng nhìn thấy chính mình ... 1 - S S r e s i d / S S t o tr21SSresid/SStot
ttnphns

1
Hiệp phương sai "phương sai chia sẻ", độ lớn của if. Bình thường hóa đến một cường độ tương đối, nó có thể có hai phiên bản, r và r-sq. r-sq có thể được hiểu là% của phương sai được chia sẻ trong phương sai kết hợp.
ttnphns

Câu trả lời:


3

Người ta chỉ có thể đoán một tác giả cụ thể có thể có nghĩa gì bởi "phương sai được chia sẻ." Chúng tôi có thể hy vọng đăng ký các khả năng bằng cách xem xét các thuộc tính mà khái niệm này nên có (theo trực giác) để có. Chúng ta biết rằng "phương sai thêm": phương sai của tổng là tổng phương sai của và khi và có hiệp phương sai bằng không. Đó là tự nhiên để xác định "sai chia sẻ" của với tổng là phần hai của phương sai của tổng thể hiện bằng phương sai của . Điều này là đủ để ngụ ý phương sai được chia sẻ của bất kỳ hai biến ngẫu nhiênX ε X ε X X X YX+εXεXεXXXvà phải là bình phương của hệ số tương quan của chúng.Y

Kết quả này có ý nghĩa đối với việc giải thích hệ số tương quan bình phương là "phương sai được chia sẻ": theo nghĩa phù hợp, nó thực sự là một phần của tổng phương sai có thể được gán cho một biến trong tổng.

Các chi tiết theo sau.

Nguyên tắc và ý nghĩa của chúng

Tất nhiên, nếu , "phương sai được chia sẻ" của họ (hãy gọi nó là "SV" từ bây giờ) phải là 100%. Nhưng nếu và chỉ là phiên bản thu nhỏ hoặc thay đổi của nhau thì sao? Chẳng hạn, nếu đại diện cho nhiệt độ của một thành phố tính bằng độ F và đại diện cho nhiệt độ tính bằng độ C thì sao? Tôi muốn đề xuất rằng trong những trường hợp như vậy và vẫn nên có 100% RAT, để khái niệm này sẽ vẫn có ý nghĩa bất kể và có thể được đo như thế nào :Y X Y X X Y X YY=XYXYXXYXY

(1)SV(α+βX,γ+δY)=SV(X,Y)

đối với bất kỳ số nào và số khác không .beta , δα,γβ,δ

Một nguyên tắc khác có thể là khi là một biến ngẫu nhiên độc lập với , thì phương sai của có thể được phân tách duy nhất thành hai phần không âm,X X + εεXX+ε

Var(X+ε)=Var(X)+Var(ε),

đề nghị chúng tôi cố gắng xác định RAT trong trường hợp đặc biệt này là

(2)SV(X,X+ε)=Var(X)Var(X)+Var(ϵ).

Vì tất cả các tiêu chí này chỉ ở mức thứ hai - chúng chỉ liên quan đến khoảnh khắc thứ nhất và thứ hai của các biến trong các dạng kỳ vọng và phương sai - hãy thư giãn yêu cầu và phải độc lập và chỉ yêu cầu chúng không bị cắt xén . Điều này sẽ làm cho phân tích tổng quát hơn nhiều so với nó có thể.εXε

Kết quả

Những nguyên tắc này - nếu bạn chấp nhận chúng - dẫn đến một khái niệm độc đáo, quen thuộc, có thể diễn giải được. Thủ thuật sẽ là giảm trường hợp chung thành trường hợp đặc biệt của một khoản tiền, trong đó chúng ta có thể áp dụng định nghĩa .(2)

Cho , chúng tôi chỉ đơn giản là cố gắng phân tách thành phiên bản thay đổi tỷ lệ cộng với một biến không tương thích với : nghĩa là, hãy tìm (nếu có thể) các hằng số và và một biến ngẫu nhiên màY X X alpha beta ε(X,Y)YXXαβϵ

(3)Y=α+βX+ε

với . Để phân tách có bất kỳ cơ hội nào là duy nhất, chúng ta nên yêu cầuCov(X,ε)=0

E[ε]=0

để một khi tìm thấy , được xác định bởialphaβα

α=E[Y]βE[X].

Điều này có vẻ rất nhiều như hồi quy tuyến tính và thực sự nó là. Nguyên tắc đầu tiên nói rằng chúng ta có thể hủy bỏ và để có phương sai đơn vị (giả sử rằng mỗi phương sai có phương sai khác không) và khi thực hiện, kết quả hồi quy chuẩn xác nhận giá trị của trong là tương quan của và :Y β ( 3 ) X YXYβ(3)XY

(4)β=ρ(X,Y).

Hơn nữa, lấy phương sai của cho(1)

1=Var(Y)=β2Var(X)+Var(ε)=β2+Var(ε),

ngụ ý

(5)Var(ε)=1β2=1ρ2.

hậu quả là

SV(X,Y)=SV(X,α+βX+ε)(Model 3)=SV(βX,βX+ε)(Property 1)=Var(βX)Var(βX)+Var(ϵ)(Definition 2)=β2β2+(1β2)=β2(Result 5)=ρ2(Relation 4).

Lưu ý rằng vì hệ số hồi quy trên (khi được chuẩn hóa thành phương sai đơn vị) là , nên "phương sai được chia sẻ" là đối xứng, chỉ ra một thuật ngữ gợi ý thứ tự của và không quan trọng:Yρ(Y,X)=ρ(X,Y)XY

SV(X,Y)=ρ(X,Y)2=ρ(Y,X)2=SV(Y,X).
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.