Người ta chỉ có thể đoán một tác giả cụ thể có thể có nghĩa gì bởi "phương sai được chia sẻ." Chúng tôi có thể hy vọng đăng ký các khả năng bằng cách xem xét các thuộc tính mà khái niệm này nên có (theo trực giác) để có. Chúng ta biết rằng "phương sai thêm": phương sai của tổng là tổng phương sai của và khi và có hiệp phương sai bằng không. Đó là tự nhiên để xác định "sai chia sẻ" của với tổng là phần hai của phương sai của tổng thể hiện bằng phương sai của . Điều này là đủ để ngụ ý phương sai được chia sẻ của bất kỳ hai biến ngẫu nhiênX ε X ε X X X YX+ εXεXεXXXvà phải là bình phương của hệ số tương quan của chúng.Y
Kết quả này có ý nghĩa đối với việc giải thích hệ số tương quan bình phương là "phương sai được chia sẻ": theo nghĩa phù hợp, nó thực sự là một phần của tổng phương sai có thể được gán cho một biến trong tổng.
Các chi tiết theo sau.
Nguyên tắc và ý nghĩa của chúng
Tất nhiên, nếu , "phương sai được chia sẻ" của họ (hãy gọi nó là "SV" từ bây giờ) phải là 100%. Nhưng nếu và chỉ là phiên bản thu nhỏ hoặc thay đổi của nhau thì sao? Chẳng hạn, nếu đại diện cho nhiệt độ của một thành phố tính bằng độ F và đại diện cho nhiệt độ tính bằng độ C thì sao? Tôi muốn đề xuất rằng trong những trường hợp như vậy và vẫn nên có 100% RAT, để khái niệm này sẽ vẫn có ý nghĩa bất kể và có thể được đo như thế nào :Y X Y X X Y X YY= XYXYXXYXY
RAT( Α + βX, γ+ δY) = RAT( X, Y)(1)
đối với bất kỳ số nào và số khác không .beta , δα , γβ, δ
Một nguyên tắc khác có thể là khi là một biến ngẫu nhiên độc lập với , thì phương sai của có thể được phân tách duy nhất thành hai phần không âm,X X + εεXX+ ε
Var( X+ Ε ) = Var( X) + Var( ε ) ,
đề nghị chúng tôi cố gắng xác định RAT trong trường hợp đặc biệt này là
RAT( X, X+ Ε ) = Var( X)Var( X) + Var( ϵ ).(2)
Vì tất cả các tiêu chí này chỉ ở mức thứ hai - chúng chỉ liên quan đến khoảnh khắc thứ nhất và thứ hai của các biến trong các dạng kỳ vọng và phương sai - hãy thư giãn yêu cầu và phải độc lập và chỉ yêu cầu chúng không bị cắt xén . Điều này sẽ làm cho phân tích tổng quát hơn nhiều so với nó có thể.εXε
Kết quả
Những nguyên tắc này - nếu bạn chấp nhận chúng - dẫn đến một khái niệm độc đáo, quen thuộc, có thể diễn giải được. Thủ thuật sẽ là giảm trường hợp chung thành trường hợp đặc biệt của một khoản tiền, trong đó chúng ta có thể áp dụng định nghĩa .(2)
Cho , chúng tôi chỉ đơn giản là cố gắng phân tách thành phiên bản thay đổi tỷ lệ cộng với một biến không tương thích với : nghĩa là, hãy tìm (nếu có thể) các hằng số và và một biến ngẫu nhiên màY X X alpha beta ε(X,Y)YXXαβϵ
Y=α+βX+ε(3)
với . Để phân tách có bất kỳ cơ hội nào là duy nhất, chúng ta nên yêu cầuCov(X,ε)=0
E[ε]=0
để một khi tìm thấy , được xác định bởialphaβα
α=E[Y]−βE[X].
Điều này có vẻ rất nhiều như hồi quy tuyến tính và thực sự nó là. Nguyên tắc đầu tiên nói rằng chúng ta có thể hủy bỏ và để có phương sai đơn vị (giả sử rằng mỗi phương sai có phương sai khác không) và khi thực hiện, kết quả hồi quy chuẩn xác nhận giá trị của trong là tương quan của và :Y β ( 3 ) X YXYβ(3)XY
β=ρ(X,Y).(4)
Hơn nữa, lấy phương sai của cho(1)
1=Var(Y)=β2Var(X)+Var(ε)=β2+Var(ε),
ngụ ý
Var(ε)=1−β2=1−ρ2.(5)
hậu quả là
SV(X,Y)=SV(X,α+βX+ε)=SV(βX,βX+ε)=Var(βX)Var(βX)+Var(ϵ)=β2β2+(1−β2)=β2=ρ2(Model 3)(Property 1)(Definition 2)(Result 5)(Relation 4).
Lưu ý rằng vì hệ số hồi quy trên (khi được chuẩn hóa thành phương sai đơn vị) là , nên "phương sai được chia sẻ" là đối xứng, chỉ ra một thuật ngữ gợi ý thứ tự của và không quan trọng:Yρ(Y,X)=ρ(X,Y)XY
SV(X,Y)=ρ(X,Y)2=ρ(Y,X)2=SV(Y,X).