Cả hai mối tương quan và hiệp phương sai đo liên kết tuyến tính giữa hai biến đã cho và không có nghĩa vụ phải phát hiện bất kỳ hình thức liên kết nào khác.
Vì vậy, hai biến đó có thể được liên kết theo một số cách phi tuyến tính khác và hiệp phương sai (và do đó, mối tương quan) không thể phân biệt với trường hợp độc lập.
Là một rất mô phạm, nhân tạo và gương phi thực tế, người ta có thể xem xét mà P ( X = x ) = 1 / 3 cho x = - 1 , 0 , 1 và cũng xem xét Y = X 2 . Lưu ý rằng chúng không chỉ được liên kết, mà một là một chức năng của người khác. Tuy nhiên, hiệp phương sai của họ là 0, vì hiệp hội của họ là trực giao với hiệp hội mà hiệp phương sai có thể phát hiện ra.XP(X=x)=1/3x=−1,0,1Y=X2
BIÊN TẬP
Thật vậy, như được chỉ ra bởi @whuber, câu trả lời ban đầu ở trên thực sự là một nhận xét về cách khẳng định không phổ biến đúng nếu cả hai biến không nhất thiết phải phân đôi. Lỗi của tôi!
Vì vậy, hãy toán học lên. (Tương đương với địa phương của "Suit up!" Của Barney Stinson)
Trương hợp đ̣ăc biệt
Nếu cả và Y đều phân đôi, thì bạn có thể giả sử, không mất tính tổng quát, cả hai chỉ giả sử các giá trị 0 và 1 với xác suất tùy ý p , q và r được cho bởi
P ( X = 1 ) = p ∈ [ 0 , 1 ] P ( Y = 1 ) = q ∈ [ 0 , 1 ] P ( X = 1 , YXY01pqr
trong đó đặc trưng hoàn toàn sự phân bố chung củaXvàY. Lấy gợi ý của @ DilipSarwate, lưu ý rằng ba giá trị đó là đủ để xác định phân phối chung của(X,Y), vì
P ( X = 0 , Y = 1 )
P(X=1)=p∈[0,1]P(Y=1)=q∈[0,1]P(X=1,Y=1)=r∈[0,1],
XY(X,Y)
(Trên một ghi chú bên, tất nhiên
rbuộc phải tôn trọng cả
p-r∈[0,1],
q-r∈[0,1]và
1-p-q-r∈[P(X=0,Y=1)P(X=1,Y=0)P(X=0,Y=0)=P(Y=1)−P(X=1,Y=1)=q−r=P(X=1)−P(X=1,Y=1)=p−r=1−P(X=0,Y=1)−P(X=1,Y=0)−P(X=1,Y=1)=1−(q−r)−(p−r)−r=1−p−q−r.
rp−r∈[0,1]q−r∈[0,1] ngoài
r ∈ [ 0 , 1 ] , nghĩa là
r ∈ [ 0 , min ( p , q , 1 - p - q ) ] .)
1−p−q−r∈[0,1]r∈[0,1]r∈[0,min(p,q,1−p−q)]
Lưu ý rằng có thể bằng sản phẩm p ⋅ q = P ( X = 1 ) P ( Y = 1 ) , sẽ làm cho X và Y độc lập, vì
P ( X = 0 , Y = 0 )r=P(X=1,Y=1)p⋅q=P(X=1)P(Y=1)XY
P(X=0,Y=0)P(X=1,Y=0)P(X=0,Y=1)=1−p−q−pq=(1−p)(1−q)=P(X=0)P(Y=0)=p−pq=p(1−q)=P(X=1)P(Y=0)=q−pq=(1−p)q=P(X=0)P(Y=1).
Có, có thể bằng p q , NHƯNG nó có thể khác, miễn là nó tôn trọng các ranh giới ở trên.rpq
Chà, từ phân phối chung ở trên, chúng ta sẽ có
E(X)E(Y)E(XY)Cov(X,Y)=0⋅P(X=0)+1⋅P(X=1)=P(X=1)=p=0⋅P(Y=0)+1⋅P(Y=1)=P(Y=1)=q=0⋅P(XY=0)+1⋅P(XY=1)=P(XY=1)=P(X=1,Y=1)=r=E(XY)−E(X)E(Y)=r−pq
Now, notice then that X and Y are independent if and only if Cov(X,Y)=0. Indeed, if X and Y are independent, then P(X=1,Y=1)=P(X=1)P(Y=1), which is to say r=pq. Therefore, Cov(X,Y)=r−pq=0; and, on the other hand, if Cov(X,Y)=0, then r−pq=0, which is to say r=pq. Therefore, X and Y are independent.
General Case
About the without loss of generality clause above, if X and Y were distributed otherwise, let's say, for a<b and c<d,
P(X=b)=pP(Y=d)=qP(X=b,Y=d)=r
then
X′ and
Y′ given by
X′=X−ab−aandY′=Y−cd−c
would be distributed just as characterized above, since
X=a⇔X′=0,X=b⇔X′=1,Y=c⇔Y′=0andY=d⇔Y′=1.
So
X and
Y are independent
if and only if X′ and
Y′ are independent.
Also, we would have
E(X′)E(Y′)E(X′Y′)Cov(X′,Y′)=E(X−ab−a)=E(X)−ab−a=E(Y−cd−c)=E(Y)−cd−c=E(X−ab−aY−cd−c)=E[(X−a)(Y−c)](b−a)(d−c)=E(XY−Xc−aY+ac)(b−a)(d−c)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)=E(X′Y′)−E(X′)E(Y′)=E(XY)−cE(X)−aE(Y)+ac(b−a)(d−c)−E(X)−ab−aE(Y)−cd−c=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)−a][E(Y)−c](b−a)(d−c)=[E(XY)−cE(X)−aE(Y)+ac]−[E(X)E(Y)−cE(X)−aE(Y)+ac](b−a)(d−c)=E(XY)−E(X)E(Y)(b−a)(d−c)=1(b−a)(d−c)Cov(X,Y).
So
Cov(X,Y)=0 if and only Cov(X′,Y′)=0.
=D