Phương sai của sản phẩm của các biến phụ thuộc


31

Công thức cho phương sai của sản phẩm của các biến phụ thuộc là gì?

Trong trường hợp các biến độc lập, công thức rất đơn giản:

var(XY)=E(X2Y2)E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2
Nhưng công thức cho các biến tương quan là gì?

Nhân tiện, làm thế nào tôi có thể tìm thấy mối tương quan dựa trên dữ liệu thống kê?

Câu trả lời:


32

Vâng, sử dụng danh tính quen thuộc mà bạn đã chỉ ra,

var(XY)=E(X2Y2)E(XY)2

Sử dụng công thức tương tự cho hiệp phương sai,

E(X2Y2)=cov(X2,Y2)+E(X2)E(Y2)

E(XY)2=[cov(X,Y)+E(X)E(Y)]2

trong đó ngụ ý rằng, nói chung, var(XY) có thể được viết là

cov(X2,Y2)+[var(X)+E(X)2][var(Y)+E(Y)2][cov(X,Y)+E(X)E(Y)]2

Lưu ý rằng trong trường hợp độc lập, cov(X2,Y2)=cov(X,Y)=0 và điều này giảm xuống còn

[var(X)+E(X)2][var(Y)+E(Y)2][E(X)E(Y)]2

và hai điều khoản [E(X)E(Y)]2 hủy bỏ và bạn nhận được

var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2

như bạn đã chỉ ra ở trên.

Chỉnh sửa: Nếu tất cả những gì bạn quan sát là chứ không phải và riêng biệt, thì tôi không nghĩ có cách nào để bạn ước tính hoặc ngoại trừ trong các trường hợp đặc biệt (ví dụ: nếu có nghĩa là được biết đến một tiên nghiệm )XYXYcov(X,Y)cov(X2,Y2)X,Y


2
tại sao bạn đặt [var (X) + E (X) 2] [var (Y) + E (Y) 2] thay vì E (X2) E (Y2) ???

1
@ user35458, vì vậy anh ta có thể kết thúc với phương trình dưới dạng biểu thức của var (X) và var (Y), do đó có thể so sánh với tuyên bố của OP. Lưu ý rằng E (X ^ 2) = Var (X) + E (X) ^ 2.
Waldir Leoncio

2
Để đáp ứng (ngoại tuyến) với một thách thức hiện đã bị xóa đối với tính hợp lệ của câu trả lời này, tôi đã so sánh kết quả của nó với tính toán trực tiếp phương sai của sản phẩm trong nhiều mô phỏng. Đây không phải là một công thức thực tế để sử dụng nếu bạn có thể tránh nó, bởi vì nó có thể mất độ chính xác đáng kể thông qua việc hủy bỏ một thuật ngữ lớn từ một thuật ngữ khác - nhưng đó không phải là vấn đề. Một cạm bẫy cần lưu ý là câu hỏi này liên quan đến các biến ngẫu nhiên. Kết quả của nó áp dụng cho dữ liệu cung cấp cho bạn tính toán phương sai và hiệp phương sai bằng cách sử dụng mẫu số của thay vìnn1 (như thường thấy đối với phần mềm).
whuber

14

Đây là phần phụ lục cho câu trả lời rất hay của @ Macro, đưa ra chính xác những gì cần biết để xác định phương sai của sản phẩm của hai biến ngẫu nhiên tương quan. Vì trong đó , , , và

(1)var(XY)=E[(XY)2](E[XY])2=E[(XY)2](cov(X,Y)+E[X]E[Y])2(2)=E[X2Y2](cov(X,Y)+E[X]E[Y])2(3)=(cov(X2,Y2)+E[X2]E[Y2])(cov(X,Y)+E[X]E[Y])2
cov(X,Y)E[X]E[Y]E[X2]E[Y2] có thể được coi là số lượng đã biết, chúng ta cần xác định giá trị của trong hoặc trong . Điều này không dễ thực hiện nói chung, nhưng, như đã chỉ ra, nếu và là các biến ngẫu nhiên độc lập , thì . Trong thực tế, sự phụ thuộc, không tương quan (hoặc thiếu nó) là vấn đề chính. Điều đó chúng ta biết rằng bằng thay vì một số giá trị khác không tự nó khôngE[X2Y2](2)cov(X2,Y2)(3)XYcov(X,Y)=cov(X2,Y2)=0cov(X,Y)0giúp đỡ trong ít nhất là trong những nỗ lực của chúng tôi được xác định giá trị của hoặc mặc dù nó không đơn giản hóa việc bên phải của và một chút.E[X2Y2]cov(X2,Y2)(2)(3)

Khi và là phụ thuộc biến ngẫu nhiên, sau đó trong ít nhất một (khá phổ biến hoặc khá quan trọng) trường hợp đặc biệt, nó có thể tìm thấy giá trị của tương đối dễ dàng.XYE[X2Y2]

Giả sử và là các biến ngẫu nhiên bình thường chung với hệ số tương quan . Sau đó, lạnh trên , các điều kiện mật độ của là một mật độ chuẩn với trung bình và variance . Do đó, XYρX=xYE[Y]+ρvar(Y)var(X)(xE[X])var(Y)(1ρ2)

E[X2Y2X]=X2E[Y2X]=X2[var(Y)(1ρ2)+(E[Y]+ρvar(Y)var(X)(XE[X]))2]
đó là một hàm tứ phân của , giả sử và Định luật kỳ vọng lặp lại cho chúng ta biết rằng trong đó phần bên phải của có thể được tính từ kiến ​​thức về khoảnh khắc thứ 3 và thứ 4 của - kết quả tiêu chuẩn có thể tìm thấy trong nhiều văn bản và sách tham khảo (có nghĩa là rằng tôi quá lười biếng để tìm kiếm chúng và đưa chúng vào câu trả lời này).Xg(X)
(4)E[X2Y2]=E[E[X2Y2X]]=E[g(X)]
(4)X

Phụ lục bổ sung: Trong câu trả lời hiện đã bị xóa, @Hydrologist đưa ra phương sai của là và tuyên bố rằng công thức này là từ hai bài báo được xuất bản một nửa thế kỷ trước trong JASA. Công thức này là một phiên âm không chính xác của các kết quả trong (các) bài báo được trích dẫn bởi nhà thủy văn. Cụ thể,XY

(5)Var[xy]=(E[x])2Var[y]+(E[y])2Var[x]+2E[x]Cov[x,y2]+2E[y]Cov[x2,y]+2E[x]E[y]Cov[x,y]+Cov[x2,y2](Cov[x,y])2
Cov[x2,y2]là bản dịch sai của trong bài báo và tương tự cho và .E[(xE[x])2(yE[y])2]Cov[x2,y]Cov[x,y2]

Để tính toán trong trường hợp thông thường, cũng xem math.stackexchange.com/questions/668641/ phỏngE(X2Y2)
Samuel Reid
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.