Phương sai của sản phẩm của k biến ngẫu nhiên tương quan


Câu trả lời:


12

Nhiều thông tin về chủ đề này hơn bạn có thể yêu cầu có thể được tìm thấy trong Goodman (1962): "Phương sai của sản phẩm của các biến ngẫu nhiên K" , đưa ra các công thức cho cả hai biến ngẫu nhiên độc lập và các biến ngẫu nhiên có khả năng tương quan, cùng với một số xấp xỉ. Trong một bài báo trước đó ( Goodman, 1960 ), công thức cho sản phẩm của chính xác hai biến ngẫu nhiên đã được rút ra, điều này có phần đơn giản hơn (mặc dù vẫn khá sởn gai ốc), vì vậy đó có thể là một nơi tốt hơn để bắt đầu nếu bạn muốn hiểu về đạo hàm .

Đối với sự đầy đủ, mặc dù, nó đi như thế này.

Hai biến

Giả sử như sau:

  • y là hai biến ngẫu nhiênxy
  • Y là những kỳ vọng (khác không) của họXY
  • V ( y ) là phương sai của chúngV(x)V(y)
  • (và tương tự như vậy cho δ y )δx=(xX)/Xδy
  • Di,j=E[(δx)i(δy)j]
  • (và tương tự như vậy đối với Δ y )Δx=xXΔy
  • Ei,j=E[(Δx)i(Δy)j]
  • là hệ số biến đổi bình phương: V ( x ) /G(x) (tương tự cho G ( Y ) )V(x)/X2G(Y)

Khi đó: hoặc tương đương:

V(xy)=(XY)2[G(y)+G(x)+2D1,1+2D1,2+2D2,1+D2,2D1,12]

V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12

Nhiều hơn hai biến

Bài báo năm 1960 cho thấy đây là một bài tập cho người đọc (dường như đã thúc đẩy bài báo năm 1962!).

Ký hiệu tương tự, với một vài phần mở rộng:

  • là biến ngẫu nhiên thay vì x y(x1,x2,xn)xy
  • M=E(i=1kxi)
  • A=(M/i=1kXi)1
  • = 0, 1 hoặc 2 cho i =sii=1,2,k
  • = số lượng 1 trong ( s 1 , s 2u(s1,s2,sk)
  • = số lượng 2 giây trong ( s 1 , s 2m(s1,s2,sk)
  • với m = 0 2 uD(u,m)=2u2m=02u với ,m>1
  • C(s1,s2,,sk)=D(u,m)E(i=1kδxisi)
  • chỉ ra tổng của 3 k - k - 1 bộ ( s 1 , s 2 , ... s k ) nơi 2 m + u > 1s1sk3kk1(s1,s2,sk)2m+u>1

Sau đó, cuối cùng:

V(i=1kxi)=Xi2(s1skC(s1,s2sk)A2)

Xem các giấy tờ để biết chi tiết và xấp xỉ dễ dàng hơn một chút!


xin lưu ý rằng câu trả lời trên của Matt Krause có lỗi cũng như bản thân bài báo. Trong định nghĩa của hàm C (s1, ..., sk), nó phải là một sản phẩm thay vì tổng.
Nicolas Gisler

Bạn có thể giải thích thêm một chút nữa không ..? "Bởi vì tôi - một người ẩn danh từ Internet - nói như vậy" thực sự không phải là một câu trả lời ...
Tim

Nếu bạn cố gắng lấy phương sai var (x * y) cho các biến ngẫu nhiên độc lập, thông qua công thức cho k tùy ý, bạn có thể thấy rằng chỉ một sản phẩm và không phải là một tổng cho bạn câu trả lời đúng. Ngoài ra, nếu bạn nhìn vào tờ giấy bạn cũng có thể thấy nó, trên trang 59 của tờ giấy (ít nhất là trong phiên bản của tôi), anh ấy đã sử dụng một sản phẩm thay vì một khoản tiền.
Nicolas Gisler

1
Đối với trường hợp có hai biến ngẫu nhiên, một công thức dễ đọc hơn cho phương sai của sản phẩm của hai biến ngẫu nhiên tương quan có thể được tìm thấy trong câu trả lời này bởi @macro. Câu trả lời này cũng chỉ ra vấn đề thiết yếu ở viz.,Tập hợp ký hiệu che giấu một thực tế thiết yếu là có các thuật ngữ trong đó có giá trị không thể xác định được trừ khi chúng ta biết cov( x 2 , y 2 ), hoặc đủ về khớp mật độ của hai biến ngẫu nhiên để xác định đại lượng này.
V(xy)=X2V(y)+Y2V(x)+2XYE1,1+2XE1,2+2YE2,1+E2,2E1,12,
(x2,y2)
Dilip Sarwate

Một đề xuất chỉnh sửa, đó thực sự nên là một bình luận, cho rằng bài báo gốc có một lỗi đánh máy trong đó một tổng và sản phẩm được trộn lẫn và câu trả lời này nên được sửa đổi. Xem số liệu thống kê.stackexchange.com/review/suggested
Silverfish

4

Chỉ để thêm vào câu trả lời tuyệt vời của Matt Krause (trên thực tế dễ dàng có được từ đó). Nếu x, y độc lập thì,

E1,1=E[(xE[x])(yE[y])]=Cov(x,y)=0E1,2=E[(xE[x])(yE[y])2]=E[xE(x)]E[(yE[y])2]=(E[x]E[x])E[(yE[y])2]=0E2,1=0E2,2=E[(xE[x])2(yE[y])2]=E[(xE[x])2]E[(yE[y])2=V[x]V[y]V[xy]=E[x]2V[y]+E[y]2V[x]+V[x]V[y]

1
The result for the case of n independent random variables has been discussed here.
Dilip Sarwate

3

In addition to the general formula given by Matt it may be worth noting that there is a somewhat more explicit formula for zero mean Gaussian random variables. It follows from Isserlis' theorem, see also Higher moments for the centered multivariate normal distribution.

Suppose that (x1,,xk) follows a multivariate normal distribution with mean 0 and covariance matrix Σ. If the number of variables k is odd, E(ixi)=0 and

V(ixi)=E(ixi2)=Σ~i,j
where Σ means sum over all partitions of {1,,2k} into k disjoint pairs {i,j} with each term being a product of the corresponding k Σ~i,j's, and where
Σ~=(ΣΣΣΣ)
is the covariance matrix for (x1,,xk,x1,,xk). If k is even,
V(ixi)=Σ~i,j(Σi,j)2.
In the case k=2 we get
V(x1x2)=Σ1,1Σ2,2+2(Σ1,2)2Σ1,22=Σ1,1Σ2,2+(Σ1,2)2.
If k=3 we get
V(x1x2x3)=Σi,jΣk,lΣr,t,
where there are 15 terms in the sum.

It is, in fact, possible to implement the general formula. The most difficult part appears to be the computation of the required partitions. In R, this can be done with the function setparts from the package partitions. Using this package it was no problem to generate the 2,027,025 partitions for k=8, the 34,459,425 partitions for k=9 could also be generated, but not the 654,729,075 partitions for k=10 (on my 16 GB laptop).

A couple of other things are worth noting. First, for Gaussian variables with non-zero mean it should be possible to derive an expression as well from Isserlis' theorem. Second, it is unclear (to me) if the above formula is robust against deviations from normality, that is, if it can be used as an approximation even if the variables are not multivariate normally distributed. Third, though the formulas above are correct, it is questionable how much the variance tells about the distribution of the products. Even for k=2 the distribution of the product is quite leptokurtic, and for larger k it quickly becomes extremely leptokurtic.


Neat approach! For what it's worth, the formula in my answer also has a combinatorial blow-up: the summation over C involves summing O(3k) terms.
Matt Krause
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.