Các phân phối trên góc phần tư k chiều dương với ma trận hiệp phương sai có thể tham số là gì?


12

Sau câu hỏi của zzk về vấn đề mô phỏng tiêu cực của anh ấy, tôi tự hỏi đâu là họ phân phối tham số trên góc phần tư k dương, R k + mà ma trận hiệp phương saiR+kΣ có thể đề ra.

Như đã thảo luận với zzk , bắt đầu từ một bản phân phối trên R+k và áp dụng tuyến tính biến XΣ1/2(Xμ)+μ không làm việc.

Câu trả lời:


6

Giả sử chúng ta có một véc tơ ngẫu nhiên bình thường đa biến

(logX1,,logXk)N(μ,Σ),
VớiμRkk×k đầy đủ cấp bậc đối xứng dương tính ma trận xác địnhΣ=(σij) .

Đối với lognormal (X1,,Xk) nó không phải là khó khăn để chứng minh rằng

mi:=E[Xi]=eμi+σii/2,i=1,,k,
cij:=Cov[Xi,Xj]=mimj(eσij1),i,j=1,,k,

và nó theo sau đó cij>mimj .

Do đó, chúng ta có thể đặt câu hỏi ngược lại: cho m=(m1,,mk)R+kk×k đối xứng tích cực nhất định ma trận C=(cij) , đáp ứng cij>mimj , nếu chúng ta để

μi=logmi12log(ciimi2+1),i=1,,k,
σij=log(cijmimj+1),i,j=1,,k,
chúng ta sẽ có một vectơ logic với các phương tiện và hiệp phương sai quy định.

Ràng buộc trên Cm tương đương với điều kiện tự nhiên E[XiXj]>0 .


Tuyệt vời, Paulo! Bạn có cả một giải pháp làm việc và điều kiện thích hợp trên ma trận hiệp phương sai, cũng trả lời câu hỏi này . Log-Normals chứng minh xử lý hơn so với gamma, cuối cùng.
Tây An

3

Trên thực tế, tôi có một giải pháp chắc chắn cho người đi bộ.

  1. Bắt đầu với X1Ga(α11,β1) và chọn hai tham số để phù hợp với các giá trị của E[X1] , var(X1) .
  2. Lấy và chọn ba thông số để phù hợp với các giá trị của E [ X 2 ] , var ( X 2 ) , và cov ( X 1 , X 2 ) .X2|X1Ga(α21X1+α22,β2)E[X2]var(X2)cov(X1,X2)
  3. Lấy và chọn bốn thông số để phù hợp với các giá trị của E [ X 3 ] , var ( X 3 ) , cov ( X 1 , X 3 )cov ( X 2 , XX3|X1,X2Ga(α31X1+α32X2+α33,β3)E[X3]var(X3)cov(X1,X3) .cov(X2,X3)

và v.v. Tuy nhiên, do các ràng buộc về các tham số và bản chất phi tuyến tính của phương trình mô men, có thể một số bộ khoảnh khắc tương ứng với không có bộ tham số nào được chấp nhận.

Ví dụ, khi , tôi kết thúc với các hệ phương trình β 1 = μ 1 / σ 2 1k=2

β1=μ1/σ12,α11μ1β1=0

(σ12+μ1μ2-

α22=μ2β2α21μ1,α21=(σ12+μ1μ2μ2)σ12+μ12μ1β2
Chạy một mã R với các giá trị tùy ý (và có thể chấp nhận priori) cho μ Σ dẫn đến nhiều trường hợp không có giải pháp. Một lần nữa, điều này không có ý nghĩa nhiều vì ma trận tương quan cho các bản phân phối trên R 2 + có thể có những hạn chế mạnh hơn mà chỉ là một yếu tố quyết định tích cực.
(σ12+μ1μ2μ2)2(σ12+μ12μ1)2σ12+μ2β2=σ22.
μΣR+2

update (04/04): deinst đã trả lời lại câu hỏi này như một câu hỏi mới trên diễn đàn toán học.


1
Một cách slighly mở rộng này là để xem xét các nguyên mũ gia đình Sau đó, giá trị trung bình và phương sai là gradient và Hessian của Một . Nếu h là một đa thức (có số mũ thực> -1) thì A là nhật ký của đa thức (với số mũ thực), và phương sai và Hessian là các hàm hữu tỷ. Tôi nghĩ rằng điều này cho đủ tự do để đại diện cho bất kỳ ma trận trung bình và hiệp phương sai.
f(X|θ)=h(x)eθTXA(θ).
AhA
deinst

@deinst: (+1) Do you have an example where this exponential family representation can be exploited straightforwardly?
Xi'an

2
(X,Y)FR+0<μ<ρP(X>2μ)>0, then a contradiction regarding the support must arise. No?
cardinal

1
There are certainly constraints on the covariance matrix Σ when the support is R+k, covered via the Stieltjes moment condition. Anyway, I do not see why a correlation close to -1 is excluded a priori.
Xi'an

2
Right, this is related to what I was getting at. Regarding the correlation, consider my example. If X and Y have the same marginal F with mean μ and a correlation of exactly -1 and P(X>2μ)>0, what must the value of Y be for all such realizations of X? (+1 on both question and answer. I like this.)
cardinal

2

OK, this is a response to Xi'an's comment. It is too long and has to much TeX to be a comfortable comment. Caveat Lector: It is virtually certain that I have made an algebra mistake. This does not seem to be quite as flexible as I first thought.

Let us create a family of distributions in R+3 of the form

f(x|θ)=h(x)eθTxA(θ)
Let x=(x,y,z) and θ=(θ1,θ2,θ3). Let
h(x)=cx1e11x2e21x3e31+dx1f11x2f21x3f31
be a two term polynomial where ei,fi are real numbers greater than 0 for all i. Then we find that
A(θ)=log(cΓ(e1)θ1e1Γ(e2)θ2e2Γ(e3)θ3e3+dΓ(f1)θ1f1Γ(f2)θ2f2Γ(f3)θ3f3).

Now, for convenience let us define

c=cΓ(e1)Γ(e2)Γ(e2)θ1f1θ2f2θ3f3
and
d=dΓ(f1)Γ(f2)Γ(f2)θ1e1θ2e2θ3e3

Now, as the mean of our distribution is the gradient of A, we have μX=e1c+f1dθ1(c+d), μY=e2c+f2dθ2(c+d), and μZ=e3c+f3dθ3(c+d). And as the covariance is the Hessian of A, we have

σX2=(e1c+f1d)(c+d)+(e1f1)2cdθ12(c+d)2
and
Cov(X,Y)=(e1f1)(e2f2)cdθ1θ2(c+d)
(the other terms of the covariance matrix obtained by changing subscripts in the obvious way).

This does not seem to be quite enough flexibility to get any covariance matrix. I need to try another term in the polynomial (but I suspect that also may not work (obviously I need to think about this more)).


Four parameters (θ1,θ2,θ3,c) for five constraints...?
Xi'an

@xian There are the 6 exponents ei and fi as well.
deinst

I am slightly (?) confused: you did not process the exponents as parameters of the exponential family. But indeed you can change those powers as you wish towards getting the 9 moment equations right.
Xi'an

@Xi'an You are correct, I did not process them as parameters of the exponential family. Doing so would have made the family no longer a natural family, and including them would have just muddled the algebra for comuting the moment equations (which was muddled enough to begin with).
deinst
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.