Xuất phát các phân phối có điều kiện của phân phối chuẩn nhiều biến


114

Chúng tôi có một vectơ bình thường đa biến . Cân nhắc phân vùng và thành YN(μ,Σ)μY

μ=[μ1μ2]
Y=[y1y2]

với phân vùng tương tự Σ thành

[Σ11Σ12Σ21Σ22]
Sau đó, (y1|y2=a) , phân phối có điều kiện của phân vùng thứ nhất được cung cấp thứ hai, là N(μ¯,Σ¯) , với trung bình
μ¯=μ1+Σ12Σ221(aμ2)
và ma trận hiệp phương sai
Σ¯=Σ11Σ12Σ221Σ21

Trên thực tế, những kết quả này cũng được cung cấp trong Wikipedia, nhưng tôi không biết làm thế nào μ¯Σ¯ được dẫn xuất. Những kết quả này rất quan trọng, vì chúng là công thức thống kê quan trọng để lấy các bộ lọc Kalman . Có ai có thể cung cấp cho tôi các bước phái sinh của việc tạo ra μ¯Σ¯ không? Cảm ơn rât nhiều!


24
Ý tưởng là sử dụng định nghĩa về mật độ có điều kiện . Bạn biết rằng khớp là một biến số bivariate bình thường và biên là bình thường thì bạn chỉ cần thay thế các giá trị và thực hiện đại số khó chịu. Những ghi chú có thể là một số trợ giúp. Dưới đây là bằng chứng đầy đủ. f(y1|y2=a)=fY1,Y2(y1,a)fY2(a)fY1,Y2fY2

1
Liên kết thứ hai của bạn trả lời câu hỏi (+1). Tại sao không đặt nó làm câu trả lời @Procrastinator?
gui11aume

1
Tôi đã không nhận ra nó, nhưng tôi nghĩ rằng tôi đang ngầm sử dụng phương trình này trong PCA có điều kiện. PCA có điều kiện yêu cầu một phép biến đổi đang tính toán hiệu quả ma trận hiệp phương sai có điều kiện cho một số lựa chọn của A.(IA(AA)1A)Σ
John

@Procrastinator - cách tiếp cận của bạn thực sự đòi hỏi kiến ​​thức về nhận dạng ma trận Woodbury và kiến ​​thức về đảo ngược ma trận khối. Những kết quả này trong đại số ma trận phức tạp không cần thiết.
xác suất

2
@probabilityislogic Trên thực tế, kết quả được chứng minh trong liên kết tôi cung cấp. Nhưng thật đáng trân trọng nếu bạn thấy nó phức tạp hơn các phương pháp khác. Ngoài ra, tôi đã không cố gắng cung cấp một giải pháp tối ưu trong bình luận của mình . Ngoài ra, nhận xét của tôi là trước câu trả lời của Macro (mà tôi nêu lên như bạn có thể thấy).

Câu trả lời:


111

Bạn có thể chứng minh điều đó bằng cách tính toán rõ ràng mật độ có điều kiện bằng sức mạnh vũ phu, như trong liên kết của Procrastinator (+1) trong các bình luận. Nhưng, cũng có một định lý nói rằng tất cả các phân phối có điều kiện của một phân phối bình thường đa biến là bình thường. Do đó, tất cả những gì còn lại là tính toán vectơ trung bình và ma trận hiệp phương sai. Tôi nhớ chúng ta đã rút ra điều này trong một lớp chuỗi thời gian ở trường đại học bằng cách khéo léo xác định một biến thứ ba và sử dụng các thuộc tính của nó để rút ra kết quả đơn giản hơn là giải pháp vũ lực trong liên kết (miễn là bạn cảm thấy thoải mái với đại số ma trận). Tôi đang đi từ bộ nhớ nhưng nó là một cái gì đó như thế này:


Đặt là phân vùng đầu tiên và thứ hai. Bây giờ hãy xác định trong đó . Bây giờ chúng ta có thể viếtx1x2z=x1+Ax2A=Σ12Σ221

cov(z,x2)=cov(x1,x2)+cov(Ax2,x2)=Σ12+Avar(x2)=Σ12Σ12Σ221Σ22=0

Do đó và không tương quan và, vì chúng là bình thường chung, chúng độc lập . Bây giờ, rõ ràng , do đó, nó tuân theo điều đózx2E(z)=μ1+Aμ2

E(x1|x2)=E(zAx2|x2)=E(z|x2)E(Ax2|x2)=E(z)Ax2=μ1+A(μ2x2)=μ1+Σ12Σ221(x2μ2)

trong đó chứng minh phần đầu tiên. Đối với ma trận hiệp phương sai, lưu ý rằng

var(x1|x2)=var(zAx2|x2)=var(z|x2)+var(Ax2|x2)Acov(z,x2)cov(z,x2)A=var(z|x2)=var(z)

Bây giờ chúng ta gần xong rồi:

var(x1|x2)=var(z)=var(x1+Ax2)=var(x1)+Avar(x2)A+Acov(x1,x2)+cov(x2,x1)A=Σ11+Σ12Σ221Σ22Σ221Σ212Σ12Σ221Σ21=Σ11+Σ12Σ221Σ212Σ12Σ221Σ21=Σ11Σ12Σ221Σ21

trong đó chứng minh phần thứ hai.

Lưu ý: Đối với những người không quen thuộc với đại số ma trận được sử dụng ở đây, đây là một tài nguyên tuyệt vời .

Chỉnh sửa: Một thuộc tính được sử dụng ở đây không có trong sách nấu ăn ma trận (bắt tốt @FellingPig) là thuộc tính 6 trên trang wikipedia về ma trận hiệp phương sai: đó là hai vectơ ngẫu nhiên , Đối với vô hướng, tất nhiên, nhưng đối với các vectơ thì chúng khác nhau khi các ma trận được sắp xếp khác nhau.x,y

var(x+y)=var(x)+var(y)+cov(x,y)+cov(y,x)
cov(X,Y)=cov(Y,X)

Cảm ơn phương pháp tuyệt vời này! Có một đại số ma trận dường như không quen thuộc với tôi, tôi có thể tìm công thức mở đâu? Tôi đã không tìm thấy nó trên liên kết bạn gửi. var(x1+Ax2)
Lợn bay

@Fellingpig, bạn được chào đón. Tôi tin rằng đây là kết quả của các phương trình , kết hợp với một thuộc tính bổ sung của phương sai của tổng các vectơ ngẫu nhiên không được ghi trong Matrix Cookbook - Tôi đã thêm thực tế này vào câu trả lời của mình - cảm ơn vì đã nắm bắt cái đó! (291),(292)
Macro

13
Đây là một câu trả lời rất tốt (+1), nhưng có thể được cải thiện về mặt thứ tự của phương pháp này. Chúng tôi bắt đầu bằng cách nói rằng chúng tôi muốn kết hợp tuyến tính của toàn bộ vectơ độc lập / không tương thích với . Điều này là do chúng ta có thể sử dụng thực tế là có nghĩa là và . Chúng lần lượt dẫn đến các biểu thức cho và . Điều này có nghĩa chúng ta nên . Bây giờ chúng tôi yêu cầu . Nếu không thể đảo ngược thì chúng ta sẽ cóz=Cx=C1x1+C2x2x2p(z|x2)=p(z)var(z|x2)=var(z)E(z|x2)=E(z)var(C1x1|x2)E(C1x1|x2)C1=Icov(z,x2)=Σ12+C2Σ22=0Σ22C2=Σ12Σ221 .
xác suất

1
@jakeoung - không chứng minh rằng , nó đang đặt nó thành giá trị này, để chúng ta có được một biểu thức có chứa các biến mà chúng ta muốn biết. C1=I
xác suất

1
@jakeoung Tôi cũng không hiểu lắm về câu nói đó. Tôi hiểu theo cách này: Nếu , thì . Vì vậy, giá trị của bằng cách nào đó là một thang đo tùy ý. Vì vậy, chúng tôi đặt để đơn giản. cov(z,x2)=0cov(C11z,x2)=C11cov(z,x2)=0C1C1=I
Ken T

6

Câu trả lời của Macro rất hay, nhưng đây là một cách thậm chí đơn giản hơn mà không yêu cầu bạn sử dụng bất kỳ định lý bên ngoài nào để khẳng định phân phối có điều kiện. Nó liên quan đến việc viết khoảng cách Mahanalobis dưới dạng phân tách biến đối số cho câu lệnh điều hòa, và sau đó tính hệ số mật độ bình thường cho phù hợp.


Viết lại khoảng cách Mahanalobis cho một vectơ có điều kiện: Đạo hàm này sử dụng công thức đảo ngược ma trận sử dụng phần bù Schur . Trước tiên, chúng tôi sử dụng công thức đảo ngược khối để viết ma trận phương sai nghịch đảo là:ΣS=Σ11Σ12Σ221Σ21

Σ1=[Σ11Σ12Σ21Σ22]1=[Σ11Σ12Σ21Σ22],

Ở đâu:

Σ11=ΣS1 Σ12=ΣS1Σ12Σ221,Σ21=Σ221Σ12ΣS1Σ22=Σ221Σ12ΣS1Σ12Σ221. 

Sử dụng công thức này bây giờ chúng ta có thể viết khoảng cách Mahanalobis là:

(yμ)TΣ1(yμ)=[y1μ1y2μ2]T[Σ11Σ12Σ21Σ22][y1μ1y2μ2]=(y1μ1)TΣ11(y1μ1)+(y1μ1)TΣ12(y2μ2)+(y2μ2)TΣ21(y1μ1)+(y2μ2)TΣ22(y2μ2)=(y1(μ1+Σ12Σ221(y2μ2)))TΣS1(y1(μ1+Σ12Σ221(y2μ2)))=(y1μ)TΣ1(y1μ),

Ở đâu:

μμ1+Σ12Σ221(y2μ2),ΣΣ11Σ12Σ221Σ21.

Lưu ý rằng kết quả này là kết quả chung không giả định tính quy phạm của các vectơ ngẫu nhiên. Nó đưa ra một cách hữu ích để đóng khung lại khoảng cách Mahanalobis sao cho nó là một hình thức bậc hai đối với chỉ một trong các vectơ trong phân rã (với cái khác được hấp thụ vào ma trận trung bình và ma trận phương sai).


Xuất phát phân phối có điều kiện: Bây giờ chúng ta có dạng trên cho khoảng cách Mahanalobis, phần còn lại là dễ dàng. Chúng ta có:

p(y1|y2,μ,Σ)y1p(y1,y2|μ,Σ)=N(y|μ,Σ)y1exp(12(yμ)TΣ1(yμ))=exp(12(y1μ)TΣ1(y1μ))y1N(y1|μ,Σ).

Điều này xác định rằng phân phối có điều kiện cũng là đa biến thông thường, với vectơ trung bình có điều kiện và ma trận phương sai điều kiện được chỉ định.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.