Ước tính phân bố hiệp phương sai của một gaussian đa biến


15

Tôi cần "học" phân phối một gaussian bivariate với một vài mẫu, nhưng một giả thuyết tốt về phân phối trước, vì vậy tôi muốn sử dụng phương pháp bayesian.

Tôi định nghĩa trước của tôi:

P(μ)N(μ0,Σ0)
μ0=[00]   Σ0=[160027]

Và phân phối của tôi đưa ra giả thuyết

P(x|μ,Σ)N(μ,Σ)
μ=[00]   Σ=[180018]

Bây giờ tôi biết nhờ vào đây để ước tính giá trị trung bình của dữ liệu

P(μ|x1,,xn)N(μ^n,Σ^n)

Tôi có thể tính toán:

μ^n=Σ0(Σ0+1nΣ)1(1ni=1nxi)+1nΣ(Σ0+1nΣ)1μ0

Σ^n=1nΣ0(Σ0+1nΣ)1Σ

Bây giờ đến câu hỏi, có lẽ tôi là sai, nhưng có vẻ như với tôi rằng chỉ là ma trận hiệp phương sai cho tham số ước lượng μ n , và không phải là hiệp phương sai dữ liệu ước tính của tôi. Những gì tôi muốn là cũng sẽ tính toánΣnμn

P(Σn1|x1,,xn)

để có một phân phối được chỉ định đầy đủ học được từ dữ liệu của tôi.

Điều này có thể không? Là nó đã giải quyết bằng cách tính toán và nó chỉ thể hiện bằng cách sai công thức trên (hay tôi chỉ đơn giản là misentrepreting nó)? Tài liệu tham khảo sẽ được đánh giá cao. Cảm ơn rất nhiều.Σn

BIÊN TẬP

Từ những ý kiến, nó xuất hiện rằng cách tiếp cận của tôi là "sai", theo nghĩa rằng tôi đã giả định một hiệp phương sai không đổi, được định nghĩa bởi . Những gì tôi cần là nên đặt một trước cũng trên đó, P ( Σ ) , nhưng tôi không biết những gì tôi nên sử dụng phân phối, và sau đó các thủ tục để cập nhật nó là gì.ΣP(Σ)


Bạn đã chỉ định hiệp phương sai của dữ liệu của mình là - và bạn chưa chỉ định phân phối trước cho dữ liệu đó được cập nhật từ đâu? Σ=[180018]
Corone

Tôi thấy điểm của bạn. Vì vậy, với cách tiếp cận của tôi, về cơ bản tôi đã giả định rằng phương sai là không đổi và được chỉ định. Nếu tôi muốn ước tính nó, tôi cần có trước. Bây giờ, vấn đề của tôi là nó không rõ ràng làm thế nào để xác định nó, và những gì sẽ là một phân phối thích hợp cho nó, nhưng điều này có vẻ là ra khỏi phạm vi của câu hỏi đầu tiên . P(Σ)F(μΣ,ΣΣ)
unziberla

Sau đó thay đổi câu hỏi :-)
Corone

Câu trả lời:


11

Bạn có thể thực hiện cập nhật Bayes cho cấu trúc hiệp phương sai theo tinh thần giống như bạn đã cập nhật giá trị trung bình. Liên hợp trước cho ma trận hiệp phương sai của đa biến-bình thường là phân phối nghịch đảo-Wishart, do đó, thật hợp lý khi bắt đầu từ đó,

P(Σ)W1(Ψ,ν)

Sau đó, khi bạn lấy mẫu có độ dài n, bạn có thể tính ước lượng hiệp phương sai mẫu Σ X = 1XnΣX=1n(Xμ)(Xμ)

Điều này sau đó có thể được sử dụng để cập nhật ước tính của bạn về ma trận hiệp phương sai

P(Σ|X)W1(nΣX+Ψ,n+ν)

Bạn có thể chọn sử dụng giá trị trung bình của giá trị này làm ước tính điểm của mình cho hiệp phương sai (Công cụ ước tính trung bình sau)

E[Σ|X]=nΣX+Ψν+np1

hoặc bạn có thể chọn sử dụng chế độ (Công cụ ước tính Posteriori tối đa)

Mode[Σ|X]=nΣX+Ψν+n+p+1


Thanks a lot. Now I assume something will change in my estimation process. As a first step, I should estimate the covariance Σ^ with your procedure, then my distribution given the estimated hypothesis woulb be P(X|μ,Σ^) and since Σ^ is estimated and has its own distribution I am pretty sure this will somehow change my previous formula to compute μ^n (as it happens on gaussian MLE when using the sample variance).
unziberla

The approach that you describe would be instead to use Σ^= =E[Σ|x1Giáo dụcxn]để tôi có một giá trị thực tế cho hiệp phương sai, như thể tôi biết nó trước đây. Theo cách tiếp cận thường xuyên, điều này nghe có vẻ sai, nhưng có lẽ có điều gì đó mà tôi đang thiếu từ thực tế là tôi cho rằng trước đó đã biết và điều này làm cho thủ tục đúng?
unziberla

7

Ok, tôi tìm thấy giải pháp thực sự cho vấn đề của tôi. Tôi đang đăng nó ngay cả khi câu trả lời đúng cho câu hỏi (đặt sai chỗ) của tôi là câu được chọn.

Về cơ bản, câu hỏi của tôi giải thích làm thế nào để ước tính giá trị trung bình khi biết hiệp phương sai và câu trả lời làm thế nào để ước lượng hiệp phương sai biết giá trị trung bình. Nhưng vấn đề thực tế của tôi là ước tính với cả hai tham số chưa biết.

I found the answer on Wikipedia with the derivation explained here. The multivariate normal's conjugated prior is the Normal-inverse-Wishart, that is basically a distribution over multivariate Normals.

The prior parameters that need to be specified are μ0 to define the mean, Ψ to define the covariance, and two scalar values κ0 and ν0 that I would say define how confident we are on the estimation of the first two parameters respectively.

The updated distribution after observing n samples of a p-variate Normal has the form

P(μ,Σ|X)NIW(κ0μ0+nx¯κ0+n,κ0+n,ν0+n,Ψ+C+κ0nκ0+n(x¯μ0)(x¯μ0)T)

where

x¯=1ni=0nxi

C=i=1n(xix¯)(xix¯)T

so my desired estimated parameters are

E(μ|X)=κ0μ0+nx¯κ0+n
E(Σ|X)=Ψ+C+κ0nκ0+n(x¯μ0)(x¯μ0)Tν0+np1
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.