Các bước để tìm ra một phân phối sau khi nó có thể đủ đơn giản để có một hình thức phân tích?


12

Điều này cũng đã được hỏi tại Khoa học tính toán.

Tôi cố gắng để tính toán một ước tính Bayesian của một số hệ số cho một autoregression, với 11 mẫu dữ liệu:

Yi=μ+αYi1+ϵi
trong đóϵi là Gaussian với trung bình 0 và phương saiσe2 Phân phối trước trên vectơ(μ,α)t là Gaussian với trung bình(0,0) và ma trận hiệp phương sai chéo với các mục chéo đểσp2 .

Dựa trên công thức autoregression, phương tiện này mà sự phân bố của các điểm dữ liệu (các Yi ) là bình thường với trung bình và phương sai σ 2 e . Do đó, mật độ cho tất cả các điểm dữ liệu ( Y ) chung (giả sử tính độc lập, phù hợp với chương trình tôi đang viết), sẽ là: p ( Yμ+αYi1σe2(Y)

p(Y|(μ,α)t)=i=21112πσe2exp(YiμαYi1)22σe2.

Theo định lý của Bayes, chúng ta có thể lấy tích của mật độ trên với mật độ trước, và sau đó chúng ta sẽ chỉ cần hằng số chuẩn hóa. Linh cảm của tôi là điều này sẽ hoạt động thành phân phối Gaussian, vì vậy chúng ta có thể lo lắng về hằng số chuẩn hóa ở cuối thay vì tính toán rõ ràng với các tích phân trên α .μα

Đây là phần tôi gặp khó khăn. Làm cách nào để tôi tính toán nhân của mật độ trước (là đa biến) và sản phẩm này có mật độ dữ liệu đơn biến? Nhu cầu sau để được hoàn toàn mật độ α , nhưng tôi không thể nhìn thấy làm thế nào bạn sẽ nhận được rằng ra khỏi một sản phẩm như vậy.μα

Bất kỳ con trỏ nào cũng thực sự hữu ích, ngay cả khi bạn chỉ cho tôi đi đúng hướng và sau đó tôi cần phải đi và làm đại số lộn xộn (đó là những gì tôi đã cố gắng nhiều lần).

Là một điểm khởi đầu, đây là hình thức tử số theo quy tắc của Bayes:

1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2].

Vấn đề là làm thế nào để thấy rằng điều này làm giảm mật độ Gaussian của .(μ,α)t

Thêm

Cuối cùng, điều này dẫn đến vấn đề chung sau đây. Nếu bạn đang đưa ra một số biểu hiện như bậc hai làm thế nào để bạn đặt đó vào một hình thức bậc hai ( μ - μ , α - α ) Q ( μ - μ , α - α ) t đối với một số ma trận 2x2 Q

Aμ2+Bμα+Cα2+Jμ+Kα+L
(μμ^,αα^)Q(μμ^,αα^)tQ? Nó đủ đơn giản trong trường hợp dễ dàng, nhưng những gì quá trình bạn sử dụng để có được những ước tính trung α ?μ^α^

Lưu ý, tôi đã thử tùy chọn đơn giản là mở rộng công thức ma trận và sau đó thử đánh đồng các hệ số như trên. Vấn đề, trong trường hợp của tôi, là hằng số bằng 0, và cuối cùng tôi nhận được ba phương trình trong hai ẩn số, do đó, nó không được xác định để chỉ khớp với các hệ số (ngay cả khi tôi giả sử ma trận dạng bậc hai đối xứng).L


Câu trả lời của tôi cho [câu hỏi này] ( stats.stackexchange.com/questions/22852/ế ) có thể hữu ích. Lưu ý rằng bạn cần ưu tiên cho lần quan sát đầu tiên của mình - các lần lặp lại dừng ở đó.
xác suất

Tôi không thấy lý do tại sao tôi cần nó trong trường hợp này. Tôi phải xử lý các khoảng thời gian giống như chúng độc lập có điều kiện khi được quan sát. Lưu ý rằng tích của mật độ khớp chỉ từ . Tôi không nghĩ rằng tôi nên có một công thức được cập nhật liên tục ở đây, chỉ là một công thức duy nhất cho p sau ( ( μ , α ) ti=2..11 . p((μ,α)t|Y)
ely

Các "đa biến" trong trước không phải là mâu thuẫn với "đơn biến" trong mật độ dữ liệu, bởi vì họ là mật độ trong y i 's. p(α,μ)yi
Tây An

Câu trả lời:


7

Manh mối trong câu trả lời của tôi cho câu trả lời trước đó là xem cách tôi tích hợp các tham số - bởi vì bạn sẽ thực hiện chính xác các tích phân tương tự ở đây. Câu hỏi của bạn giả định các tham số phương sai đã biết, vì vậy chúng là hằng số. Bạn chỉ cần nhìn vào phụ thuộc vào tử số. Để thấy điều này, lưu ý rằng chúng ta có thể viết:α,μ

p(μ,α|Y)=p(μ,α)p(Y|μ,α)p(μ,α)p(Y|μ,α)dμdα
=1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]1(2πσe2)52πσp2exp[12σe2i=211(YiμαYi1)2μ22σp2α22σp2]dμdα

1(2πσe2)52πσp2exp[12σe2i=211Yi2] and it will also cancel. The integral we are left with is now (after expanding the squared term):

=exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]exp[10μ2+α2i=110Yi22μi=211Yi2αi=211YiYi1+2μαi=110Yi2σe2μ22σp2α22σp2]dμdα

Now we can use a general result from the normal pdf.

exp(az2+bzc)dz=πaexp(b24ac)
This follows from completing the square on az2+bz and noting that c does not depend on z. Note that the inner integral over μ is of this form with a=102σe2+12σp2 and b=i=211Yiαi=110Yiσe2 and c=α2i=110Yi22αi=211YiYi12σe2+α22σp2. After doing this integral, you will find that the remaining integral over α is also of this form, so you can use this formula again, with a different a,b,c. Then you should be able to write your posterior in the form 12π|V|12exp[12(μμ^,αα^)V1(μμ^,αα^)T] where V is a 2×2 matrix

Let me know if you need more clues.

update

(note: correct formula, should be 10μ2 instead of μ2)

if we look at the quadratic form you've written in the update, we notice there is 5 coefficients (L is irrelevant for posterior as we can always add any constant which will cancel in the denominator). We also have 5 unknowns μ^,α^,Q11,Q12=Q21,Q22. Hence this is a "well posed" problem so long as the equations are linearly independent. If we expand the quadratic (μμ^,αα^)Q(μμ^,αα^)t we get:

Q11(μμ^)2+Q22(αα^)2+2Q12(μμ^)(αα^)
=Q11μ2+2Q21μα+Q22α2(2Q11μ^+2Q12α^)μ(2Q22α^+2Q12μ^)α+
+Q11μ^2+Q22α^2+2Q12μ^α^

Comparing second order coefficient we get A=Q11,B=2Q12,C=Q22 which tells us what the (inverse) covariance matrix looks like. Also we have two slightly more complicated equations for α^,μ^ after substituting for Q. These can be written in matrix form as:

(2ABB2C)(μ^α^)=(JK)

Thus the estimates are given by:

(μ^α^)=(2ABB2C)1(JK)=14ACB2(BK2JCBJ2KA)

Showing that we do not have unique estimates unless 4ACB2. Now we have:

A=102σe2+12σp2B=i=110Yiσe2C=i=110Yi22σe2+12σp2J=i=211Yiσe2K=i=211YiYi1σe2

Note that if we define Xi=Yi1 for i=2,,11 and take the limit σp2 then the estimates for μ,α are given by the usual least squares estimate α^=i=211(YiY¯)(XiX¯)i=211(XiX¯)2 and μ^=Y¯α^X¯ where Y¯=110i=211Yi and X¯=110i=211Xi=110i=110Yi. So the posterior estimates are a weighted average between the OLS estimates and the prior estimate (0,0).


This isn't particularly helpful because I mentioned specifically that it's not the denominator that matters here. The denominator is just a normalizing constant, which will be obvious once you reduce the numerator to a Gaussian form. So tricks for evaluating the integrals in the denominator are mathematically really cool, but just not needed for my application. The only issue I need resolution with is manipulating the numerator.
ely

This answer gives you both numerator and denominator. The numerator exhibits the proper second degree polynomial in (α,μ) that leads to the normal quadratic form, as stressed by probabilityislogic.
Xi'an

@ems - by calculating the normalising constant you will construct the quadratic form required. it will contain the terms needed to compllete the square
probabilityislogic

I don't understand how this gives you the quadratic form. I've worked out the two integrals in the denominator using the Gaussian integral identity that you posted. In the end, I just get a huge, messy constant. There doesn't seem to be any clear way to take that constant and turn it into something times a determinant to the 1/2 power, etc. Not to mention I don't see how any of this explains how to calculate the new 'mean vector' (μ^,α^)t.. This is what I was asking for help for in the original question.
ely

Thanks tremendously for the detailed addition. I was making some silly errors when trying to do the algebra to figure out the quadratic form. Your comments about the relation to the OLS estimator are highly interesting and appreciated as well. I think this will speed up my code because I'll be able to draw samples from an analytic form that has built-in, optimized methods. My original plan was to use Metropolis-Hastings to sample from this, but it was very slow. Thanks!
ely
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.