Giả sử tôi lấy trung bình của phân phối sau thay vì một mẫu ngẫu nhiên từ nó, đây có phải là cái thường được gọi là Rao-Blackwellization không?
Tôi không quen thuộc lắm với các mô hình biến động ngẫu nhiên, nhưng tôi biết rằng trong hầu hết các cài đặt, lý do chúng tôi chọn thuật toán Gibbs hoặc MH để vẽ từ phía sau, là vì chúng tôi không biết hậu thế. Thông thường chúng tôi muốn ước tính trung bình sau và vì chúng tôi không biết trung bình sau, chúng tôi vẽ các mẫu từ phía sau và ước tính nó bằng trung bình mẫu. Vì vậy, tôi không chắc chắn làm thế nào bạn có thể lấy giá trị trung bình từ phân phối sau.
Thay vào đó, công cụ ước tính Rao-Blackwellized phụ thuộc vào o kiến thức về giá trị trung bình của điều kiện đầy đủ; nhưng ngay cả sau đó lấy mẫu vẫn được yêu cầu. Tôi giải thích thêm dưới đây.
Giả sử phân bố sau được xác định trên hai biến, ), chẳng hạn mà bạn muốn ước tính sau có nghĩa là: E [ θ | dữ liệu ] . Bây giờ, nếu có sẵn bộ lấy mẫu Gibbs, bạn có thể chạy thuật toán đó hoặc chạy thuật toán MH để lấy mẫu từ phía sau.θ = ( μ , φE[ Q | dữ liệu ]
Nếu bạn có thể chạy một sampler Gibbs, sau đó bạn biết trong hình thức đóng cửa và bạn biết giá trị trung bình của phân phối này. Đặt đó có nghĩa là ϕ ∗ . Lưu ý rằng ϕ ∗ là hàm của μ và dữ liệu.f( Φ | L , da t a )φ*φ*μ
Điều này cũng có nghĩa là bạn có thể tích hợp ra từ sau, vì vậy sau biên của μ là f ( μ | d một t một ) (điều này vẫn chưa được biết đầy đủ, nhưng được biết đến tối đa là một hằng số). Bây giờ bạn muốn bây giờ chạy một chuỗi Markov mà f ( L | d một t một ) là phân phối bất biến, và bạn lấy mẫu từ sau biên này. Câu hỏi làφμf( μ ∣ da t a )f( μ ∣ da t a )
Làm thế nào bạn có thể hiện nay ước tính giá trị trung bình sau của chỉ sử dụng những mẫu từ sau biên của μ ?φμ
Điều này được thực hiện thông qua Rao-Blackwellization.
E[ ϕ ∣ dmột t a ]= ∫φf( μ , ϕ ∣ da t a ) dμdφ= ∫φf( Φ | L , da t a ) f( μ ∣ da t a ) dμdφ= ∫φ*f( μ ∣ da t a ) dμ .
Như vậy giả sử chúng ta đã thu được mẫu từ sau biên của μ . Sau đó
φ = 1X1, X2, ... XNμ
φ^= 1NΣi = 1Nφ*( XTôi) ,
được gọi là công cụ ước tính Rao-Blackwellized cho . Điều tương tự có thể được thực hiện bằng cách mô phỏng từ các lề chung.φ
Ví dụ (Hoàn toàn để trình diễn).
Giả sử bạn có một sau chưa biết chung cho mà từ đó bạn muốn mẫu. Dữ liệu của bạn là một số y , và bạn có các điều kiện đầy đủ sau
L | φ , y ~ N ( φ 2 + 2 y , y 2 ) φ | μ , y ~ G một m m một ( 2 μ + y , y + 1 )θ = ( μ , φ )y
μ ∣ ϕ , y~ N( ϕ2+ 2 y, y2)
ϕ ∣ μ , y∼ G a m m a ( 2 μ + y, y+ 1 )
Bạn chạy sampler Gibbs sử dụng các điều kiện, và các mẫu thu được từ hậu nghiệm kết hợp . Hãy để những mẫu được ( μ 1 , φ 1 ) , ( μ 2 , φ 2 ) , ... , ( μ N , φ N ) . Bạn có thể tìm thấy giá trị trung bình mẫu của φ s, và đó sẽ là những ước lượng Monte Carlo thông thường cho giá trị trung bình sau cho φ ..f( Μ , φ | y)( μ1, φ1) , ( μ2, φ2) , Tầm , ( μN, φN)φφ
E[ ϕ | μ , y] = 2 μ + yy+ 1= ϕ*.
y
φ^= 1NΣi = 1N2 μTôi+ yy+ 1.
φφμ