MCMC với thuật toán Metropolis-Hastings: Chọn đề xuất


11

Tôi cần phải thực hiện một mô phỏng để đánh giá tích phân của hàm 3 tham số, chúng ta nói , có công thức rất phức tạp. Nó được yêu cầu sử dụng phương pháp MCMC để tính toán nó và thực hiện thuật toán Metropolis-Hastings để tạo ra các giá trị được phân phối dưới dạng , và nó được đề xuất sử dụng 3 biến đổi bình thường làm phân phối đề xuất. Đọc một số ví dụ về nó, tôi đã thấy rằng một số sau đó sử dụng bình thường với các tham số cố định và một số sử dụng với một biến có nghĩa là , trong đó là giá trị được chấp nhận cuối cùng như phân phối theo . Tôi có một số nghi ngờ về cả hai cách tiếp cận:f N ( μ , σ ) N ( X , σ ) X fffN(μ,σ)N(X,σ)Xf

1) Ý nghĩa của việc chọn giá trị được chấp nhận cuối cùng là giá trị trung bình mới của phân phối đề xuất của chúng tôi là gì? Trực giác của tôi nói rằng cần đảm bảo rằng các giá trị của chúng tôi sẽ gần hơn với các giá trị được phân phối dưới dạng và cơ hội chấp nhận sẽ lớn hơn. Nhưng nó không tập trung quá nhiều mẫu của chúng tôi? Có đảm bảo rằng, nếu tôi lấy được nhiều mẫu hơn, chuỗi sẽ trở thành ổn định?f

2) Sẽ không chọn các tham số cố định (vì rất khó phân tích) có thực sự khó khăn và phụ thuộc vào mẫu đầu tiên chúng ta cần chọn để bắt đầu thuật toán không? Trong trường hợp này, cách tiếp cận tốt nhất để tìm ra cái nào tốt hơn?f

Là một trong những cách tiếp cận tốt hơn so với phương pháp khác hay điều này phụ thuộc vào trường hợp?

Tôi hy vọng những nghi ngờ của tôi đã rõ ràng và tôi sẽ rất vui nếu có thể đưa ra một số tài liệu (tôi đã đọc một số bài viết về chủ đề này, nhưng nhiều hơn là tốt hơn!)

Cảm ơn trước!

Câu trả lời:


8

1) Bạn có thể nghĩ về phương pháp này như một phương pháp đi bộ ngẫu nhiên. Khi phân phối đề xuất , nó thường được gọi là Thuật toán đô thị. Nếu quá nhỏ, bạn sẽ có tỷ lệ chấp nhận cao và rất chậm khám phá phân phối mục tiêu. Trên thực tế, nếu quá nhỏ và phân phối là đa phương thức, bộ lấy mẫu có thể bị kẹt trong một chế độ cụ thể và sẽ không thể khám phá hoàn toàn phân phối mục tiêu. Mặt khác, nếu quá lớn, tỷ lệ chấp nhận sẽ quá thấp. Vì bạn có ba chiều, phân phối đề xuất của bạn sẽ có ma trận hiệp phương saixxtN(xt,σ2)σ2σ2σ2Σmà có thể sẽ yêu cầu phương sai và hiệp phương sai khác nhau cho mỗi chiều. Chọn một thích hợp có thể khó khăn.Σ

2) Nếu phân phối đề xuất của bạn luôn là , thì đây là thuật toán độc lập của Metropolis-Hastings vì phân phối đề xuất của bạn không phụ thuộc vào mẫu hiện tại của bạn. Phương pháp này hoạt động tốt nhất nếu phân phối đề xuất của bạn là một xấp xỉ tốt của phân phối mục tiêu bạn muốn lấy mẫu từ đó. Bạn đúng rằng việc chọn một xấp xỉ bình thường tốt có thể khó khăn.N(μ,σ2)

Thành công của cả hai phương pháp đều không phụ thuộc vào giá trị bắt đầu của bộ lấy mẫu. Bất kể bạn bắt đầu từ đâu, chuỗi Markov cuối cùng sẽ hội tụ đến phân phối mục tiêu. Để kiểm tra sự hội tụ, bạn có thể chạy một số chuỗi từ các điểm bắt đầu khác nhau và thực hiện chẩn đoán hội tụ, chẳng hạn như chẩn đoán hội tụ Gelman-Rubin.


Tôi không chắc chắn rằng tuyên bố: "2) Nếu phân phối đề xuất của bạn luôn là , thì đây là thuật toán độc lập của Metropolis-Hastings vì phân phối đề xuất của bạn không phụ thuộc vào mẫu hiện tại của bạn: "Là đúng bởi vì không vẽ các mẫu từ đối xứng và do đó, điều này sẽ được gọi chính xác hơn là thuật toán Metropolis, thay vì thuật toán Hắc ám. Tôi không hoàn toàn chắc chắn về bản thân mình nên tôi cũng đặt câu hỏi. N(μ,σ2)N(μ,σ2)
vần điệu

@rhody. Thuật toán Metropolis không bỏ điều hòa vào vị trí hiện tại của bạn. Toàn bộ vấn đề là từ từ đi lang thang xung quanh không gian tham số với một đề xuất đối xứng từ vị trí hiện tại của bạn. Sử dụng bất kỳ đề xuất đối xứng nào phụ thuộc vào vị trí hiện tại của bạn và tính toán xác suất chấp nhận của Đô thị, cuối cùng bạn sẽ hội tụ vào phân phối mục tiêu. Đối với thuật toán Metropolis-Hastings độc lập, bạn muốn phân phối đề xuất của mình là xấp xỉ phân phối mục tiêu và bạn sử dụng một phép tính khác cho xác suất chấp nhận.
JSK

@rhody. Ngoài ra, sự thật là phân phối chuẩn là phân phối đối xứng, nhưng đó không phải là loại đối xứng được đề cập ở đây. Nếu q là phân phối đề xuất của bạn, thì phân phối đề xuất là đối xứng nếu q (Y | X) = q (X | Y). Nếu , sau đó q là không đối xứng vì cho tất cả và . qN(μ,σ2)q(Y)q(X)XY
JSK

@jsk được coi là đối xứng, phải không? xN(x,ε)
user76284
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.