Khi nào MCMC hữu ích?


12

Tôi gặp khó khăn trong việc hiểu cách tiếp cận MCMC thực sự hữu ích trong tình huống nào. Tôi đang xem qua một ví dụ về đồ chơi từ cuốn sách Kruschke "Thực hiện phân tích dữ liệu Bayes: Hướng dẫn với R và BUGS".

Những gì tôi hiểu cho đến nay là chúng ta cần một bản phân phối mục tiêu đó là tỷ lệ thuận với p(D|θ)p(θ) để có một mẫu của P(θ|D) . Tuy nhiên, đối với tôi, một khi chúng ta có p(D|θ)p(θ) chúng ta chỉ cần bình thường hóa phân phối để có được hậu thế, và hệ số chuẩn hóa có thể dễ dàng tìm thấy bằng số. Vì vậy, những trường hợp khi điều này là không thể?


2
Giả sử không phải là một đại lượng vô hướng mà thay vào đó là một vector θ có 10000 chiều. θθ
Jan Galkowski

1
Câu trả lời của tôi là một chút ngắn gọn. Để lấy hằng số, cần tính . Ngay cả trong trường hợp vô hướng, giả sử p ( D | θ ) thực sự rất khó khăn nên việc tích hợp rất khó thực hiện, thậm chí là bằng số. Sau đó, bạn có thể muốn sử dụng MCMC. p(D|θ)p(θ)p(D|θ)
Jan Galkowski

2
Một lời cảnh báo từ Alan Sokal: "Monte Carlo là một phương pháp cực kỳ tồi tệ, nó chỉ nên được sử dụng khi tất cả các phương pháp thay thế là tồi tệ nhất". Sau đó, anh bắt tay vào một phương pháp MC dài. stat.unc.edu/facemony/cji/Sokal.pdf
Yair Daon

1
@Yair: Nghe có vẻ như tôi là Sokal đang kênh Churchill.
Đức hồng y

1
Khi không có gì khác sẽ làm việc ...
kjetil b halvorsen 10/2/2015

Câu trả lời:


10

Tích hợp Monte Carlo là một dạng tích hợp số có thể hiệu quả hơn nhiều so với, ví dụ, tích hợp số bằng cách xấp xỉ tích phân với đa thức. Điều này đặc biệt đúng trong các kích thước cao, trong đó các kỹ thuật tích hợp số đơn giản đòi hỏi số lượng lớn các đánh giá chức năng. Để tính hằng số chuẩn hóa , chúng ta có thể sử dụng lấy mẫu quan trọng ,p(D)

p(D)=q(θ)q(θ)p(θ)p(Dθ)dθ1Nnwnp(θn)p(Dθn),

trong đó θ n được lấy mẫu từ q . Lưu ý rằng chúng ta chỉ cần đánh giá phân phối chung tại các điểm được lấy mẫu. Đối với q đúng , công cụ ước tính này có thể rất hiệu quả theo nghĩa yêu cầu rất ít mẫu. Trong thực tế, việc chọn một q thích hợp có thể khó khăn, nhưng đây là lúc MCMC có thể giúp đỡ! Lấy mẫu quan trọng (Neal, 1998) kết hợp MCMC với lấy mẫu quan trọng.wn=1/q(θn)θnqqq

Một lý do tại sao MCMC rất hữu ích là thế này: Chúng ta thường thậm chí không có quan tâm đến mật độ sau của , mà đúng hơn là trong thống kê tóm tắt và mong đợi , ví dụ:θ

p(θD)f(θ)dθ.

Biết thường không có nghĩa là chúng ta có thể giải được tích phân này, nhưng các mẫu là một cách rất thuận tiện để ước tính nó.p(D)

Cuối cùng, có thể đánh giá là một yêu cầu đối với một số phương pháp MCMC, nhưng không phải tất cả trong số họ (ví dụ, Murray et al, 2006. ).p(Dθ)p(θ)


Xin lỗi, nhưng điều này vẫn chưa rõ ràng với tôi. Câu hỏi của tôi là: nếu chúng ta chỉ cần nhân chúng ta sẽ có được một pdf không chuẩn hóa. Bằng cách chạy MCMC, chúng tôi có được một mẫu mà chúng tôi có thể ước tính pdf không chuẩn hóa. Nếu chúng ta muốn, chúng ta có thể bình thường hóa cả hai. Vì vậy, ĐÁNH GIÁ Tôi KHÔNG quan tâm đến bất kỳ số liệu thống kê tóm tắt nào, mà chỉ ở phần sau, tại sao chúng ta sử dụng MCMC ở vị trí đầu tiên? Như bạn nói, một số phương pháp MCMC không yêu cầu tính toán của p ( D | θ ) p ( θ )p(D|θ)p(θ)p(D|θ)p(θ), vì vậy tôi không đề cập đến những người. Theo tôi biết, hầu hết trong số họ yêu cầu tính toán của điều đó. Sự hữu ích của các phương pháp này là gì?
Vaaal

2
Khi chạy MCMC, bạn lấy một mẫu từ pdf đã chuẩn hóa để tránh tính toán hằng số chuẩn hóa. Và điều này là miễn phí.
Tây An

2
@Vaaal: Giả định của bạn rằng "hệ số chuẩn hóa có thể dễ dàng tìm thấy bằng số" chỉ giữ cho các phân phối đơn biến đơn giản. Đối với chiều cao , bình thường hóa p ( D | θ ) p ( θ ) là nói chung vô cùng khó khăn. Trong trường hợp này, MCMC vẫn có thể được sử dụng để ước tính hằng số chuẩn hóa (ví dụ: thông qua lấy mẫu quan trọng bị ủ). θp(Dθ)p(θ)
Lucas

6

Khi bạn có một trước và một khả năng f ( x | θ ) có hoặc không tính toán theo hình thức khép kín hoặc như vậy mà phân phối sau p ( θ | x ) α p ( θ ) f ( x | θ ) không phải là loại tiêu chuẩn, việc mô phỏng trực tiếp từ mục tiêu này theo hướng xấp xỉ Monte Carlo của phân phối sau là không khả thi. Một ví dụ điển hình được tạo ra từ các mô hình phân cấp với các linh mục không liên hợp, chẳng hạn như các mô hình được tìm thấy trong sách BUGS .p(θ)f(x|θ)

p(θ|x)p(θ)f(x|θ)

Phương pháp mô phỏng gián tiếp như chấp nhận-chối, tỷ lệ-of-thống nhất, hoặc kỹ thuật quan trọng lấy mẫu phong tục chạy vào số và độ chính xác khó khăn khi kích thước của tham số tăng vượt quá một vài đơn vị.θ

p(θ|x)

p(θ|x)

p(θ)f(x|θ)

p(θ)f(x|θ)g(z|θ,x)p(θ)f(x|θ)dz

Các phương pháp MCMC đã mang lại một phạm vi rộng hơn cho các phương pháp Bayes, như được minh họa bởi sự bùng nổ theo sau sự phổ biến của phương pháp bởi Alan Gelfand và Adrian Smith vào năm 1990.


Liên kết đến CUỐN SÁCH BUG không hoạt động nữa.
HelloWorld
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.