Làm thế nào để ABC và MCMC khác nhau trong các ứng dụng của họ?


15

Theo hiểu biết của tôi, tính toán gần đúng Bayes (ABC) và Markov Chain Monte Carlo (MCMC) có mục tiêu rất giống nhau. Dưới đây tôi mô tả sự hiểu biết của tôi về các phương pháp này và cách tôi nhận thấy sự khác biệt trong ứng dụng của chúng đối với dữ liệu thực tế.

Tính toán gần đúng Bayes

ABC bao gồm lấy mẫu một tham số từ trước, thông qua mô phỏng số tính toán một thống kê x i được so sánh với một số x o b s được quan sát . Dựa trên thuật toán loại bỏ, x i được giữ lại hoặc từ chối. Danh sách giữ lại x i s đã phân phối sau.θxixobsxixi

Chuỗi Markov Monte Carlo

MCMC gồm tại lấy mẫu phân phối trước của tham số . Phải mất một mẫu đầu tiên θ 1 , tính toán P ( x o b s | θ 1 ) P ( θ 1 ) và sau đó nhảy (theo một số quy tắc) đến một giá trị mới θ 2P ( x o b s | θ 2 ) P ( θ 2 ) được tính một lần nữa. Tỷ lệ P ( x o b sθθ1P(xobs|θ1)P(θ1)θ2P(xobs|θ2)P(θ2) được tính toán và tùy thuộc vào một số giá trị ngưỡng, nhảy tiếp theo sẽ xảy ra từ đầu hoặc vị trí thứ hai. Các thăm dò củaθgiá trị đi một và một và cuối cùng, sự phân bố của giữ lạiθgiá trị là phân phối sauP(θ|x)(vì một lý do đó là vẫn chưa được biết với tôi).P(xobs|θ2)P(θ2)P(xobs|θ1)P(θ1)θθP(θ|x)

Tôi nhận ra rằng những giải thích của tôi bỏ lỡ để thể hiện sự đa dạng của các phương pháp tồn tại theo từng điều khoản này (đặc biệt là đối với MCMC).

ABC vs MCMC (ưu và nhược điểm)

ABC có lợi thế mà người ta không cần để có thể phân tích giải quyết . Vì vậy, ABC thuận tiện cho mô hình phức tạp nơi MCMC sẽ không thực hiện được.P(x|θ)P(θ)

MCMC cho phép thực hiện các kiểm tra thống kê (kiểm tra tỷ lệ khả năng, kiểm tra G, ...) trong khi tôi không nghĩ rằng điều này là khả thi với ABC.

Tôi có đúng cho đến nay?

Câu hỏi

  • Làm thế nào để ABC và MCMC khác nhau trong các ứng dụng của họ? Làm thế nào để một người quyết định sử dụng một hoặc một phương pháp khác?

1
"MCMC bao gồm lấy mẫu phân phối trước của tham số." Trong khi một người chắc chắn có thể làm điều này, nó không cần thiết, thậm chí không mong muốn trong hầu hết các trường hợp. Đối với nhiều ứng dụng MCMC, chúng tôi lấy mẫu θ2 từ phân phối ứng viên tập trung vào khoảng 1 (ví dụ: một gaussian có độ lệch chuẩn nhỏ), sau đó tính tỷ lệ chấp nhận / từ chối như bạn đã đề cập ở trên. Điều này trái ngược với ABC, nơi chúng tôi lấy mẫu từ trước (và đây là cách duy nhất để kết hợp thông tin trước trong ABC, nói chung).
z_dood

Câu trả lời:


12

Một số ý kiến ​​bổ sung trên đầu câu trả lời của Bjorn:

  1. ABC lần đầu tiên được giới thiệu bởi Rubin (1984) như là một lời giải thích về bản chất của suy luận Bayes, thay vì cho mục đích tính toán. Trong bài báo này, ông đã giải thích cách phân phối lấy mẫu và phân phối trước tương tác với nhau để tạo ra phân phối sau.

  2. ABC tuy nhiên chủ yếu được khai thác vì lý do tính toán. Các nhà di truyền học dân số đã đưa ra phương pháp trên các mô hình dựa trên cây trong đó khả năng của mẫu quan sát là không thể tìm thấy. Các lược đồ MCMC (Tăng cường dữ liệu) có sẵn trong các cài đặt như vậy rất kém hiệu quả và lấy mẫu rất quan trọng, ngay cả với một tham số của một chiều ... Ở cốt lõi của nó, ABC là một thay thế cho các phương pháp Monte Carlo như MCMC hoặc PMC khi những người không có sẵn cho tất cả các mục đích thực tế. Khi chúng có sẵn, ABC xuất hiện dưới dạng proxy có thể được sử dụng để hiệu chỉnh chúng nếu nó chạy nhanh hơn.

  3. Trong một viễn cảnh hiện đại hơn, cá nhân tôi coi ABC là một phương pháp suy luận gần đúng hơn là một kỹ thuật tính toán. Bằng cách xây dựng một mô hình gần đúng, người ta có thể rút ra suy luận về tham số quan tâm mà không nhất thiết phải dựa vào một mô hình chính xác. Mặc dù một số mức độ xác nhận là cần thiết trong cài đặt này, nhưng nó không có giá trị thấp hơn so với thực hiện tính trung bình của mô hình hoặc không tham số. Trong thực tế, ABC có thể được coi là một loại thống kê Bayes không tham số đặc biệt.

  4. Cũng có thể chỉ ra rằng (nhiễu) ABC là một cách tiếp cận Bayes được xác định rõ ràng hoàn toàn nếu thay thế mô hình ban đầu và dữ liệu bằng một nhiễu. Như vậy, nó cho phép tất cả các suy luận Bayes có thể nghĩ ra. Bao gồm cả thử nghiệm. Đầu vào của chúng tôi cho cuộc tranh luận về ABC và kiểm tra giả thuyết là mô hình gần đúng ABC có thể được trang bị kém để đánh giá mức độ phù hợp của một giả thuyết được cung cấp dữ liệu, nhưng không nhất thiết , cũng giống như hầu hết các ứng dụng của ABC trong dân số di truyền học quan tâm đến sự lựa chọn mô hình.

  5. Trong một viễn cảnh gần đây hơn, chúng ta có thể thấy ABC là một phiên bản suy luận gián tiếp của Bayes trong đó các tham số của mô hình thống kê có liên quan đến các khoảnh khắc của một thống kê được xác định trước. Nếu thống kê này là đủ (hoặc đủ theo nghĩa địa phương) để xác định các tham số này, ABC có thể được hiển thị để hội tụ đến giá trị thực của các tham số với số lượng quan sát.


2
Tôi đã kiểm tra câu trả lời này nhưng muốn khuyên bạn nên đọc câu trả lời của @ Bjorn trước (+1) và sau đó là câu trả lời của Xi'an.
Remi.b

12

P(x|θ)θdữ liệu mô phỏng thường xuyên nhất (xấp xỉ) khớp với dữ liệu được quan sát (với các giá trị được đề xuất, ví dụ được rút ngẫu nhiên từ trước đó). Đối với các trường hợp đơn giản, chẳng hạn như một biến ngẫu nhiên nhị thức đơn có kích thước mẫu không quá lớn, bạn thậm chí có thể yêu cầu khớp chính xác và trong những trường hợp đó, thực sự không có gì bạn không thể làm với các mẫu sau này mà bạn không thể làm với mẫu MCMC tiêu chuẩn. Đối với các tình huống phức tạp hơn với liên tục (ngay cả đối với các kết quả rời rạc đa biến) và các kết quả đa biến có khả năng yêu cầu một kết quả khớp chính xác là không còn khả thi.

Trên thực tế, có các phiên bản MCMC của ABC, giải quyết vấn đề rằng nếu bạn có trước đó không giống với mẫu sau (ví dụ vì mẫu trước rất không chính xác) bằng cách vẽ từ trước là cực kỳ không hiệu quả, bởi vì bạn rất hiếm khi có được một kết hợp chặt chẽ giữa dữ liệu quan sát và dữ liệu mô phỏng.

P(x|θ)P(x|θ)P(x|θ)không có sẵn phân tích. Tất nhiên, có thể có một số tùy chọn có thể khác trong các trường hợp như vậy (ví dụ INLA, xấp xỉ bậc hai theo khả năng, v.v.) có thể hiệu quả / thành công hơn cho các vấn đề cụ thể. Theo một cách nào đó, bất kỳ hạn chế nào trong những gì bạn có thể làm với các mẫu sau của ABC đều xuất phát từ việc chỉ yêu cầu một sự trùng khớp giữa dữ liệu thực tế và dữ liệu mô phỏng (nếu bạn có thể yêu cầu một kết hợp chính xác, sẽ không có vấn đề gì cả). Có một số bài viết giới thiệu hay, ví dụ bài báo này của Marin et al. (2012) . Ít nhất một trong số các đồng tác giả (@ Xi'an) là người đóng góp tích cực ở đây và tôi cũng thích ở đây những suy nghĩ của anh ấy - tôi tin rằng anh ấy có thể nói nhiều hơn về chủ đề thử nghiệm.


Tôi hy vọng tôi đã quản lý để sửa liên kết ngay bây giờ (bây giờ nó hoạt động với tôi).
Bjorn

1
(+1) điểm rất tốt!
Tây An

1
"Khi P (x | θ) có sẵn về mặt phân tích, tôi cho rằng gần như luôn luôn có thể sử dụng MCMC tiêu chuẩn." Gần, nhưng không phải lúc nào. Hãy tưởng tượng một cái có cỡ mẫu rất lớn (10 ^ 9) kết hợp với nhiều tham số. Nó trở nên rất tốn kém để tính toán lại khả năng cho từng bộ thông số. Với ABC, có nhiều thủ thuật người ta có thể sử dụng để tăng tốc độ này. Với MCMC, không quá nhiều.
z_dood

2
@z_dood: khi có quá nhiều quan sát để thực sự tính toán khả năng, ví dụ như khi chúng cần được lưu trữ trên các máy tính khác nhau, có thể cho rằng chức năng khả năng không có khả năng phân tích.
Tây An
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.