Có phải chuỗi Markov dựa trên việc lấy mẫu là tốt nhất cho việc lấy mẫu Monte Carlo? Có đề án thay thế có sẵn?


9

Chuỗi Markov Monte Carlo là một phương pháp dựa trên chuỗi Markov cho phép chúng tôi lấy mẫu (trong cài đặt Monte Carlo) từ các bản phân phối không chuẩn mà chúng tôi không thể vẽ mẫu trực tiếp.

Câu hỏi của tôi là tại sao chuỗi Markov là "tiên tiến nhất" cho việc lấy mẫu Monte Carlo. Một câu hỏi khác có thể là, có cách nào khác như chuỗi Markov có thể được sử dụng để lấy mẫu Monte Carlo không? Tôi biết (ít nhất là khi nhìn vào tài liệu) rằng MCMC có nguồn gốc lý thuyết sâu sắc (về các điều kiện như (a) tính tuần hoàn, tính đồng nhất và cân bằng chi tiết) nhưng tự hỏi liệu có mô hình / phương pháp xác suất "có thể so sánh" nào cho Monte không Lấy mẫu Carlo tương tự như chuỗi Markov.

Vui lòng hướng dẫn cho tôi nếu tôi đã nhầm lẫn một phần của câu hỏi (hoặc nếu nó có vẻ khó hiểu hoàn toàn).

Câu trả lời:


11

Không có lý do nào để nói rằng lấy mẫu MCMC là phương pháp Monte Carlo "tốt nhất"! Thông thường, nó ngược lại tệ hơn so với lấy mẫu iid, ít nhất là về phương sai của các công cụ ước tính Monte Carlo

1TΣt= =1Th(Xt)
Eπ[h(X)]π(Xt)t
  1. X0tXtπ
  2. Xt
    varπ(X)+2Σt= =1covπ(X0,Xt)
    varπ(X)

Điều này đang được nói, MCMC rất hữu ích để xử lý các cài đặt trong đó việc lấy mẫu iid thông thường là không thể hoặc quá tốn kém và trong đó việc lấy mẫu quan trọng là rất khó để hiệu chỉnh, đặc biệt là do kích thước của biến ngẫu nhiên được mô phỏng.

Tuy nhiên, các phương pháp tuần tự Monte Carlo như bộ lọc hạt có thể phù hợp hơn trong các mô hình động, trong đó dữ liệu đến từ các cụm cần chú ý ngay lập tức và thậm chí có thể biến mất (nghĩa là không thể lưu trữ) sau một thời gian ngắn.

Tóm lại, MCMC là một công cụ rất hữu ích (và được sử dụng rất nhiều) để xử lý các cài đặt phức tạp trong đó các giải pháp Monte Carlo thông thường thất bại.


8

Có một số cách để tạo giá trị ngẫu nhiên từ một bản phân phối, McMC là một trong số đó, nhưng một số cách khác cũng sẽ được coi là phương pháp Monte Carlo (không có phần chuỗi Markov).

Cách trực tiếp nhất để lấy mẫu đơn biến là tạo ra một biến ngẫu nhiên thống nhất, sau đó cắm nó vào hàm CDF nghịch đảo. Điều này hoạt động rất tốt nếu bạn có CDF nghịch đảo, nhưng thật rắc rối khi CDF và / hoặc nghịch đảo của nó khó tính toán trực tiếp.

Đối với các vấn đề đa biến, bạn có thể tạo dữ liệu từ copula, sau đó sử dụng phương pháp CDF nghịch đảo trên các giá trị được tạo để có một số mức độ tương quan giữa các biến (mặc dù việc chỉ định các tham số chính xác cho copula để có được mức độ tương quan mong muốn thường đòi hỏi một chút phep thử va lôi sai).

Lấy mẫu từ chối là một cách tiếp cận khác có thể được sử dụng để tạo dữ liệu từ phân phối (đơn biến hoặc đa biến) trong đó bạn không cần biết CDF hoặc nghịch đảo của nó (và thậm chí bạn không cần hằng số chuẩn hóa cho hàm mật độ), nhưng điều này có thể không hiệu quả cao trong một số trường hợp mất nhiều thời gian.

Nếu bạn quan tâm đến việc tóm tắt dữ liệu được tạo hơn là các điểm ngẫu nhiên, thì lấy mẫu quan trọng là một lựa chọn khác.

Lấy mẫu Gibbs là một hình thức lấy mẫu McMC cho phép bạn lấy mẫu ở nơi bạn không biết chính xác hình thức phân phối đa biến miễn là bạn biết phân phối có điều kiện cho từng biến được cung cấp cho các biến khác.

Cũng có những thứ khác, điều này tốt nhất phụ thuộc vào những gì bạn biết và không biết và các chi tiết khác của vấn đề cụ thể. McMC là phổ biến vì nó hoạt động tốt trong nhiều tình huống và khái quát cho nhiều trường hợp khác nhau.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.