Phương pháp MCMC - đốt mẫu?


12

Trong các phương pháp MCMC , tôi tiếp tục đọc về burn-inthời gian hoặc số lượng mẫu "burn". Điều này chính xác là gì, và tại sao nó lại cần thiết?

Cập nhật:

Khi MCMC ổn định, nó có ổn định không? Làm thế nào là khái niệm về burn-inthời gian liên quan đến thời gian trộn?


1
Cụm từ ' burn-in ' không có nghĩa là 'đốt' các mẫu, nhưng để hệ thống giải quyết thỏa đáng trạng thái "mới" của nó sang trạng thái phù hợp để sử dụng. (Các mẫu bị loại bỏ trong quá trình lắng, vâng, nhưng cụm từ không có nghĩa là 'đốt cháy' theo nghĩa đó. Nó gần như 'làm nóng động cơ' trước khi mang nó ra đường.) Xem câu trả lời này để thảo luận về để làm gì
Glen_b -Reinstate Monica

(Cụ thể, đoạn đầu tiên của câu trả lời đó)
Glen_b -Reinstate Monica

1
@Glen_b, tôi đoán tôi biết điều đó, nhưng tôi thích hình ảnh tinh thần của các mẫu đáng ngờ đi lên trong khói tốt hơn ....
Matt Krause

Câu trả lời:


17

Burn-in dự định sẽ cho Markov Chain thời gian để đạt được phân phối cân bằng của nó, đặc biệt nếu nó đã bắt đầu từ một điểm khởi đầu tệ hại. Để "đốt cháy" một chuỗi, bạn chỉ cần loại bỏ mẫu đầu tiên trước khi bắt đầu thu thập điểm.n

Ý tưởng là điểm bắt đầu "xấu" có thể vượt quá các vùng mẫu thực sự có xác suất rất thấp dưới sự phân bố cân bằng trước khi nó ổn định thành phân bố cân bằng. Nếu bạn ném những điểm đó đi, thì những điểm không chắc chắn sẽ rất hiếm.

Trang này đưa ra một ví dụ hay, nhưng nó cũng chỉ ra rằng burn-in giống như một hack / artform hơn là một kỹ thuật nguyên tắc. Về lý thuyết, bạn chỉ có thể lấy mẫu trong một thời gian thực sự dài hoặc tìm cách nào đó để chọn một điểm khởi đầu tốt thay thế.

Chỉnh sửa: Thời gian trộn liên quan đến việc mất bao lâu để chuỗi tiếp cận trạng thái ổn định của nó, nhưng thường rất khó để tính trực tiếp. Nếu bạn biết thời gian trộn, bạn sẽ loại bỏ rất nhiều mẫu, nhưng trong nhiều trường hợp, bạn không. Vì vậy, bạn chọn một thời gian lưu lượng hy vọng đủ lớn để thay thế.

Theo như sự ổn định - nó phụ thuộc. Nếu chuỗi của bạn đã hội tụ, thì ... nó đã hội tụ. Tuy nhiên, cũng có những tình huống chuỗi dường như đã hội tụ nhưng thực ra chỉ là "đi chơi" trong một phần của không gian trạng thái. Ví dụ, hãy tưởng tượng rằng có một số chế độ, nhưng mỗi chế độ được kết nối kém với các chế độ khác. Có thể mất một thời gian rất lâu để người lấy mẫu có thể vượt qua khoảng trống đó và nó sẽ trông giống như chuỗi được hội tụ đúng cho đến khi nó thực hiện bước nhảy đó.

Có những chẩn đoán cho sự hội tụ, nhưng nhiều người trong số họ có một thời gian khó khăn để phân biệt sự hội tụ thực sự và sự hội tụ giả. Chương của Charles Geyer (# 1) trong Sổ tay của Markov Chain Monte Carlo khá bi quan về mọi thứ nhưng điều hành chuỗi càng lâu càng tốt.


Cảm ơn. Tôi đã thêm một bản cập nhật nhỏ cho OP với hy vọng làm rõ hơn về khái niệm này.
Amelio Vazquez-Reina

Tôi đã thêm một chút nữa; Hy vọng rằng sẽ giúp.
Matt Krause

6

Thuật toán Metropolis-Hastings lấy mẫu ngẫu nhiên từ phân phối sau. Thông thường, các mẫu ban đầu không hoàn toàn hợp lệ vì Chuỗi Markov chưa ổn định với phân phối cố định. Việc ghi trong các mẫu cho phép bạn loại bỏ các mẫu ban đầu chưa có tại văn phòng phẩm.


1
Cảm ơn - Một khi chuỗi Markov ổn định, nó có ổn định không? Làm thế nào điều này liên quan đến khái niệm thời gian trộn? Nó giống nhau không?
Amelio Vazquez-Reina
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.