Tại sao chúng ta cần biểu đồ theo dõi cho kết quả MCMC


12

Tôi đang đọc các tài liệu nghiên cứu bằng các phương pháp MCMC và tôi thấy hầu hết trong số họ cung cấp các dấu vết. Tại sao chúng ta cần lô theo dõi trong Chuỗi Monte Carlo Markov? Một biểu đồ dấu vết của các tham số chỉ ra điều gì?

Câu trả lời:


17

Bạn tạo các ô theo dõi tham số để đảm bảo rằng phân phối tiên nghiệm của bạn được hiệu chỉnh tốt, được biểu thị bằng các tham số của bạn có đủ thay đổi trạng thái khi thuật toán MCMC chạy.

Một ví dụ cực đoan là bạn đặt phương sai phân phối tiên nghiệm của mình là 0. Sau đó, ước tính tham số sau sẽ không bao giờ thay đổi. Thuật toán của bạn sẽ nói rằng bạn có ước tính tham số tốt nhất, nhưng nó không kiểm tra đủ số lượng tham số để xác định xem điều này có thực sự phù hợp nhất hay không. Nếu bạn đặt phương sai phân phối tiên nghiệm quá cao, bạn sẽ gặp vấn đề tương tự. Điều này là do tham số mới ít có khả năng liên quan đến dữ liệu của bạn - vì vậy khả năng nhật ký được tính với tham số mới của bạn có thể không tốt hơn khả năng nhật ký sử dụng tham số cũ. (Một ví dụ là nếu tham số "đúng" của bạn là 0,5 và ước tính ban đầu của bạn là 2, nhưng bạn đang chọn từ phân phối bình thường với giá trị trung bình là 2 và phương sai là 10.000 thì bạn không thể có được tham số gần hơn 1 .

Bạn cần chọn một phương sai tiên nghiệm cho phép các trạng thái tham số của bạn thay đổi đủ để bạn không bị kẹt ở mức tối thiểu và tối đa cục bộ trong phân phối loglikabilities, nhưng đủ tốt để bạn có được ước tính tham số hợp lý. Hầu hết các tài liệu cho thấy bạn có được các tham số của mình để thay đổi trạng thái 40-60% thời gian.

Một lý do khác cho các ô theo dõi bị đốt cháy. Thông thường, khoảng thời gian ghi là rõ ràng trong ô (ví dụ: nếu tham số thực là 1,5 và ước tính ban đầu của bạn là 4 thì bạn sẽ thấy các ước tính tham số di chuyển nhanh từ 4 đến 1,5 và sau đó "nảy" khoảng 1,5). Thông thường, bạn chỉ loại trừ n lần lặp đầu tiên trong đó n đủ lớn để bạn chắc chắn đã loại bỏ ghi trong (giả sử 1000), nhưng nếu các phép tính tốn thời gian hoặc nếu ước tính tham số của bạn mất nhiều thời gian hơn để hội tụ hơn n cho phép sau đó bạn có thể muốn bỏ qua các quan sát nhiều hơn hoặc ít hơn để tính đến việc ghi vào. Bạn có thể kiểm tra các ô của mình để xem nơi ghi trong thời gian kết thúc để đảm bảo rằng việc ghi vào không ảnh hưởng đến kết quả của bạn.

Lưu ý rằng tôi đã nói về ngữ cảnh của các ước tính điểm tham số. Nếu bạn đang ước tính phương sai tham số thì việc đảm bảo rằng bạn có các thay đổi trạng thái phù hợp thậm chí còn quan trọng hơn.


5
+1 Nhưng mặt khác của nó là chúng tôi không hoàn toàn tin tưởng vào chẩn đoán hội tụ chính thức và muốn nhãn cầu một cái gì đó trước khi chúng tôi tuyên bố nó đã hội tụ. Liệu điều này có hoàn toàn hợp lý hay không là một câu hỏi khác ...
liên hợp chiến

1
Xin lỗi để đào bài cũ này. Nhưng không phải giá trị trước (được tạo từ phân phối trước) được cho là không liên quan miễn là có đủ số lần lặp?
mscnvrsy

@mscnvrsy: bạn có thể đặt trước không có thông tin như trước hoặc đồng phục của Jeffry nếu bạn muốn cung cấp ít thông tin hơn cho trước.
Benzamin

3
Tôi hoàn toàn không đồng ý với khái niệm rằng các ô theo dõi MCMC theo bất kỳ cách nào liên quan đến việc hiệu chỉnh phân phối trước đó. Một thuật toán MCMC nhằm vào một phân phối sau nhất định, không liên quan đến sự lựa chọn trước và trong các điều kiện thích hợp sẽ tạo ra một chuỗi Markov hội tụ vào phân phối cố định này. Nhìn vào các ô dấu vết chỉ hữu ích trong việc đánh giá sự hội tụ hoặc thiếu của chuỗi Markov.
Tây An
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.