Có bao nhiêu mẫu (post burn-in) mà bạn cần phụ thuộc vào những gì bạn đang cố gắng thực hiện với các mẫu đó và cách chuỗi của bạn trộn.
Thông thường, chúng tôi quan tâm đến các kỳ vọng sau (hoặc lượng tử) và chúng tôi ước tính các kỳ vọng này theo trung bình của các mẫu sau, tức là
trong đó là các mẫu từ MCMC của bạn. Theo định luật về số lượng lớn, ước tính MCMC hội tụ gần như chắc chắn đến kỳ vọng mong muốn.
E[ h ( θ ) | y] ≈ 1MΣm = 1Mh ( θ( m )) = EM
θ( m )
Nhưng để giải quyết câu hỏi có bao nhiêu mẫu chúng ta cần đảm bảo rằng chúng ta đủ gần với kỳ vọng mong muốn, chúng ta cần một kết quả Định lý giới hạn trung tâm (CLT), tức là một cái gì đó như
Với CLT này, sau đó chúng tôi có thể đưa ra các tuyên bố xác suất như "có xác suất 95% rằng nằm giữa . " Hai vấn đề ở đây làE[h(θ)| y]EM±1,96vh
EM- E[ h ( θ ) | y]M--√→dN( 0 , v2h)
E[ h ( θ ) | y]EM± 1,96 vh
- CLT có áp dụng không?
- Làm thế nào chúng ta có thể ước tính .v2h
Chúng tôi có một số kết quả khi CLT áp dụng, ví dụ như chuỗi trạng thái bị loại bỏ, chuỗi đảo ngược, chuỗi ergodic hình học. Xem Robert và Casella (tái bản lần 2) phần 6.7.2 để biết một số kết quả theo hướng này. Thật không may, phần lớn các chuỗi Markov không có bằng chứng cho thấy CLT tồn tại.
Nếu CLT tồn tại, chúng ta vẫn cần ước tính phương sai trong CLT. Một cách để ước tính phương sai này liên quan đến việc chia chuỗi thành các khối, xem Gong và Flegal và các tài liệu tham khảo trong đó. Phương pháp này đã được triển khai trong gói R mcmcse
với các hàm mcse
và mcse.q
để ước tính phương sai cho kỳ vọng và lượng tử.