@Tristan: Hy vọng bạn không bận tâm đến việc tôi làm lại câu trả lời của bạn khi tôi đang làm việc để làm cho điểm chung càng minh bạch càng tốt.
Đối với tôi, chínhcái nhìn sâu sắc trong thống kê là khái niệm hóa các quan sát lặp đi lặp lại khác nhau - như được tạo ra bởi một mô hình tạo xác suất, chẳng hạn như Bình thường (mu, sigma). Đầu những năm 1800, các mô hình tạo xác suất được giải trí thường chỉ là do lỗi đo lường với vai trò của các tham số, chẳng hạn như mu và sigma và các thầy tu cho chúng bị nhầm lẫn. Các cách tiếp cận thường xuyên lấy các tham số là cố định và không xác định và do đó các mô hình tạo xác suất sau đó chỉ liên quan đến các quan sát có thể. Phương pháp tiếp cận Bayes (với các linh mục phù hợp) có các mô hình tạo xác suất cho cả các tham số chưa biết có thể và các quan sát có thể. Các mô hình tạo xác suất chung này chiếm toàn diện cho tất cả - để đặt nó một cách tổng quát hơn - những ẩn số có thể có (như tham số) và đã biết (như quan sát). Như trong liên kết từ Rubin bạn đã đưa ra,
Điều này thực sự đã được Galton miêu tả rất rõ ràng trong một quincunx hai giai đoạn vào cuối năm 1800, s. Xem hình 5> Stigler, Stephen M. 2010. Darwin, Galton và thống kê
giác ngộ. Tạp chí của Hiệp hội Thống kê Hoàng gia: Dòng A
173 (3): 469-482 . .
Nó tương đương nhưng có lẽ minh bạch hơn
posterior = trước (những điều chưa biết có thể | những điều có thể biết = những điều đã biết)
hơn hậu thế ~ trước (những điều chưa biết có thể) * p (những điều có thể biết = những điều đã biết | những điều chưa biết có thể)
Không có gì mới đối với các giá trị bị thiếu trước đây vì người ta chỉ thêm các ẩn số có thể có cho một mô hình xác suất tạo ra các giá trị bị thiếu và xử lý thiếu chỉ là một trong những điều đã biết có thể (tức là quan sát thứ 3 bị thiếu).
Gần đây, tính toán Bayesian (ABC) gần đúng đã thực hiện phương pháp mô phỏng hai giai đoạn mang tính xây dựng này một cách nghiêm túc khi p (có thể biết = biết được | những ẩn số có thể) không thể thực hiện được. Nhưng ngay cả khi điều này có thể được giải quyết và người sau có thể dễ dàng lấy được từ lấy mẫu MCMC (hoặc ngay cả khi hậu thế có sẵn trực tiếp do được liên hợp trước), quan điểm của Rubin về việc xây dựng mẫu hai giai đoạn này cho phép dễ hiểu hơn, không nên bỏ qua.
Chẳng hạn, tôi chắc chắn rằng nó đã bắt được những gì @Zen đã làm ở đây Bayesians: nô lệ của chức năng khả năng? bởi vì người ta sẽ cần phải vẽ một c chưa biết có thể từ một (giai đoạn một) trước đó và sau đó rút ra một (dữ liệu) có thể có mà c (giai đoạn 2) không thể là một thế hệ ngẫu nhiên như p (có thể biết là | c) không phải là một xác suất ngoại trừ một và chỉ một c.
Từ @Zen, Unfortunatelly, nói chung, đây không phải là mô tả hợp lệ của mô hình thống kê. Vấn đề là, theo định nghĩa,fXTôi∣ C(⋅ ∣ c ) phải là mật độ xác suất cho hầu hết mọi giá trị có thể củac, nói chung, rõ ràng là sai.