Cho phép dữ liệu ra lệnh cho các linh mục và sau đó chạy mô hình bằng cách sử dụng các linh mục này? (ví dụ: các linh mục điều khiển dữ liệu từ cùng một bộ dữ liệu)


9

Theo hiểu biết của tôi, chúng ta không nên cho phép cùng một tập dữ liệu mà chúng ta đang phân tích để điều khiển / xác định phân phối trước đó trông như thế nào trong phân tích Bayes. Cụ thể, không phù hợp để xác định phân phối trước cho phân tích Bayes dựa trên số liệu thống kê tóm tắt từ cùng một bộ dữ liệu mà sau đó bạn sẽ sử dụng các mục sư để phù hợp với mô hình.

Có ai tình cờ biết các tài nguyên thảo luận cụ thể về điều này là không phù hợp? Tôi cần một số trích dẫn cho vấn đề này.


Câu trả lời:


11

Có, điều này là không phù hợp vì nó sử dụng cùng một dữ liệu hai lần, dẫn đến kết quả quá tự tin. Điều này được gọi là "nhúng đôi".

Để tham khảo, tôi sẽ bắt đầu với Carlin và Louis (2000). Mặc dù "nhúng đôi" đã là một trong những bài phê bình chính của Empirical Bayes, Ch. 3, đặc biệt là phần 3.5, của cuốn sách này mô tả các cách để ước tính khoảng tin cậy phù hợp bằng cách sử dụng phương pháp EB.

Berger J (2006). \ Trường hợp phân tích Bayes khách quan. "Phân tích Bayes, 1 (3), 385 {402

Bradley P. Carlin, Thomas A. Louis 2000. Phương pháp Bayes và Empirical Bayes để phân tích dữ liệu.

Darniede, WF 2011. Phương pháp Bayes cho các nhà tiên tri phụ thuộc dữ liệu. Luận án MS, Đại học bang Ohio

Gelman, A., Carlin, JB, Stern, HS, và Rubin, DB (2003), Bayesian Data Anal-ysis, Ấn bản thứ hai (Chapman & Hall / CRC Texts in Statistics Science), Chap-man và Hall / CRC, 2nd chủ biên


@sarah Vui lòng đăng ký tài khoản của bạn để bạn có thể lấy lại câu hỏi của mình. Chỉ cần truy cập này url: stats.stackexchange.com/users/login

1

Nó có thể có ý nghĩa để sử dụng dữ liệu để xây dựng trước mặc dù.

Để biết ví dụ về mô hình hỗn hợp, xem Richardson & Green (1997): http://citeseer.ist.psu.edu/viewdoc/summary?doi=10.1.1.27.3667

Họ sử dụng giá trị trung bình và phạm vi của các điểm dữ liệu làm siêu đường kính cho trước và nó có ý nghĩa hoàn hảo.

Theo tôi, vấn đề sử dụng dữ liệu hai lần xảy ra khi một thông tin trước được lấy từ dữ liệu, theo ý kiến ​​của tôi.

Miễn là bạn kiểm tra xem phân phối trước của bạn có "phẳng" không, nơi phân phối sau được đạt đỉnh, thì bạn biết rằng phân phối trước của bạn không có tác động mạnh đến kết quả.


Sử dụng dữ liệu để xây dựng trước không thể diễn ra trong mô hình Bayes. Vì vậy, nó không có ý nghĩa từ quan điểm Bayes và việc xác nhận thông thường các thủ tục Bayes không được áp dụng. Suy luận kết quả có thể là hoàn toàn hợp lệ nhưng người ta phải chứng minh nó từ các nguyên tắc đầu tiên. (Richardson và Green sử dụng cái được gọi là Bayes theo kinh nghiệm. Đây không phải là thủ tục Bayes.)
Xi'an

Mặc dù nó không có ý nghĩa gì trong mô hình bayes, đôi khi, đường phân chia giữa dữ liệu và dữ liệu trước là khác nhau để rút ra. Xem câu trả lời của tôi cho stats.stackexchange.com/questions/112451/ từ
kjetil b halvorsen
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.