Chỉnh sửa: Tôi đã thêm một ví dụ đơn giản: suy luận về giá trị trung bình của . Tôi cũng đã làm rõ một chút tại sao các khoảng tin cậy không khớp với các khoảng tin cậy là xấu.
Tôi, một người Bayes khá sùng đạo, đang ở giữa một cuộc khủng hoảng về đức tin.
Vấn đề của tôi là như sau. Giả sử rằng tôi muốn phân tích một số dữ liệu IID . Những gì tôi sẽ làm là:
đầu tiên, đề xuất một mô hình có điều kiện:
Sau đó, chọn ưu tiên trên : p ( θ )
Cuối cùng, áp dụng quy tắc của Bayes, tính toán sau: (hoặc một số phép tính gần đúng với nó nếu không thể tính toán được) và trả lời tất cả các câu hỏi tôi có vềθ
Đây là một cách tiếp cận hợp lý: nếu mô hình thực sự của dữ liệu thực sự là "bên trong" điều kiện của tôi (nó tương ứng với một số giá trị ), thì tôi có thể gọi lý thuyết quyết định thống kê để nói rằng phương pháp của tôi được chấp nhận (xem Robert "Sự lựa chọn Bayes" để biết chi tiết; "Tất cả các số liệu thống kê" cũng cung cấp một tài khoản rõ ràng trong chương liên quan).θ 0
Tuy nhiên, như mọi người đều biết, giả sử rằng mô hình của tôi là chính xác thì khá kiêu ngạo: tại sao thiên nhiên phải nằm gọn trong hộp của các mô hình mà tôi đã xem xét? Thực tế hơn nhiều khi giả định rằng mô hình thực của dữ liệu khác với cho tất cả các giá trị của . Đây thường được gọi là mô hình "sai chính tả".p ( X | θ ) θ
Vấn đề của tôi là, trong trường hợp sai chính tả thực tế hơn này, tôi không có bất kỳ lý lẽ tốt nào để trở thành Bayesian (tức là: tính toán phân phối sau) so với chỉ đơn giản là tính toán Công cụ ước tính khả năng tối đa (MLE):
Thật vậy, theo Kleijn, vd Vaart (2012) , trong trường hợp sai chính tả, phân phối sau:
hội tụ dưới dạng với phân phối dirac tập trung tại mộtq M L
không có phương sai chính xác (trừ khi hai giá trị chỉ xảy ra giống nhau) để đảm bảo rằng khoảng tin cậy của khoảng tin cậy khớp sau cho . (Lưu ý rằng, mặc dù khoảng tin cậy rõ ràng là điều mà người Bayes không quan tâm quá mức, nhưng về mặt chất lượng này có nghĩa là phân phối sau về bản chất là sai, vì nó ngụ ý rằng khoảng tin cậy của nó không có phạm vi bảo hiểm chính xác)
Do đó, chúng tôi đang trả phí bảo hiểm tính toán (suy luận Bayes, nói chung, đắt hơn MLE) vì không có thuộc tính bổ sung
Vì vậy, cuối cùng, câu hỏi của tôi : có bất kỳ đối số nào, dù là lý thuyết hay thực nghiệm, cho việc sử dụng suy luận Bayes so với phương án MLE đơn giản hơn khi mô hình bị sai?
(Vì tôi biết rằng các câu hỏi của tôi thường không rõ ràng, vui lòng cho tôi biết nếu bạn không hiểu điều gì đó: Tôi sẽ cố gắng viết lại nó)
Chỉnh sửa: hãy xem xét một ví dụ đơn giản: suy ra giá trị trung bình của theo mô hình Gaussian (với phương sai đã biết để đơn giản hóa hơn nữa). Chúng tôi xem xét một Gaussian trước: chúng tôi biểu thị giá trị trung bình trước, phương sai nghịch đảo của trước. Đặt là giá trị trung bình theo kinh nghiệm của . Cuối cùng, lưu ý: . σ L 0 β 0 ˉ X X i L = ( β 0 μ 0 + n
Phân phối sau là:
Trong trường hợp được chỉ định chính xác (khi thực sự có phân phối Gaussian), hậu thế này có các thuộc tính đẹp sau đây
Nếu được tạo từ một mô hình phân cấp trong đó giá trị trung bình được chia sẻ của chúng được chọn từ phân phối trước, thì khoảng tin cậy sau có độ bao phủ chính xác. Có điều kiện trên dữ liệu, xác suất ở bất kỳ khoảng nào đều bằng với xác suất mà hậu thế quy định cho khoảng này
Ngay cả khi điều trước không đúng, các khoảng tin cậy có phạm vi bảo hiểm chính xác trong giới hạn trong đó ảnh hưởng trước đó đối với hậu thế sẽ biến mất
phía sau có các đặc tính thường xuyên tốt: bất kỳ công cụ ước lượng Bayes nào được xây dựng từ phía sau đều được đảm bảo là có thể chấp nhận được, trung bình sau là một công cụ ước tính hiệu quả (theo nghĩa Cramer-Rao) của các khoảng tin cậy, không đáng tin cậy, là không có triệu chứng, khoảng tin cậy.
Trong trường hợp sai chính tả, hầu hết các tính chất này không được đảm bảo bởi lý thuyết. Để khắc phục các ý tưởng, hãy giả sử rằng mô hình thực sự cho là chúng thay vào đó là các bản phân phối của Sinh viên. Thuộc tính duy nhất mà chúng tôi có thể đảm bảo (Kleijn et al) là phân phối sau tập trung vào giá trị trung bình thực của trong giới hạn . Nói chung, tất cả các thuộc tính bảo hiểm sẽ biến mất. Tồi tệ hơn, nói chung, chúng ta có thể đảm bảo rằng, trong giới hạn đó, các thuộc tính bảo hiểm sai về cơ bản: phân phối sau sẽ quy định xác suất sai cho các vùng không gian khác nhau.X i n → ∞