Trên trang 146 của Phân tích dữ liệu Bayes của Gelman, Gelman thảo luận về giá trị p của Bayes như một cách để kiểm tra sự phù hợp của mô hình. Ý tưởng là so sánh dữ liệu quan sát ( ) với dữ liệu có thể được tạo bởi mô hình nếu chúng tôi sao chép thử nghiệm ( ).
Ông định nghĩa giá trị p của Bayes là
Tôi hoàn toàn không hiểu tại sao có ý nghĩa khi thống kê kiểm tra là một hàm của các tham số, . Thật vậy, nếu mục tiêu là "so sánh dữ liệu được quan sát với dữ liệu có thể được tạo bởi mô hình ", thì không nên so sánh nghiêm ngặt giữa và ?
Ví dụ, trên cùng một trang, Gelman cung cấp một ví dụ trong đó anh ta kiểm tra sự phù hợp của một mô hình bình thường. Thống kê kiểm tra là:
trong đó là giá trị trung bình của mô hình bình thường. Thống kê kiểm tra này được thiết kế để bỏ qua mô hình phù hợp ở đuôi cực, vượt quá số liệu thống kê thứ 6 và 61.
Tại sao chúng ta không sử dụng thống kê kiểm tra sau thay vào đó, hoàn toàn dựa vào dữ liệu?