Nhiều người (bên ngoài các chuyên gia chuyên gia) nghĩ rằng họ là người thường xuyên trong thực tế là Bayes. Điều này làm cho cuộc tranh luận một chút vô nghĩa. Tôi nghĩ rằng chủ nghĩa Bayes đã chiến thắng, nhưng vẫn còn nhiều người Bayes nghĩ rằng họ là người thường xuyên. Có một số người nghĩ rằng họ không sử dụng linh mục và do đó họ nghĩ rằng họ là người thường xuyên. Đây là logic nguy hiểm. Đây không phải là quá nhiều về các linh mục (linh mục đồng phục hoặc không đồng phục), sự khác biệt thực sự là tinh tế hơn.
. nhà thống kê.)
MLE thực sự là một phương pháp Bayes. Một số người sẽ nói "Tôi là người thường xuyên vì tôi sử dụng MLE để ước tính các tham số của mình". Tôi đã thấy điều này trong văn học đánh giá ngang hàng. Điều này là vô nghĩa và dựa trên huyền thoại (không trả lời, nhưng ngụ ý) rằng một người thường xuyên là người sử dụng đồng phục trước thay vì không đồng phục trước).
Xem xét vẽ một số duy nhất từ một phân phối bình thường với giá trị trung bình đã biết, và phương sai chưa biết. Gọi phương sai này .μ=0θ
X≡N(μ=0,σ2=θ)
Bây giờ hãy xem xét chức năng khả năng. Hàm này có hai tham số, và và nó trả về xác suất, được cho là , của .xθθx
f(x,θ)=Pσ2=θ(X=x)=12πθ√e−x22θ
Bạn có thể tưởng tượng vẽ sơ đồ này trong bản đồ nhiệt, với trên trục x và trên trục y và sử dụng màu (hoặc trục z). Đây là cốt truyện, với các đường viền và màu sắc.xθ
Đầu tiên, một vài quan sát. Nếu bạn sửa trên một giá trị duy nhất của , thì bạn có thể lấy lát cắt ngang tương ứng thông qua sơ đồ nhiệt. Phần này sẽ cung cấp cho bạn bản pdf cho giá trị đó của . Rõ ràng, khu vực dưới đường cong trong lát cắt đó sẽ là 1. Mặt khác, nếu bạn sửa trên một giá trị duy nhất của , và sau đó nhìn vào lát cắt dọc tương ứng , thì không có gì đảm bảo như vậy về khu vực dưới đường cong .θθx
Sự khác biệt giữa các lát cắt ngang và dọc là rất quan trọng và tôi thấy sự tương tự này đã giúp tôi hiểu được cách tiếp cận thường xuyên đối với sự thiên vị .
Một người Bayes là người nói
Đối với giá trị này của x, giá trị nào của cho giá trị 'đủ cao' của ?.θf(x,θ)
Ngoài ra, một Bayes có thể bao gồm một trước, , nhưng họ vẫn đang nói vềg(θ)
đối với giá trị này của x, giá trị nào của cho giá trị đủ cao của ?θf(x,θ)g(θ)
Vì vậy, một Bayes sửa lỗi x và nhìn vào lát dọc tương ứng trong biểu đồ đường viền đó (hoặc trong biểu đồ biến thể kết hợp trước đó). Trong lát này, diện tích dưới đường cong không cần là 1 (như tôi đã nói trước đó). Khoảng tin cậy (CI) 95% của Bayes là khoảng chứa 95% diện tích khả dụng. Ví dụ: nếu diện tích là 2, thì diện tích theo CI Bayes phải là 1,9.
Mặt khác, một người thường xuyên sẽ bỏ qua x và trước tiên hãy xem xét sửa và sẽ hỏi:θ
Đối với , giá trị nào của x sẽ xuất hiện thường xuyên nhất?θ
Trong ví dụ này, với , một câu trả lời cho câu hỏi thường gặp này là: "Đối với một , 95% sẽ xuất hiện trong khoảng và . "N(μ=0,σ2=θ)θx−3θ√+3θ√
Vì vậy, một người thường xuyên quan tâm nhiều hơn đến các đường ngang tương ứng với các giá trị cố định của .θ
Đây không phải là cách duy nhất để xây dựng CI thường xuyên, nó thậm chí không phải là một cách tốt (hẹp), nhưng hãy chịu đựng tôi trong giây lát.
Cách tốt nhất để diễn giải từ 'khoảng' không phải là một khoảng trên dòng 1-d, mà nghĩ về nó như một khu vực trên mặt phẳng 2-trên. 'Khoảng' là tập con của mặt phẳng 2 chiều, không thuộc bất kỳ dòng 1-d nào. Nếu ai đó đề xuất một 'khoảng' như vậy, thì chúng ta phải kiểm tra xem 'khoảng' có giá trị ở mức độ tin cậy / độ tin cậy 95%.
Một người thường xuyên sẽ kiểm tra tính hợp lệ của 'khoảng' này bằng cách xem xét lần lượt từng lát cắt ngang và nhìn vào khu vực dưới đường cong. Như tôi đã nói trước đây, khu vực dưới đường cong này sẽ luôn là một. Yêu cầu quan trọng là khu vực trong 'khoảng' ít nhất là 0,95.
Một Bayes sẽ kiểm tra tính hợp lệ bằng cách thay vào đó nhìn vào các lát cắt dọc. Một lần nữa, khu vực dưới đường cong sẽ được so sánh với vùng ngầm dưới khoảng đó. Nếu cái sau ít nhất là 95% của cái trước, thì 'khoảng' là khoảng tin cậy 95% Bayes hợp lệ.
Bây giờ chúng ta đã biết cách kiểm tra xem một khoảng cụ thể có "hợp lệ" hay không, câu hỏi đặt ra là làm thế nào để chúng ta chọn tùy chọn tốt nhất trong số các tùy chọn hợp lệ. Đây có thể là một nghệ thuật đen, nhưng nhìn chung bạn muốn khoảng cách hẹp nhất. Cả hai cách tiếp cận đều có xu hướng đồng ý ở đây - các lát cắt dọc được xem xét và mục tiêu là làm cho khoảng cách càng hẹp càng tốt trong mỗi lát cắt dọc.
Tôi đã không cố gắng xác định khoảng tin cậy thường xuyên hẹp nhất có thể trong ví dụ trên. Xem các bình luận của @cardinal bên dưới để biết ví dụ về các khoảng hẹp hơn. Mục tiêu của tôi không phải là tìm ra các khoảng tốt nhất, mà là để nhấn mạnh sự khác biệt giữa các lát cắt ngang và dọc trong việc xác định tính hợp lệ. Một khoảng thỏa mãn các điều kiện của khoảng tin cậy thường xuyên 95% thường sẽ không thỏa mãn các điều kiện của khoảng tin cậy 95% Bayes và ngược lại.
Cả hai cách tiếp cận đều mong muốn các khoảng hẹp, tức là khi xem xét một lát cắt dọc, chúng tôi muốn làm cho khoảng (1-d) trong lát đó càng hẹp càng tốt. Sự khác biệt nằm ở cách 95% được thi hành - một người thường xuyên sẽ chỉ nhìn vào các khoảng thời gian được đề xuất trong đó 95% diện tích của mỗi lát cắt nằm dưới khoảng đó, trong khi Bayesian sẽ nhấn mạnh rằng mỗi lát cắt dọc có tỷ lệ 95% diện tích của nó theo khoảng
Nhiều người không thống kê không hiểu điều này và họ chỉ tập trung vào các lát cắt dọc; điều này làm cho họ Bayes ngay cả khi họ nghĩ khác.