Tôi thích ví dụ của @ gui11aume (+1), nhưng nó có thể tạo ấn tượng rằng sự khác biệt trong hai giá trị chỉ phát sinh do các quy tắc dừng khác nhau được sử dụng bởi hai người thử nghiệm.p
Trên thực tế, tôi tin rằng đó là một hiện tượng tổng quát hơn nhiều. Hãy xem xét người thí nghiệm thứ hai trong câu trả lời của @ gui11aume: người ném đồng xu sáu lần và chỉ quan sát những cái đầu trong lần ném cuối cùng. Các kết quả trông như thế: giá trị gì? Cách tiếp cận thông thường sẽ là tính toán xác suất rằng một đồng tiền công bằng sẽ dẫn đến một hoặc ít đầu. Có khả năng trong tổng số có một hoặc ít đầu, do đó .p 7 64 p = 7 / 64 ≈ 0,109
TTTTTH ,
p764p = 7 / 64 ≈ 0,109
Nhưng tại sao không lấy một thống kê kiểm tra khác ? Ví dụ, trong thí nghiệm này, chúng tôi đã quan sát năm đuôi liên tiếp. Hãy lấy độ dài của chuỗi đuôi dài nhất làm thống kê kiểm tra. Có khả năng với năm hoặc sáu đuôi liên tiếp, do đó .p = 3 / 64 ≈ 0,0473p = 3 / 64 ≈ 0,047
Vì vậy, nếu trong trường hợp này, tỷ lệ lỗi được cố định ở , thì việc lựa chọn thống kê kiểm tra có thể dễ dàng đưa ra kết quả có ý nghĩa hay không và điều này không liên quan gì đến quy tắc dừng mỗi lần .α = 0,05
Phần đầu cơ
Bây giờ, về mặt triết học, tôi sẽ nói rằng sự lựa chọn thường xuyên của thống kê kiểm tra là trong một số ý nghĩa mơ hồ tương tự như sự lựa chọn Bayes trước đây. Chúng tôi chọn một hoặc một thống kê kiểm tra khác vì chúng tôi tin rằng đồng tiền không công bằng sẽ hành xử theo cách này hoặc cách cụ thể đó (và chúng tôi muốn có sức mạnh để phát hiện hành vi này). Nó không giống với việc đặt trước các loại tiền sao?
Nếu vậy, thì nguyên tắc khả năng nói rằng tất cả các bằng chứng nằm trong khả năng không xung đột với giá trị , bởi vì giá trị không chỉ là "lượng bằng chứng". Đó là "thước đo của sự ngạc nhiên", nhưng một cái gì đó chỉ có thể là thước đo của sự ngạc nhiên nếu nó giải thích cho những gì chúng ta sẽ ngạc nhiên! Giá trị cố gắng kết hợp trong một đại lượng vô hướng cả bằng chứng và một số loại kỳ vọng trước đó (như được thể hiện trong sự lựa chọn của thống kê kiểm tra). Nếu vậy, thì nó không nên được so sánh với khả năng của chính nó, mà có lẽ là với hậu thế?p pppp
Tôi sẽ rất thích thú khi nghe một số ý kiến về phần đầu cơ này, ở đây hoặc trong trò chuyện.
Cập nhật thảo luận sau với @MichaelLew
Tôi sợ rằng ví dụ của tôi ở trên đã bỏ lỡ quan điểm của cuộc tranh luận này. Chọn một thống kê kiểm tra khác nhau cũng dẫn đến một sự thay đổi trong chức năng khả năng. Vì vậy, hai giá trị khác nhau được tính toán ở trên tương ứng với hai hàm khả năng khác nhau và do đó không thể là một ví dụ về "xung đột" giữa nguyên tắc khả năng và giá trị . Cái hay của ví dụ của @ gui11aume là hàm khả năng giữ nguyên chính xác, mặc dù giá trị khác nhau.p pppp
Tôi vẫn phải nghĩ điều này có nghĩa gì cho phần "đầu cơ" của tôi ở trên.