Nếu nguyên tắc khả năng đụng độ với xác suất thường xuyên thì chúng ta có loại bỏ một trong số chúng không?


19

Trong một bình luận gần đây được đăng ở đây, một người bình luận đã chỉ ra một blog của Larry Wasserman , người chỉ ra (không có bất kỳ nguồn nào) rằng suy luận thường xuyên đụng độ với nguyên tắc khả năng.

Nguyên tắc khả năng chỉ đơn giản nói rằng các thí nghiệm mang lại các hàm khả năng tương tự sẽ mang lại suy luận tương tự.

Hai phần của câu hỏi này:

  1. Những phần, hương vị hoặc trường phái suy luận thường xuyên vi phạm nguyên tắc khả năng?

  2. Nếu có một cuộc đụng độ, chúng ta phải loại bỏ cái này hay cái khác? Nếu vậy thì cái nào? Tôi sẽ vì mục đích thảo luận rằng nếu chúng ta phải loại bỏ thứ gì đó thì chúng ta nên loại bỏ những phần suy luận thường xuyên xảy ra xung đột, bởi vì HackingRoyall đã thuyết phục tôi rằng nguyên tắc khả năng là tiên đề.


2
Tôi chưa bao giờ hiểu tại sao nguyên tắc khả năng nên là một tiên đề.
Stéphane Laurent

6
Xin chào, Stéphane. Vấn đề là Birnbaum đã chứng minh rằng Khả năng tương đương với hai nguyên tắc khác rất tự nhiên mà họ nhất thiết phải nắm giữ. Chúng tôi đã viết một bài đánh giá ngắn về kết quả này. Tại đây: ime.usp.br/~pmarques/ con / redux.pdf
Zen

@Zen Cảm ơn bạn. Thoạt nhìn, điểm tôi không đồng ý là câu này được viết dưới nguyên tắc điều kiện: "Điều quan trọng là những gì thực sự đã xảy ra". Thay vào đó tôi nên nói "Vấn đề là những gì thực sự đã xảy ra trong số những vấn đề có thể xảy ra" (xin lỗi nếu tiếng Anh của tôi không đúng). Đó là những gì tôi đã tuyên bố trong cuộc thảo luận với gui11aume: theo một nghĩa nào đó, nguyên tắc khả năng cho rằng thiết kế của thí nghiệm không thành vấn đề và tôi không thể đồng ý với điểm này.
Stéphane Laurent

1
@Zen Bây giờ tôi đã đọc kỹ hơn giấy của bạn. Điều đó đúng là khó đồng ý với nguyên tắc điều kiện và nguyên tắc bất biến.
Stéphane Laurent

1
LP không phải là phổ biến hiện nay vì lý do thực tế. Bằng cách áp dụng nó một cách tôn giáo, bạn tránh được việc sử dụng các linh mục phụ thuộc vào mô hình như các linh mục liên hợp trước đây của Jeffreys và thử nghiệm giả thuyết có thể hữu ích trong nhiều bối cảnh. Tôi tin rằng các số liệu thống kê, giống như vật lý , không thể được tiên đoán theo một cách có ý nghĩa (mặc dù cuộc thảo luận này có thể giống như thế này ). Nhưng điều quan trọng là xác định ưu điểm và nhược điểm của các mô hình khác nhau.

Câu trả lời:


12

Một phần của phương pháp Thường xuyên đụng độ với nguyên tắc khả năng là lý thuyết về kiểm tra thống kê (và tính toán giá trị p). Nó thường được làm nổi bật bằng ví dụ sau.

Giả sử hai người thường xuyên muốn nghiên cứu một đồng xu thiên vị, biến 'đầu' với khả năng không xác định . Họ nghi ngờ rằng nó thiên về 'đuôi', vì vậy họ đưa ra giả thuyết null giống nhau và cùng một giả thuyết thay thế .p = 1 / 2 p < 1 / 2pp=1/2p<1/2

Nhà thống kê đầu tiên lật đồng xu cho đến khi 'đầu' bật lên, điều này xảy ra là 6 lần. Lần thứ hai quyết định lật đồng xu 6 lần và chỉ nhận được một 'đầu' trong lần ném cuối cùng.

Theo mô hình của nhà thống kê đầu tiên, giá trị p được tính như sau:

p(1p)5+p(1p)6+...=p(1p)511p=p(1p)4.

Theo mô hình của nhà thống kê thứ hai, giá trị p được tính như sau:

(61)p(1p)5+(60)(1p)6=(5p+1)(1p)5.

Thay bằng , lần đầu tiên tìm thấy giá trị bằng , lần thứ hai tìm thấy giá trị p bằng .1 / 2 1 / 2 5 = 0,03125 7 / 2 × 1 / 2 5 = 0,109375p1/21/25=0.031257/2×1/25=0.109375

Vì vậy, họ nhận được kết quả khác nhau bởi vì họ đã làm những điều khác nhau, phải không? Nhưng theo nguyên tắc khả năng , họ nên đi đến kết luận tương tự. Tóm lại, nguyên tắc khả năng nói rằng khả năng là tất cả những gì quan trọng để suy luận. Vì vậy, cuộc đụng độ ở đây xuất phát từ thực tế là cả hai quan sát đều có cùng khả năng, tỷ lệ với (khả năng được xác định theo hằng số tỷ lệ).p(1p)5

Theo tôi biết, câu trả lời cho câu hỏi thứ hai của bạn là nhiều ý kiến ​​tranh luận. Cá nhân tôi cố gắng tránh thực hiện các bài kiểm tra và tính toán giá trị p vì lý do trên và cho những người khác được giải thích trong bài đăng trên blog này .

EDIT: Bây giờ tôi nghĩ về nó, ước tính theo khoảng tin cậy cũng sẽ khác nhau. Trên thực tế nếu các mô hình là khác nhau, CI khác nhau bởi xây dựng.p


1
Tôi có ấn tượng rằng nguyên tắc khả năng rõ ràng đã bị vi phạm trong thống kê thường xuyên (kiểm tra giả thuyết, khoảng tin cậy) bởi vì chúng tôi xem xét xác suất của từng kết quả có thể xảy ra, không chỉ khả năng dựa trên kết quả thực tế. Đúng ?
Stéphane Laurent

@ Stéphane Laurent có, đó cũng là cách tôi hiểu nó. James Berger có một trích dẫn hay trong Lý thuyết quyết định thống kê và Phân tích Bayes , nói rằng Đôi khi người thường xuyên bác bỏ giả thuyết vì dữ liệu không bao giờ được quan sát (nghe có vẻ tốt hơn, nhưng tôi không thể nhớ nó).
gui11aume

Cảm ơn, gui11aume. Tôi có đúng không khi giải thích rằng đó là một ví dụ trong đó 'ý nghĩa' của giá trị P thay đổi theo ý định của người thử nghiệm? Tôi giả sử đó là trường hợp khi giá trị P được hiểu là một loại ngưỡng tỷ lệ lỗi dương tính giả bởi vì chúng sẽ phải được phân phối đồng đều theo giả thuyết null? Điều đó có cần thiết với phương pháp của Fisher hay không khi các giá trị P được trình bày dưới dạng chỉ số về sức mạnh của bằng chứng?
Michael Lew

4
(+1) Loại khác biệt này thường xuất hiện khi quy tắc dừng có liên quan đến một trong các mô hình.

1
@Scortchi Thật ra tôi đã nhầm khi nghĩ rằng một trong các giá trị P trỏ đến hàm khả năng chính xác còn cái kia thì không: cả hai đều chỉ đến cùng một hàm khả năng đưa ra bằng chứng liên quan đến xác suất của các đầu. Bạn nên bỏ qua hai câu cuối của bình luận trước đây của tôi. (Tôi không thể chỉnh sửa nó, tôi có thể không?)
Michael Lew

4

Tôi thích ví dụ của @ gui11aume (+1), nhưng nó có thể tạo ấn tượng rằng sự khác biệt trong hai giá trị chỉ phát sinh do các quy tắc dừng khác nhau được sử dụng bởi hai người thử nghiệm.p

Trên thực tế, tôi tin rằng đó là một hiện tượng tổng quát hơn nhiều. Hãy xem xét người thí nghiệm thứ hai trong câu trả lời của @ gui11aume: người ném đồng xu sáu lần và chỉ quan sát những cái đầu trong lần ném cuối cùng. Các kết quả trông như thế: giá trị gì? Cách tiếp cận thông thường sẽ là tính toán xác suất rằng một đồng tiền công bằng sẽ dẫn đến một hoặc ít đầu. Có khả năng trong tổng số có một hoặc ít đầu, do đó .p 7 64 p = 7 / 64 0,109

TTTTTH,
p764p=7/640.109

Nhưng tại sao không lấy một thống kê kiểm tra khác ? Ví dụ, trong thí nghiệm này, chúng tôi đã quan sát năm đuôi liên tiếp. Hãy lấy độ dài của chuỗi đuôi dài nhất làm thống kê kiểm tra. Có khả năng với năm hoặc sáu đuôi liên tiếp, do đó .p = 3 / 64 0,0473p=3/640.047

Vì vậy, nếu trong trường hợp này, tỷ lệ lỗi được cố định ở , thì việc lựa chọn thống kê kiểm tra có thể dễ dàng đưa ra kết quả có ý nghĩa hay không và điều này không liên quan gì đến quy tắc dừng mỗi lần .α=0.05


Phần đầu cơ

Bây giờ, về mặt triết học, tôi sẽ nói rằng sự lựa chọn thường xuyên của thống kê kiểm tra là trong một số ý nghĩa mơ hồ tương tự như sự lựa chọn Bayes trước đây. Chúng tôi chọn một hoặc một thống kê kiểm tra khác vì chúng tôi tin rằng đồng tiền không công bằng sẽ hành xử theo cách này hoặc cách cụ thể đó (và chúng tôi muốn có sức mạnh để phát hiện hành vi này). Nó không giống với việc đặt trước các loại tiền sao?

Nếu vậy, thì nguyên tắc khả năng nói rằng tất cả các bằng chứng nằm trong khả năng không xung đột với giá trị , bởi vì giá trị không chỉ là "lượng bằng chứng". Đó là "thước đo của sự ngạc nhiên", nhưng một cái gì đó chỉ có thể là thước đo của sự ngạc nhiên nếu nó giải thích cho những gì chúng ta sẽ ngạc nhiên! Giá trị cố gắng kết hợp trong một đại lượng vô hướng cả bằng chứng và một số loại kỳ vọng trước đó (như được thể hiện trong sự lựa chọn của thống kê kiểm tra). Nếu vậy, thì nó không nên được so sánh với khả năng của chính nó, mà có lẽ là với hậu thế?p pppp

Tôi sẽ rất thích thú khi nghe một số ý kiến ​​về phần đầu cơ này, ở đây hoặc trong trò chuyện.


Cập nhật thảo luận sau với @MichaelLew

Tôi sợ rằng ví dụ của tôi ở trên đã bỏ lỡ quan điểm của cuộc tranh luận này. Chọn một thống kê kiểm tra khác nhau cũng dẫn đến một sự thay đổi trong chức năng khả năng. Vì vậy, hai giá trị khác nhau được tính toán ở trên tương ứng với hai hàm khả năng khác nhau và do đó không thể là một ví dụ về "xung đột" giữa nguyên tắc khả năng và giá trị . Cái hay của ví dụ của @ gui11aume là hàm khả năng giữ nguyên chính xác, mặc dù giá trị khác nhau.p pppp

Tôi vẫn phải nghĩ điều này có nghĩa gì cho phần "đầu cơ" của tôi ở trên.


Suy nghĩ thú vị. Có, tôi đồng ý rằng không cần phải có xung đột giữa giá trị LP và giá trị P miễn là giá trị P không được hiểu là bằng chứng giống như chức năng khả năng. Hàm khả năng chứa các bằng chứng liên quan đến tham số quan tâm được đưa ra cho mô hình thống kê . Khi bạn thay đổi thống kê kiểm tra, bạn thay đổi mô hình, do đó, hàm khả năng cho mô hình thay thế của bạn sẽ (tốt, có thể) khác với hàm khả năng cho bản gốc.
Michael Lew

Michael, tôi không chắc chính xác "mô hình thống kê" nghĩa là gì, nhưng không phải là một đồng xu có xác suất đầu đã là một mô hình? Làm thế nào để thay đổi thống kê kiểm tra thay đổi mô hình? p
amip nói rằng Phục hồi lại

Ngoài ra, tôi đã tìm thấy câu hỏi này bởi vì tôi đang đọc lại bài báo "To P hay không P" của bạn (và "nguyên tắc khả năng" được googled "). Tôi thường thích bài báo, nhưng tôi đã hoàn toàn bối rối bởi phần 4.4. Bạn viết rằng các giá trị p không nên được "điều chỉnh" bằng cách đưa các quy tắc dừng vào tài khoản; nhưng tôi không thấy bất kỳ sự điều chỉnh nào trong các công thức 5-6. Giá trị p "không điều chỉnh" sẽ là gì? Bạn có nghĩa là một trong số họ được điều chỉnh và một cái khác thì không? Nếu vậy, cái nào, và tại sao không ngược lại?
amip nói rằng Phục hồi lại

Mô hình thống kê thường bị bỏ qua hoặc ngầm định là bất biến. Tuy nhiên, đối với các đồng tiền, nó bao gồm một xác suất đầu xác định không xác định, một lựa chọn quan sát ngẫu nhiên và, trong phần đầu của các thử nghiệm thống kê thử nghiệm, phân phối nhị thức của các kết quả có thể xảy ra. Tôi không biết phân phối kết quả là gì cho các đuôi trong một thống kê kiểm tra hàng nhưng tôi nghi ngờ nó là khác nhau. Ngay cả khi nó giống nhau, mô hình có thống kê kiểm tra của bạn không giống với mô hình ban đầu và do đó, hàm khả năng có thể khác nhau mặc dù nó chứa tất cả các bằng chứng.
Michael Lew

Tôi sắp hoàn thành việc làm lại bài báo đó. Nó có liên quan đến cuộc thảo luận này nhưng chưa sẵn sàng để đệ trình. (Đây có phải là trò chuyện không?)
Michael Lew
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.