Có phải chúng ta thường xuyên thực sự chỉ là ẩn ý / không mong muốn Bayes?


15

Đối với một vấn đề suy luận nhất định, chúng ta biết rằng một cách tiếp cận Bayes thường khác nhau về cả hình thức và kết quả từ cách tiếp cận đầy đủ. Những người thường xuyên (thường bao gồm tôi) thường chỉ ra rằng các phương pháp của họ không yêu cầu trước và do đó "hướng dữ liệu" nhiều hơn "điều khiển theo phán đoán". Tất nhiên, Bayesian có thể chỉ ra các linh mục không có thông tin, hoặc, thực dụng, chỉ cần sử dụng một cách thực sự khuếch tán trước.

Mối quan tâm của tôi, đặc biệt là sau khi cảm thấy một sự tự mãn về tính khách quan đầy đủ của tôi, là có lẽ các phương pháp "khách quan" có chủ đích của tôi có thể được hình thành trong khuôn khổ Bayes, mặc dù với một số mô hình dữ liệu và trước đây bất thường. Trong trường hợp đó, có phải tôi chỉ không biết gì về sự vô lý trước đó và mô hình hóa phương pháp thường xuyên của tôi ngụ ý ?

Nếu một người Bayes chỉ ra một công thức như vậy, tôi nghĩ rằng phản ứng đầu tiên của tôi sẽ là nói "Chà, thật tuyệt khi bạn có thể làm điều đó, nhưng đó không phải là cách tôi nghĩ về vấn đề!". Tuy nhiên, ai quan tâm đến cách tôi nghĩ về nó, hoặc cách tôi hình thành nó. Nếu thủ tục của tôi tương đương về mặt thống kê / toán học với một số mô hình Bayes, thì tôi hoàn toàn ( vô tình !) Thực hiện suy luận Bayes.

Câu hỏi thực tế dưới đây

Nhận thức này thực chất làm suy yếu bất kỳ sự cám dỗ để được tự mãn. Tuy nhiên, tôi không chắc liệu sự thật của mô hình Bayes có thể đáp ứng tất cả các thủ tục thường xuyên hay không (một lần nữa, với điều kiện Bayes chọn một ưu tiên phù hợp và khả năng) . Tôi biết điều ngược lại sai.

Tôi hỏi điều này bởi vì gần đây tôi đã đăng một câu hỏi về suy luận có điều kiện, dẫn tôi đến bài báo sau: tại đây (xem 3.9.5,3.9.6)

Họ chỉ ra kết quả nổi tiếng của Basu rằng có thể có nhiều hơn một thống kê phụ trợ, đặt ra câu hỏi về "tập hợp con có liên quan" nào phù hợp nhất . Thậm chí tệ hơn, họ cho thấy hai ví dụ về nơi, ngay cả khi bạn có một thống kê phụ trợ duy nhất, nó không loại bỏ sự hiện diện của các tập hợp con khác có liên quan.

Họ tiếp tục kết luận rằng chỉ có các phương pháp Bayes (hoặc các phương thức tương đương với chúng) có thể tránh được vấn đề này, cho phép suy luận có điều kiện không có nguyên tắc.


Nó có thể không phải là trường hợp Bayesian Stats Fequentist Stats - đó là câu hỏi của tôi cho nhóm này ở đây. Nhưng có vẻ như một lựa chọn cơ bản giữa hai mô hình nằm trong triết học ít hơn so với mục tiêu: bạn cần độ chính xác có điều kiện cao hay sai số vô điều kiện thấp :

  • Độ chính xác có điều kiện cao dường như có thể áp dụng khi chúng ta phải phân tích một trường hợp đơn lẻ - chúng tôi muốn đúng với suy luận cụ thể NÀY, mặc dù thực tế là phương pháp này có thể không phù hợp hoặc chính xác cho tập dữ liệu tiếp theo (siêu điều kiện / chuyên môn hóa).

  • Lỗi vô điều kiện thấp là phù hợp khi chúng tôi sẵn sàng đưa ra những suy luận không chính xác có điều kiện trong một số trường hợp, miễn là lỗi dài hạn của chúng tôi được giảm thiểu hoặc kiểm soát. Thành thật mà nói, sau khi viết bài này, tôi không chắc tại sao tôi lại muốn điều này trừ khi tôi bị trói buộc thời gian và không thể thực hiện phân tích Bayes ... hmmm.

Tôi có xu hướng ủng hộ suy luận fequentist dựa trên khả năng, vì tôi nhận được một số điều kiện (tiệm cận / gần đúng) từ chức năng khả năng, nhưng không cần phải lo lắng trước - tuy nhiên, tôi đã trở nên ngày càng thoải mái với suy luận Bayes, đặc biệt là Tôi thấy thuật ngữ chính quy aa trước cho suy luận mẫu nhỏ.

Xin lỗi vì đã qua một bên. Bất kỳ trợ giúp cho vấn đề chính của tôi được đánh giá cao.


1
một chỉnh sửa cho bài viết dường như đã làm rối liên kết, nhưng không có đủ thông tin để tôi sửa nó.
Dikran Marsupial

@DikranMarsupial cảm ơn vì đã nhận thấy điều đó. Tôi đã thêm lại trong liên kết.

Câu trả lời:


3

Tôi sẽ lập luận rằng những người thường xuyên thực sự thường là "người Bayes ẩn / không muốn", vì trong thực tế, chúng ta thường muốn thực hiện lý luận xác suất về những điều không có tần suất dài. Ví dụ kinh điển là Thử nghiệm thống kê giả thuyết Null (NHST), trong đó điều chúng ta thực sự muốn biết là xác suất tương đối của giả thuyết Null và nghiên cứu là đúng, nhưng chúng ta không thể làm điều này trong một bối cảnh thường xuyên vì sự thật của một giả thuyết cụ thể không có (không tầm thường) tần số chạy dài - nó là đúng hoặc không. Các NHST thường xuyên giải quyết vấn đề này bằng cách thay thế một câu hỏi khác, "xác suất quan sát kết quả ít nhất là cực kỳ theo giả thuyết khống" và sau đó so sánh với ngưỡng được xác định trước. Tuy nhiên thủ tục này không hợp lý cho phép chúng tôi kết luận bất cứ điều gì về việc liệu H0 hay H1 là đúng, và khi làm như vậy, chúng tôi thực sự bước ra khỏi khuôn khổ thường xuyên thành một Bayesian (thường chủ quan), trong đó chúng tôi kết luận rằng xác suất quan sát giá trị cực đoan như vậy theo H0 là thấp đến mức chúng ta không còn có thể tin rằng H0 có khả năng là đúng (lưu ý điều này là ngầm định gán một xác suất cho một giả thuyết cụ thể).

αp(H0)p(H1)

nhập mô tả hình ảnh ở đây

α

Khoảng tin cậy có thể cho là thường được sử dụng (và được hiểu là) một khoảng trong đó chúng ta có thể mong đợi để xem các quan sát với một xác suất nhất định, một lần nữa là một cách giải thích Bayes.

Các nhà thống kê lý tưởng nên nhận thức được lợi ích và nhược điểm của cả hai phương pháp và sẵn sàng sử dụng khuôn khổ phù hợp cho ứng dụng trong tay. Về cơ bản chúng ta nên nhắm đến việc sử dụng phân tích cung cấp câu trả lời trực tiếp nhất cho câu hỏi mà chúng ta thực sự muốn trả lời (và không lặng lẽ thay thế một câu hỏi khác), vì vậy cách tiếp cận thường xuyên có lẽ là hiệu quả nhất khi chúng ta thực sự quan tâm đến tần số dài và Phương pháp Bayes trong đó không phải là trường hợp.

H0


2
p<0,05

3
Tôi nghĩ rằng nó hoạt động như một lời chỉ trích về thống kê "nghi lễ null", trong đó NHST được sử dụng như một công thức từ sách nấu ăn thống kê mà không cần suy nghĩ / hiểu quy trình (có thể bao gồm cả tôi khi tôi bắt đầu; o).
Dikran Marsupial

2
Tôi nghĩ rằng một vấn đề lớn với NHST là ít hơn nghi thức p <0,05 và hơn nữa nó hạn chế một cách giả tạo không gian của các giả thuyết. Ý tôi là, họ không xem xét (như giả thuyết) nhiều lý do khác khiến trời tối hơn là "mặt trời nổ tung". Đây là điều tôi thực sự không thích về NHST ... nó quá bảo thủ đối với null. Ngoài ra, tôi tự hỏi sức mạnh của bài kiểm tra này sẽ là gì?

1
H0

@DikranMarsupial đồng ý! Fisher đã hình dung họ hỗ trợ các thí nghiệm nông nghiệp, đó là nơi giá trị p đến từ. Đánh giá thuốc trừ sâu và phân bón không giống như đánh giá các câu hỏi hiện sinh không thể lặp lại ... công cụ sai cho công việc.

4

Bayes và Người thường xuyên không chỉ khác nhau về cách họ có được các suy luận, hoặc các suy luận này giống nhau hoặc khác nhau như thế nào có thể không chắc chắn về các lựa chọn trước đó. Sự khác biệt chính là cách họ giải thích xác suất:

Xác suất Bayes :

Xác suất Bayes là một cách giải thích khái niệm xác suất. Trái ngược với việc diễn giải xác suất là tần số hoặc xu hướng của một số hiện tượng, xác suất Bayes là một đại lượng được chỉ định để thể hiện trạng thái của kiến ​​thức hoặc trạng thái của niềm tin.

Xác suất thường xuyên :

Xác suất thường xuyên hoặc chủ nghĩa thường xuyên là một cách giải thích tiêu chuẩn của xác suất; nó xác định xác suất của một sự kiện là giới hạn tần suất tương đối của nó trong một số lượng lớn các thử nghiệm. Giải thích này hỗ trợ nhu cầu thống kê của các nhà khoa học thực nghiệm và người gây ô nhiễm; xác suất có thể được tìm thấy (về nguyên tắc) bởi một quá trình mục tiêu có thể lặp lại (và do đó lý tưởng là không có ý kiến). Nó không hỗ trợ tất cả các nhu cầu; người đánh bạc thường yêu cầu ước tính tỷ lệ cược mà không cần thử nghiệm.

Hai định nghĩa này đại diện cho hai cách tiếp cận không thể hòa giải để xác định khái niệm xác suất (ít nhất là cho đến nay). Vì vậy, có hai sự khác biệt cơ bản hơn giữa hai lĩnh vực này so với việc bạn có thể có được các công cụ ước tính tương tự hoặc kết luận giống nhau trong một số mô hình tham số hoặc không tham số.


1
Tôi không nghĩ rằng chúng hoàn toàn không thể hòa giải, tần suất dài là cơ sở hoàn toàn hợp lý cho trạng thái kiến ​​thức hoặc niềm tin.
Dikran Marsupial

@DikranMarsupial Đây thực sự là một vấn đề mở trong triết học của khoa học. Tôi thấy quan điểm của bạn, nhưng sự hòa giải không đơn giản như vậy.
Pollo Anabolico

fbạnnctTôionmộttôitôiy

chắc chắn người thường xuyên sẽ tương đương về chức năng nếu cũng có một sự tương tự thường xuyên cho mọi thủ tục Bayes, điều này không thể đúng vì người Bayes có thể nói về xác suất cho những thứ không có tần số chạy dài, nhưng người thường xuyên không thể.
Dikran Marsupial

@DikranMarsupial vâng, đó là lý do tại sao tôi hỏi liệu fequentist có phải là tập con của Bayesian không (tôi thừa nhận rằng điều ngược lại được biết là sai).
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.