Bayesian và lý luận thường xuyên bằng tiếng Anh đơn giản


339

Làm thế nào bạn sẽ mô tả bằng tiếng Anh đơn giản các đặc điểm phân biệt Bayesian với lý luận thường xuyên?


Câu hỏi này về việc rút ra những suy luận về một người chơi tô riêng lẻ khi bạn có hai bộ dữ liệu - kết quả của người chơi khác và kết quả của người chơi mới, là một ví dụ tự nhiên về sự khác biệt mà câu trả lời của tôi cố gắng giải quyết bằng tiếng Anh.
Peter Ellis

4
Có lẽ một số người tốt của bạn cũng có thể đóng góp một câu trả lời cho một câu hỏi về Bayesian và những diễn giải thường xuyên được hỏi tại triết lý.stackexchange.com .
Drux

Câu trả lời:


198

Đây là cách tôi sẽ giải thích sự khác biệt cơ bản cho bà của tôi:

Tôi đã đặt nhầm điện thoại của tôi ở đâu đó trong nhà. Tôi có thể sử dụng công cụ định vị điện thoại trên đế của thiết bị để xác định vị trí điện thoại và khi tôi nhấn công cụ định vị điện thoại, điện thoại bắt đầu kêu bíp.

Vấn đề: Tôi nên tìm khu vực nào trong nhà?

Lý luận thường xuyên

Tôi có thể nghe thấy tiếng bíp điện thoại. Tôi cũng có một mô hình tinh thần giúp tôi xác định khu vực mà âm thanh phát ra. Do đó, khi nghe tiếng bíp, tôi suy ra khu vực nhà tôi phải tìm để xác định vị trí điện thoại.

Lý luận Bayes

Tôi có thể nghe thấy tiếng bíp điện thoại. Bây giờ, ngoài một mô hình tinh thần giúp tôi xác định khu vực phát ra âm thanh, tôi còn biết các vị trí mà tôi đã đặt nhầm điện thoại trong quá khứ. Vì vậy, tôi kết hợp các suy luận của mình bằng tiếng bíp và thông tin trước đó của tôi về các vị trí tôi đã đặt nhầm điện thoại trong quá khứ để xác định khu vực tôi phải tìm để xác định vị trí điện thoại.


11
Tôi thích sự tương tự. Tôi sẽ thấy nó rất hữu ích nếu có một câu hỏi được xác định (dựa trên bộ dữ liệu) trong đó một câu trả lời được sử dụng bằng lý luận thường xuyên và một câu trả lời được lấy bằng Bayesian - tốt nhất là với tập lệnh R để xử lý cả hai lý do. Tôi có hỏi quá nhiều không?
Farrel

15
Điều đơn giản nhất mà tôi có thể nghĩ đến đó là tung đồng xu n lần và ước tính xác suất của một người đứng đầu (biểu thị bằng p). Giả sử, chúng ta quan sát k đầu. Thì xác suất để có được k đầu là: P (k đứng đầu trong n thử nghiệm) = (n, k) p ^ k (1-p) ^ (nk) Suy luận thường xuyên sẽ tối đa hóa ở trên để đạt được ước tính p = k / viết sai rồi. Bayesian sẽ nói: Này, tôi biết rằng p ~ Beta (1,1) (tương đương với giả sử rằng p là đồng nhất trên [0,1]). Vì vậy, suy luận được cập nhật sẽ là: p ~ Beta (1 + k, 1 + nk) và do đó, ước tính bayes của p sẽ là p = 1 + k / (2 + n) Tôi không biết R, xin lỗi.

41
Cần phải chỉ ra rằng, từ quan điểm của những người thường xuyên, không có lý do gì mà bạn không thể kết hợp kiến ​​thức trước đó vào mô hình. Theo nghĩa này, chế độ xem thường xuyên đơn giản hơn, bạn chỉ có một mô hình và một số dữ liệu. Không cần phải tách thông tin trước khỏi mô hình.
Robby McKilliam

1
@ user28 Như một nhận xét về nhận xét của bạn, nếu , thì người thường xuyên sẽ ước tính (tương ứng ) khi thấy kết quả của đầu (tương ứng đầu), tức là, đồng xu là hai đầu hoặc hai đuôi. Bayesian ước tính và tương ứng cho phép khả năng đó là một đồng tiền ít thiên vị hơn. p = 0 p = 1 k = 0 k = 3 1 / 5 4 / 5n=3p=0p=1k=0k=31/54/5
Dilip Sarwate

3
@ BYS2 Ngôn ngữ lập trình có tên R.
user1205901

103

Lưỡi chắc nịch trong má:

Một Bayes định nghĩa một "xác suất" theo cách chính xác giống như hầu hết các nhà thống kê không làm - cụ thể là một dấu hiệu cho thấy tính hợp lý của một đề xuất hoặc một tình huống. Nếu bạn hỏi anh ta một câu hỏi, anh ta sẽ cho bạn một câu trả lời trực tiếp gán xác suất mô tả tính hợp lý của các kết quả có thể xảy ra cho tình huống cụ thể (và nêu các giả định trước đó của anh ta).

Một người thường xuyên là người tin rằng xác suất đại diện cho tần suất chạy dài với các sự kiện xảy ra; nếu cần, anh ta sẽ phát minh ra một quần thể hư cấu mà từ đó tình huống cụ thể của bạn có thể được coi là một mẫu ngẫu nhiên để anh ta có thể nói một cách có ý nghĩa về tần số chạy dài. Nếu bạn hỏi anh ta một câu hỏi về một tình huống cụ thể, anh ta sẽ không đưa ra câu trả lời trực tiếp, mà thay vào đó hãy đưa ra tuyên bố về dân số (có thể là tưởng tượng) này. Nhiều nhà thống kê không thường xuyên sẽ dễ bị nhầm lẫn bởi câu trả lời và giải thích nó là xác suất Bayes về tình huống cụ thể.

Tuy nhiên, điều quan trọng cần lưu ý là hầu hết các phương pháp Thường xuyên đều có tương đương Bayes vì ​​trong hầu hết các trường hợp sẽ cho kết quả cơ bản giống nhau, sự khác biệt chủ yếu là vấn đề triết học và trong thực tế, đó là vấn đề "ngựa cho các khóa học".

Như bạn có thể đoán, tôi là một người Bayes và một kỹ sư. ; o)


36
Là một người không chuyên gia, tôi nghĩ rằng chìa khóa của toàn bộ cuộc tranh luận là mọi người thực sự có lý do như Bayes. Bạn phải được đào tạo để suy nghĩ như một người thường xuyên, và thậm chí sau đó thật dễ dàng để trượt lên và lý do hoặc trình bày lý lẽ của bạn như thể đó là Bayes. "Có 95% khả năng giá trị nằm trong khoảng tin cậy này." Đủ nói.
Wayne

8
Điều quan trọng nữa là suy nghĩ về loại vận động hành lang nào có số liệu thống kê của thế kỷ 20 được gọi là "cổ điển" trong khi số liệu thống kê mà Laplace và Gauss đã bắt đầu sử dụng vào thế kỷ 19 không ...
viết

3
Có thể tôi đã làm công việc thường xuyên quá lâu, nhưng tôi không chắc rằng quan điểm của Bayes luôn trực quan. Ví dụ: giả sử tôi quan tâm đến một tham số quan tâm trong thế giới thực, chẳng hạn như chiều cao trung bình của dân số. Nếu tôi nói với bạn "có 95% khả năng tham số quan tâm trong khoảng tin cậy của tôi", và sau đó theo dõi câu hỏi "Nếu chúng tôi tạo ra 100 khoảng như vậy cho các tham số khác nhau, chúng tôi sẽ chứa tỷ lệ nào trong số chúng Giá trị thực của tham số? ", thực tế là câu trả lời không phải là 95 phải gây nhầm lẫn cho một số người.
Vách đá AB

4
@CliffAB nhưng tại sao bạn lại hỏi câu hỏi thứ hai? Vấn đề là chúng là những câu hỏi khác nhau, vì vậy không có gì ngạc nhiên khi chúng có câu trả lời khác nhau. Baysian có thể trả lời cả hai câu hỏi, nhưng câu trả lời có thể khác nhau (có vẻ hợp lý với tôi). Người thường xuyên chỉ có thể trả lời một trong những câu hỏi (do định nghĩa hạn chế của xác suất) và do đó (ngầm) sử dụng cùng một câu trả lời cho cả hai câu hỏi, đó là nguyên nhân gây ra vấn đề. Khoảng tin cậy không phải là khoảng tin cậy, nhưng Bayes có thể xây dựng cả khoảng tin cậy và khoảng tin cậy.
Dikran Marsupial

4
Nhận xét của tôi là để đáp lại Wayne; ý tưởng mà mọi người "tự nhiên" nghĩ trong bối cảnh Bayes, vì nó dễ dàng hơn để giải thích một khoảng đáng tin cậy. Quan điểm của tôi là mặc dù đơn giản hơn để xây dựng cách giải thích đúng về một khoảng đáng tin cậy (tức là ít hơn một từ súp), tôi nghĩ rằng người không thống kê cũng có khả năng bị nhầm lẫn về ý nghĩa thực sự của nó .
Vách đá AB

63

Rất thô lỗ tôi sẽ nói rằng:

Người thường xuyên: Lấy mẫu là vô hạn và quy tắc quyết định có thể sắc nét. Dữ liệu là một mẫu ngẫu nhiên lặp lại - có một tần số. Các tham số cơ sở được cố định tức là chúng không đổi trong quá trình lấy mẫu lặp lại này.

Bayesian: Số lượng không xác định được xử lý theo xác suất và trạng thái của thế giới luôn có thể được cập nhật. Dữ liệu được quan sát từ mẫu nhận ra. Các thông số không xác định và được mô tả xác suất. Đây là dữ liệu được cố định.

Có một bài viết tuyệt vời đưa ra một ví dụ sâu sắc về cách một người Bayes và Người thường xuyên giải quyết vấn đề tương tự. Tại sao không trả lời vấn đề cho mình và sau đó kiểm tra?

Vấn đề (lấy từ blog của Panos Ipeirotis):

Bạn có một đồng xu khi lật kết thúc với xác suất p và kết thúc đuôi với xác suất 1-p. (Giá trị của p là không xác định.)

Cố gắng ước tính p, bạn lật xu 100 lần. Nó kết thúc đầu 71 lần.

Sau đó, bạn phải quyết định về sự kiện sau: "Trong hai lần ném tiếp theo, chúng tôi sẽ nhận được hai cái đầu liên tiếp."

Bạn có đặt cược rằng sự kiện sẽ xảy ra hoặc nó sẽ không xảy ra?


5
0.712=0.5041

5
Ở phần cuối của bài đăng trên blog đó có ghi "thay vì sử dụng phân phối thống nhất như trước, chúng ta có thể thậm chí còn không tin hơn. Trong trường hợp này, chúng ta có thể sử dụng phân phối Beta (0,0) như trước. Phân phối như vậy tương ứng trong trường hợp bất kỳ phương tiện phân phối nào cũng có khả năng như nhau. Trong trường hợp này, hai cách tiếp cận, Bayes và người thường xuyên cho kết quả như nhau. " Đó là loại tổng hợp thực sự!
tdc

13
Các lớn vấn đề với điều đó bài viết trên blog là nó không đặc trưng đầy đủ những gì một tổ chức phi Bayesian (nhưng hợp lý) quyết định sẽ làm gì. Nó ít hơn một người đàn ông rơm.
whuber

1
@tdc: Bayesian (Jeffreys) trước là Beta (0,5, 0,5) và một số người sẽ nói rằng đó là lần duy nhất chính đáng trước.
Neil G

1
@mcb - chính xác.
Digitgopher

42

Hãy để chúng tôi nói rằng một người đàn ông lăn một cái chết sáu mặt và nó có kết quả 1, 2, 3, 4, 5 hoặc 6. Hơn nữa, anh ta nói rằng nếu nó rơi vào 3, anh ta sẽ đưa cho bạn một cuốn sách văn bản miễn phí.

Sau đó không chính thức:

Người thường xuyên nói rằng mỗi kết quả có 1 trong 6 cơ hội xảy ra. Cô xem xác suất là có nguồn gốc từ phân phối tần số dài.

Các Bayesian tuy nhiên sẽ nói treo trên một giây, tôi biết người đàn ông đó, anh là David Blaine, một người lường gạt nổi tiếng! Tôi có cảm giác anh ấy đang làm gì đó. Tôi sẽ nói rằng chỉ có 1% cơ hội nó hạ cánh trên 3 NHƯNG tôi sẽ đánh giá lại niềm tin đó và thay đổi nó nhiều lần anh ta lăn xác chết. Nếu tôi thấy các số khác xuất hiện như nhau thường xuyên, thì tôi sẽ tăng cơ hội từ 1% lên cao hơn một chút, nếu không tôi sẽ giảm hơn nữa. Cô xem xác suất là mức độ của niềm tin vào một đề xuất.


24
Tôi nghĩ rằng người thường xuyên sẽ (bằng lời nói) chỉ ra các giả định của mình và sẽ tránh đưa ra bất kỳ dự đoán hữu ích nào. Có lẽ anh ta sẽ nói: "Giả sử cái chết là công bằng, mỗi kết quả có 1 trong 6 cơ hội xảy ra. Ngoài ra, nếu các cuộn chết là công bằng và David Blaine lăn chết 17 lần, chỉ có 5% cơ hội nó sẽ không bao giờ hạ cánh trên 3, vì vậy kết cục như vậy sẽ khiến tôi nghi ngờ rằng cái chết là công bằng. "
Thomas Levine

Vậy "khả năng" (như trong MLE) có phải là "xác suất" thường xuyên không?
Akababa

40

Chỉ một chút vui thôi ...

Một người Bayes là một người, mơ hồ mong đợi một con ngựa và thoáng thấy một con lừa, tin tưởng mạnh mẽ rằng anh ta đã nhìn thấy một con la.

Từ trang web này:

http://www2.isye.gatech.edu/~brani/isyebayes/jokes.html

và từ cùng một trang, một bài luận hay ...

"Một giải thích trực quan về định lý Bayes"

http://yudkowsky.net/rational/bayes


14
Trong trường hợp đó, người thường xuyên sẽ không phải là người biết tỷ lệ của quần thể lừa, la và ngựa, và khi quan sát một gói con la bắt đầu tính giá trị p để biết liệu có sự gia tăng đáng kể về mặt thống kê hay không trong tỷ lệ dân số của con la.
Andrew

30

Bayesian được yêu cầu đặt cược, trong đó có thể bao gồm bất cứ thứ gì từ con ruồi sẽ bò lên một bức tường nhanh hơn để thuốc sẽ cứu hầu hết mạng sống, hoặc tù nhân nào nên vào tù. Anh ta có một cái hộp lớn có tay cầm. Anh ta biết rằng nếu anh ta đặt hoàn toàn mọi thứ anh ta biết vào hộp, bao gồm cả ý kiến ​​cá nhân của anh ta, và xoay tay cầm, nó sẽ đưa ra quyết định tốt nhất có thể cho anh ta.

Người thường xuyên được yêu cầu viết báo cáo. Ông có một cuốn sách đen lớn về các quy tắc. Nếu tình huống anh ta được yêu cầu lập báo cáo được bao phủ bởi quy tắc của mình, anh ta có thể tuân theo các quy tắc và viết một báo cáo cẩn thận rằng nó sai, tệ nhất là một lần trong 100 (hoặc một lần trong 20, hoặc một lần trong 20, hoặc một lần trong 20 thời gian trong bất cứ điều gì đặc điểm kỹ thuật cho báo cáo của mình nói).

Người thường xuyên biết (vì anh ta đã viết báo cáo về nó) rằng đôi khi Bayes đặt cược rằng, trong trường hợp xấu nhất, khi ý kiến ​​cá nhân của anh ta sai, có thể trở nên tồi tệ. Người thường xuyên cũng biết (vì lý do tương tự) rằng nếu anh ta cá cược với Bayes mỗi khi anh ta khác với anh ta, thì về lâu dài, anh ta sẽ thua.


"Trong thời gian dài, anh ấy sẽ thua" là mơ hồ. Tôi cho rằng 'anh ấy' là người Bayes ở đây? Họ sẽ không bằng nhau trong thời gian dài - người Bayes có thể học hỏi và thay đổi quan điểm cá nhân của mình cho đến khi nó phù hợp với thực tế (nhưng chưa biết).
lucidbrot

26

Nói một cách dễ hiểu, tôi sẽ nói rằng lý luận Bayes và Thường xuyên được phân biệt bằng hai cách khác nhau để trả lời câu hỏi:

Xác suất là gì?

Hầu hết các khác biệt về cơ bản sẽ tập trung vào cách mỗi câu trả lời cho câu hỏi này, vì về cơ bản nó xác định miền của các ứng dụng hợp lệ của lý thuyết. Bây giờ bạn thực sự không thể đưa ra câu trả lời theo nghĩa "tiếng Anh đơn giản", mà không tạo thêm câu hỏi. Đối với tôi câu trả lời là (như bạn có thể đoán)

xác suất là logic

10. Ngoài ra, tính toán xác suất có thể được lấy từ tính toán của các mệnh đề. Điều này phù hợp với lý luận "bayes" một cách chặt chẽ nhất - mặc dù nó cũng mở rộng lý luận bayes trong các ứng dụng bằng cách cung cấp các nguyên tắc để gán xác suất, ngoài các nguyên tắc để thao túng chúng. Tất nhiên, điều này dẫn đến câu hỏi tiếp theo "logic là gì?" đối với tôi, điều gần gũi nhất mà tôi có thể đưa ra để trả lời cho câu hỏi này là "logic là phán đoán thông thường của một người có lý trí, với một loạt các giả định nhất định" (một người có lý trí là gì? v.v.). Logic có tất cả các tính năng giống như lý luận Bayes có. Ví dụ, logic không cho bạn biết cái gì giả định hoặc cái gì là "hoàn toàn đúng". Nó chỉ cho bạn biết sự thật của một mệnh đề có liên quan đến sự thật của một mệnh đề khác như thế nào. Bạn luôn phải cung cấp một hệ thống logic với "tiên đề" để hệ thống bắt đầu kết luận. Chúng cũng có những hạn chế tương tự ở chỗ bạn có thể nhận được kết quả tùy ý từ các tiên đề mâu thuẫn. Nhưng "tiên đề" không là gì ngoài những xác suất trước đó đã được đặt thành1

Đối với lý luận thường xuyên, chúng tôi có câu trả lời:

xác suất là tần số

mặc dù tôi không chắc "tần số" là một thuật ngữ tiếng Anh đơn giản theo cách nó được sử dụng ở đây - có lẽ "tỷ lệ" là một từ tốt hơn. Tôi muốn thêm vào câu trả lời thường xuyên rằng xác suất của một sự kiện được cho là một đại lượng thực, có thể đo lường được (có thể quan sát được?), Tồn tại độc lập với người / đối tượng đang tính toán nó. Nhưng tôi không thể làm điều này theo cách "tiếng Anh đơn giản".

Vì vậy, có lẽ một phiên bản "tiếng Anh đơn giản" của một sự khác biệt có thể là lý do thường xuyên là một nỗ lực lý luận từ xác suất "tuyệt đối", trong khi lý luận Bayes là một nỗ lực lý luận từ xác suất "tương đối".

Một điểm khác biệt nữa là các nền tảng thường xuyên mơ hồ hơn trong cách bạn dịch vấn đề thế giới thực sang toán học trừu tượng của lý thuyết. Một ví dụ điển hình là việc sử dụng "các biến ngẫu nhiên" trong lý thuyết - chúng có một định nghĩa chính xác trong thế giới trừu tượng của toán học, nhưng không có quy trình rõ ràng nào mà người ta có thể sử dụng để quyết định xem một số lượng quan sát được hay không là "ngẫu nhiên" Biến đổi".

Cách suy luận của người Bayes, khái niệm "biến ngẫu nhiên" là không cần thiết. Phân phối xác suất được gán cho một đại lượng vì không xác định - điều đó có nghĩa là không thể suy ra một cách hợp lý từ thông tin chúng tôi có. Điều này cung cấp cùng một lúc một kết nối đơn giản giữa số lượng quan sát được và lý thuyết - vì "không xác định" là không rõ ràng.

Bạn cũng có thể thấy trong ví dụ trên một sự khác biệt hơn nữa trong hai cách suy nghĩ này - "ngẫu nhiên" so với "không biết". "Tính ngẫu nhiên" được diễn đạt theo cách mà "tính ngẫu nhiên" có vẻ như nó là một tính chất của số lượng thực tế. Ngược lại, "không xác định" phụ thuộc vào người bạn đang hỏi về số lượng đó - do đó, đó là một tài sản của nhà thống kê thực hiện phân tích. Điều này dẫn đến các tính từ "khách quan" so với "chủ quan" thường được gắn với mỗi lý thuyết. Thật dễ dàng để chỉ ra rằng "tính ngẫu nhiên" không thể là một đặc tính của một số ví dụ tiêu chuẩn, bằng cách chỉ cần hỏi hai người thường xuyên được cung cấp thông tin khác nhau về cùng một số lượng để quyết định xem có phải là "ngẫu nhiên" hay không. Một là Bernoulli Urn thông thường: người thường xuyên 1 bị bịt mắt trong khi vẽ, trong khi người thường xuyên 2 đang đứng trên chiếc bình, xem người thường xuyên 1 vẽ những quả bóng từ chiếc bình. Nếu tuyên bố "ngẫu nhiên" là một tính chất của các quả bóng trong bình, thì nó không thể phụ thuộc vào kiến ​​thức khác nhau của người thường xuyên 1 và 2 - và do đó hai người thường xuyên nên đưa ra cùng một tuyên bố "ngẫu nhiên" hoặc "không ngẫu nhiên" .


3
Tôi sẽ quan tâm nếu bạn có thể viết lại điều này mà không cần tham chiếu đến lẽ thường.
Peter Ellis

@PeterEllis - Có gì sai với lẽ thường? Tất cả chúng ta đều có nó, và thật ngu ngốc khi không sử dụng nó ...
xác suất

13
Nó quá tranh cãi về những gì nó thực sự là, và quá cụ thể về văn hóa. "Ý thức thông thường" là bàn tay ngắn cho bất cứ điều gì là cách cảm nhận hợp lý để làm mọi việc trong nền văn hóa đặc biệt này (mà tất cả thường trông xa lạ với văn hóa khác trong thời gian và không gian), vì vậy, đề cập đến nó trong một định nghĩa đưa ra các câu hỏi chính . Điều này đặc biệt không hữu ích khi là một phần của định nghĩa logic (và vì vậy, tôi sẽ tranh luận, là khái niệm về "người có lý trí" trong bối cảnh cụ thể đó - đặc biệt khi tôi đoán định nghĩa của bạn về "người có lý trí" sẽ là một người logic người có ý thức chung!)
Peter Ellis

4
Anh ta không thể cung cấp một, lập luận của anh ta là không có định nghĩa phổ quát , chỉ có những định nghĩa cụ thể về văn hóa. Hai người từ các nền văn hóa khác nhau (và bao gồm các phong cách giáo dục thống kê khác nhau) hoàn toàn có thể có hai cách hiểu khác nhau về những gì hợp lý để làm trong một tình huống nhất định.
ness101

2
Câu trả lời này có nhiều điểm tốt (tiếng Anh đơn giản như thế nào?), Nhưng tôi không tin (làm thế nào để trở thành người Bayes!) Rằng câu nói sau đây là đúng: "Vì nếu bạn chấp nhận logic ... bạn cũng phải chấp nhận Lý luận Bayes ". Ví dụ, nếu bạn nghĩ thay vì dịch lý thuyết trừu tượng của toán học sang thế giới thực, bạn sẽ thấy rằng phương pháp tiên đề có thể phù hợp với cả lý luận Thường xuyên và Bayes! Có thể cho rằng, Kolmogorov trong trường hợp đầu tiên, và, nói, Jeffreys trong lần thứ hai. Về bản chất, đó là lý thuyết xác suất đó là logic; không giải thích nó.
Graeme Walsh

21

Trong thực tế, tôi nghĩ rằng phần lớn triết lý xung quanh vấn đề này chỉ là sự vĩ đại. Đó không phải là để bác bỏ cuộc tranh luận, nhưng đó là một lời cảnh báo. Đôi khi, các vấn đề thực tế được ưu tiên - tôi sẽ đưa ra một ví dụ dưới đây.

Ngoài ra, bạn có thể dễ dàng lập luận rằng có nhiều hơn hai cách tiếp cận:

  • Neyman-Pearson ('người thường xuyên')
  • Phương pháp tiếp cận dựa trên khả năng
  • Bayes hoàn toàn

Một đồng nghiệp cao cấp gần đây đã nhắc nhở tôi rằng "nhiều người trong ngôn ngữ chung nói về người thường xuyên và người Bayes. Tôi nghĩ rằng một sự khác biệt hợp lý hơn là dựa trên khả năng và người thường xuyên. Cả hai phương pháp tối đa và phương pháp Bayes đều tuân thủ nguyên tắc khả năng trong khi phương pháp thường xuyên thì không. "

Tôi sẽ bắt đầu với một ví dụ thực tế rất đơn giản:

P(+|S)=1
P(Correct|S)=1
P(|H)=0.95
P(+|H)=0.05

Vì vậy, xét nghiệm là chính xác 100% hoặc chính xác 95%, tùy thuộc vào việc bệnh nhân khỏe hay ốm. Được kết hợp với nhau, điều này có nghĩa là thử nghiệm có độ chính xác ít nhất 95%.

Càng xa càng tốt. Đó là những tuyên bố sẽ được đưa ra bởi một người thường xuyên. Những tuyên bố này khá đơn giản để hiểu và là sự thật. Không cần phải vặn vẹo về một 'giải thích thường xuyên'.

Nhưng, mọi thứ trở nên thú vị khi bạn cố gắng xoay chuyển mọi thứ. Cho kết quả xét nghiệm, bạn có thể tìm hiểu gì về sức khỏe của bệnh nhân? Cho kết quả xét nghiệm âm tính, bệnh nhân rõ ràng khỏe mạnh, vì không có âm tính giả.

Nhưng chúng ta cũng phải xem xét trường hợp xét nghiệm dương tính. Xét nghiệm dương tính vì bệnh nhân thực sự bị bệnh, hay là dương tính giả? Đây là nơi thường xuyên và Bayes phân kỳ. Mọi người sẽ đồng ý rằng điều này không thể được trả lời vào lúc này. Người thường xuyên sẽ từ chối trả lời. Bayesian sẽ được chuẩn bị để đưa ra câu trả lời cho bạn, nhưng bạn sẽ phải cung cấp cho Bayesian trước - tức là cho nó biết tỷ lệ bệnh nhân bị bệnh.

Tóm lại, các tuyên bố sau là đúng:

  • Đối với bệnh nhân khỏe mạnh, xét nghiệm rất chính xác.
  • Đối với bệnh nhân bị bệnh, xét nghiệm rất chính xác.

Nếu bạn hài lòng với các tuyên bố như vậy, thì bạn đang sử dụng các diễn giải thường xuyên. Điều này có thể thay đổi từ dự án này sang dự án khác, tùy thuộc vào loại vấn đề bạn đang xem xét.

Nhưng bạn có thể muốn đưa ra các tuyên bố khác nhau và trả lời câu hỏi sau đây:

  • Đối với những bệnh nhân có kết quả xét nghiệm dương tính, xét nghiệm chính xác đến mức nào?

Điều này đòi hỏi một cách tiếp cận trước và Bayes. Cũng lưu ý rằng đây là câu hỏi duy nhất quan tâm đến bác sĩ. Bác sĩ sẽ nói "Tôi biết rằng các bệnh nhân sẽ có kết quả dương tính hoặc kết quả âm tính. Bây giờ tôi cũng cho rằng kết quả âm tính có nghĩa là bệnh nhân khỏe mạnh và có thể được gửi về nhà. một kết quả tích cực - họ có bị bệnh không? "

Tóm lại: Trong các ví dụ như thế này, Bayes sẽ đồng ý với mọi thứ được nói bởi người thường xuyên. Nhưng Bayes sẽ lập luận rằng các tuyên bố của người thường xuyên, trong khi sự thật, không hữu ích lắm; và sẽ lập luận rằng các câu hỏi hữu ích chỉ có thể được trả lời trước.

Một người thường xuyên sẽ lần lượt xem xét từng giá trị có thể của tham số (H hoặc S) và hỏi "nếu tham số đó bằng giá trị này, xác suất thử nghiệm của tôi là chính xác là bao nhiêu?"

Thay vào đó, một người Bayes sẽ lần lượt xem xét từng giá trị quan sát có thể (+ hoặc -) và hỏi "Nếu tôi tưởng tượng tôi vừa quan sát giá trị đó, điều đó cho tôi biết gì về xác suất có điều kiện của H-vs.-S?"


1
Bạn có nghĩa là For sick patients, the test is NOT very accurate.bạn quên cái KHÔNG?
agstudy

1
Nó rất chính xác trong cả hai trường hợp, vì vậy không tôi không quên một từ. Đối với những người khỏe mạnh, kết quả sẽ chính xác (nghĩa là 'Tiêu cực') 95% thời gian. Và đối với những người bị bệnh, kết quả sẽ chính xác (nghĩa là 'Tích cực') 95% thời gian.
Aaron McDaid

Tôi nghĩ rằng "điểm yếu" trong khả năng tối đa là nó giả định đồng phục trước dữ liệu trong khi "Bayesian đầy đủ" linh hoạt hơn trong những gì bạn có thể chọn trước.
Joe Z.

Để hoàn thành ví dụ, giả sử 0,1% dân số mắc bệnh D mà chúng tôi đang thử nghiệm: đây không phải là trước đây của chúng tôi. Nhiều khả năng, khoảng 30% bệnh nhân đến bác sĩ và có các triệu chứng phù hợp với D thực sự có D (điều này có thể nhiều hơn hoặc ít hơn tùy thuộc vào chi tiết như tần suất một bệnh khác nhau có cùng triệu chứng). Vì vậy, 70% những người tham gia thử nghiệm đều khỏe mạnh, 66,5% nhận được kết quả âm tính và 30% / 33,5% bị bệnh. Vì vậy, cho một kết quả tích cực, xác suất sau của chúng tôi rằng một bệnh nhân bị bệnh là 89,6%. Câu đố tiếp theo: làm thế nào chúng ta biết 70% người làm bài kiểm tra có D?
Qwertie

7

Thống kê Bayes và thường xuyên tương thích ở chỗ chúng có thể được hiểu là hai trường hợp giới hạn đánh giá xác suất của các sự kiện trong tương lai dựa trên các sự kiện trong quá khứ và một mô hình giả định, nếu người ta thừa nhận rằng trong giới hạn của một số lượng lớn các quan sát, không chắc chắn về hệ thống vẫn còn, và theo nghĩa này, một số lượng lớn các quan sát tương đương với việc biết các tham số của mô hình.

Giả sử chúng tôi đã thực hiện một số quan sát, ví dụ, kết quả của 10 lần lật đồng xu. Trong thống kê Bayes, bạn bắt đầu từ những gì bạn đã quan sát và sau đó bạn đánh giá xác suất của các quan sát trong tương lai hoặc các tham số mô hình. Trong thống kê thường xuyên, bạn bắt đầu từ một ý tưởng (giả thuyết) về những gì là đúng bằng cách giả sử các kịch bản của một số lượng lớn các quan sát đã được thực hiện, ví dụ, đồng xu không thiên vị và đưa ra 50% đầu, nếu bạn ném nó nhiều lần. Dựa trên những kịch bản của một số lượng lớn các quan sát (= giả thuyết), bạn đánh giá tần suất thực hiện các quan sát giống như bạn đã làm, tức là tần suất của các kết quả khác nhau của 10 lần lật đồng xu. Chỉ sau đó bạn lấy kết quả thực tế của mình, so sánh nó với tần suất của các kết quả có thể xảy ra và quyết định xem kết quả có thuộc về những kết quả được dự kiến ​​sẽ xảy ra với tần suất cao hay không. Nếu đây là trường hợp bạn kết luận rằng quan sát được thực hiện không mâu thuẫn với các kịch bản của bạn (= giả thuyết). Mặt khác, bạn kết luận rằng quan sát được thực hiện không tương thích với các kịch bản của bạn và bạn từ chối giả thuyết.

Do đó, thống kê Bayes bắt đầu từ những gì đã được quan sát và đánh giá các kết quả có thể xảy ra trong tương lai. Thống kê thường xuyên bắt đầu bằng một thử nghiệm trừu tượng về những gì sẽ được quan sát nếu một người giả định điều gì đó, và chỉ sau đó so sánh kết quả của thí nghiệm trừu tượng với những gì thực sự được quan sát. Nếu không, hai cách tiếp cận là tương thích. Cả hai đều đánh giá xác suất của các quan sát trong tương lai dựa trên một số quan sát được thực hiện hoặc đưa ra giả thuyết.

Tôi bắt đầu viết nó lên một cách trang trọng hơn:

Định vị suy luận Bayes như một ứng dụng cụ thể của suy luận thường xuyên và ngược lại. vả

http://dx.doi.org/10.6084/m9.figshare.867707

Bản thảo là mới. Nếu bạn tình cờ đọc nó, và có ý kiến, xin vui lòng cho tôi biết.


6

Tôi sẽ nói rằng họ nhìn vào xác suất theo những cách khác nhau. Bayes là chủ quan và sử dụng niềm tin tiên nghiệm để xác định phân phối xác suất trước trên các giá trị có thể có của các tham số chưa biết. Vì vậy, ông dựa vào một lý thuyết xác suất như của deFinetti. Người thường xuyên xem xác suất là một việc phải làm với tần suất giới hạn dựa trên tỷ lệ quan sát được. Điều này phù hợp với lý thuyết xác suất được phát triển bởi Kolmogorov và von Mises.
Một người thường xuyên thực hiện suy luận tham số chỉ sử dụng hàm khả năng. Một Bayes lấy điều đó và nhân lên trước và bình thường hóa nó để có được phân phối sau mà anh ta sử dụng để suy luận.


4
+1 Câu trả lời hay, nhưng cần nhấn mạnh rằng cách tiếp cận Bayes và cách tiếp cận Tần số khác nhau đối với cách giải thích xác suất của họ . Kolmogorov, mặt khác, cung cấp một nền tảng tiên đề cho lý thuyết xác suất, không yêu cầu giải thích (!) Giống như những người được sử dụng bởi Bayesian hoặc Người thường xuyên. Theo một nghĩa nào đó, hệ tiên đề có một cuộc sống của riêng nó! Từ sáu tiên đề của Kolmogorov, tôi không nghĩ có thể nói rằng hệ tiên đề của anh ta là Bayesian hay Người thường xuyên, và trên thực tế, có thể phù hợp với cả hai.
Graeme Walsh

0

Cách tôi trả lời câu hỏi này là những người thường xuyên so sánh dữ liệu họ thấy với những gì họ mong đợi. Đó là, họ có một mô hình tinh thần về mức độ thường xuyên xảy ra, và sau đó xem dữ liệu và mức độ thường xuyên xảy ra. tức là khả năng dữ liệu họ đã thấy được đưa ra cho mô hình mà họ đã chọn.

Người Bayes , mặt khác, kết hợp các mô hình tinh thần của họ. Đó là, họ có một mô hình dựa trên kinh nghiệm trước đây của họ cho họ biết họ nghĩ dữ liệu sẽ như thế nào, và sau đó họ kết hợp dữ liệu này với dữ liệu họ quan sát để giải quyết niềm tin của `` hậu thế '. tức là, họ tìm thấy xác suất mà mô hình họ tìm cách chọn là hợp lệ dựa trên dữ liệu họ đã quan sát được.


-2

Người thường xuyên: Trạng thái thực sự của tự nhiên là. Nếu tôi thường xuyên phân tích như thế này, 95% câu trả lời của tôi sẽ đúng.

Bayesian: Có 95% khả năng câu trả lời đúng là .... Tôi dựa trên cơ sở kết hợp dữ liệu bạn đưa cho tôi và những dự đoán trước của chúng tôi về sự thật là gì.


-3

Người thường xuyên: đặt cược vào súc sắc. Chỉ giá trị của súc sắc sẽ quyết định kết quả: bạn thắng cược hoặc bạn không thắng. Tùy cơ hội một mình.

Bayesian: chơi bài xì phé Texas Hold'em. Bạn là người duy nhất nhìn thấy hai thẻ của bạn. Bạn có một số kiến ​​thức về những người chơi khác trên bàn. Bạn phải điều chỉnh xác suất của mình để giành chiến thắng trên flop, rẽ và sông và có thể theo đó người chơi còn lại. Họ có vô tội vạ thường xuyên không? Họ là những người chơi gây khó chịu hay thụ động? Tất cả điều này sẽ quyết định những gì bạn làm. Nó không chỉ là xác suất của hai thẻ đầu tiên bạn nhận được, mà sẽ quyết định bạn có thắng hay không.

Để chơi bài xì phé thường xuyên có nghĩa là mọi người chơi sẽ giơ tay ngay từ đầu và sau đó đặt cược hoặc xếp lại trước khi lật, lật và thẻ sông được hiển thị. Bây giờ nó chỉ phụ thuộc vào cơ hội một lần nữa cho dù bạn có thắng hay không.


-5

Nói, nếu bạn bị đau đầu và đi khám bác sĩ. Giả sử, trong quyết định của bác sĩ, có hai nguyên nhân gây đau đầu, # 1 cho khối u não (nguyên nhân gốc gây đau đầu 99% thời gian) và cảm lạnh # 2 (nguyên nhân có thể gây đau đầu ở rất ít bệnh nhân) .

Sau đó, một quyết định của bác sĩ dựa trên phương pháp Thường xuyên sẽ là, bạn bị u não.

Quyết định của bác sĩ dựa trên phương pháp Bayes sẽ cho bạn biết, bạn bị cảm lạnh (ngay cả khi chỉ có 1% cảm lạnh gây đau đầu)


1
(-1) Không rõ sự khác biệt giữa "Tài liệu thường xuyên" và "Tài liệu Bayes" là gì. Tôi thấy không có lý do tại sao tài liệu thường xuyên sẽ bỏ qua dữ liệu về cảm lạnh gây đau đầu. Dù sao, tài liệu Bayes dường như không sử dụng định lý Bayes hay linh mục, vì vậy tôi không thấy ông Bayesian thế nào?
Tim

Quá không hợp lý để trở thành một sự tương tự hữu ích hoặc thậm chí là giải trí.
Nick Cox

-6

Một con mèo đực và một con mèo cái được nhốt trong một buồng thép, cùng với đủ thức ăn và nước uống trong 70 ngày.

Một người thường xuyên nói rằng thời gian mang thai trung bình của mèo cái là 66 ngày, con cái bị nóng khi mèo bị cắn, và một khi trời nóng, nó sẽ giao phối liên tục trong 4 đến 7 ngày. Vì có khả năng có nhiều hành vi nhân giống và đủ thời gian tiếp theo cho thời kỳ mang thai, tỷ lệ cược là, khi hộp được mở vào ngày 70, có một lứa mèo con mới sinh.

Một người Bayes sẽ nói, tôi đã nghe một số Marvin Gaye nghiêm túc phát ra từ chiếc hộp vào ngày 1 và sáng nay tôi nghe thấy nhiều âm thanh giống như mèo con phát ra từ chiếc hộp. Vì vậy, không biết nhiều về sinh sản của mèo, tỷ lệ cược là, khi chiếc hộp được mở vào ngày 70, có một lứa mèo con mới sinh.


Cách tôi viết nó lên, cụ thể là với người Bayes không biết nhiều về sinh sản của mèo, lúc đầu chỉ có người thường xuyên đặt cược vào việc có mèo con. Những điểm liên quan trong ví dụ rất thô thiển của tôi chủ yếu là người thường xuyên đưa ra dự đoán của mình dựa trên dữ liệu lúc đầu, sau đó ngồi lại mà không kết hợp dữ liệu bổ sung mới, trong khi Bayes không có nhiều dữ liệu để bắt đầu, nhưng vẫn tiếp tục kết hợp dữ liệu liên quan khi nó trở nên có sẵn.
Một con sư tử

3
... và tại sao một người không phải là người Bayes cũng tận dụng các dữ liệu bổ sung?
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.