Có bất kỳ cơ sở * toán học * nào cho cuộc tranh luận Bayesian và thường xuyên không?


67

Nó nói trên Wikipedia rằng:

toán học [về xác suất] phần lớn không phụ thuộc vào bất kỳ sự giải thích nào về xác suất.

Câu hỏi: Sau đó, nếu chúng ta muốn chính xác về mặt toán học, chúng ta có nên không cho phép bất kỳ giải thích xác suất nào không? Tức là cả Bayes và chủ nghĩa thường xuyên về mặt toán học không chính xác?

Tôi không thích triết học, nhưng tôi thích toán học và tôi muốn làm việc độc quyền trong khuôn khổ các tiên đề của Kolmogorov. Nếu đây là mục tiêu của tôi, liệu nó có nên tuân theo những gì nó nói trên Wikipedia rằng tôi nên từ chối cả chủ nghĩa Bayes và chủ nghĩa thường xuyên? Nếu các khái niệm hoàn toàn là triết học và hoàn toàn không phải là toán học, thì tại sao chúng lại xuất hiện trong thống kê ngay từ đầu?

Bối cảnh / Bối cảnh:
Bài đăng trên blog này không hoàn toàn nói điều tương tự, nhưng nó cho rằng việc cố gắng phân loại các kỹ thuật là "Bayesian" hay "người thường xuyên" là phản tác dụng từ quan điểm thực dụng.

Nếu trích dẫn từ Wikipedia là đúng, thì có vẻ như từ góc độ triết học cố gắng phân loại các phương pháp thống kê cũng phản tác dụng - nếu một phương pháp đúng về mặt toán học, thì có thể sử dụng phương pháp này khi các giả định của toán học cơ bản giữ, nếu không, nếu nó không đúng về mặt toán học hoặc nếu các giả định không giữ, thì việc sử dụng nó là không hợp lệ.

Mặt khác, rất nhiều người dường như xác định "suy luận Bayes" với lý thuyết xác suất (ví dụ tiên đề của Kolmogorov), mặc dù tôi không chắc tại sao. Một số ví dụ là chuyên luận của Jaynes về suy luận Bayes gọi là "Xác suất", cũng như cuốn sách "Quy tắc Bayes" của James Stone. Vì vậy, nếu tôi lấy những tuyên bố này theo mệnh giá, điều đó có nghĩa là tôi nên thích chủ nghĩa Bayes.

Tuy nhiên, cuốn sách của Casella và Berger có vẻ như là thường xuyên bởi vì nó thảo luận về các công cụ ước tính khả năng tối đa nhưng bỏ qua các công cụ ước tính tối đa, nhưng dường như mọi thứ trong đó đều đúng về mặt toán học.

Vì vậy, sau đó nó sẽ không tuân theo rằng phiên bản thống kê chính xác duy nhất về mặt toán học là từ chối bất cứ điều gì nhưng hoàn toàn không liên quan đến chủ nghĩa Bayes và chủ nghĩa thường xuyên? Nếu các phương pháp với cả hai cách phân loại đều đúng về mặt toán học, thì đó không phải là cách thực hành không thích hợp hơn các phương pháp khác, bởi vì điều đó sẽ ưu tiên triết lý mơ hồ, không xác định so với toán học chính xác, được xác định rõ?

Tóm tắt: Tóm lại, tôi không hiểu cơ sở toán học nào cho cuộc tranh luận Bayes so với người thường xuyên và nếu không có cơ sở toán học nào cho cuộc tranh luận (đó là những gì Wikipedia tuyên bố), tôi không hiểu tại sao nó lại được chấp nhận Tất cả trong bài giảng học thuật.



1
@PeterMortensen Tôi đã thấy câu hỏi đó trước khi đặt câu hỏi này; tuy nhiên, câu trả lời cho câu hỏi đó không giải quyết được sự nhầm lẫn chính của tôi, cụ thể là sự khác biệt toán học nào , nếu có tồn tại giữa hai điều này; hãy nhớ rằng tôi không quan tâm đến sự khác biệt về triết học vì họ không nên có bất kỳ ảnh hưởng nào đến không gian của các mô hình có thể.
Chill2Macht

1
Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
whuber

4
Cuộc tranh luận về Bayes ít về xác suất và nhiều hơn về diễn giải thống kê và tính hợp lệ của ứng dụng này.
RBarryYoung

2
@Mehrdad Câu hỏi này không phải là về các cách tiếp cận khác nhau đưa ra các câu trả lời khác nhau, mà là về khả năng chính thức hóa, thông qua các tiên đề toán học, sự khác biệt giữa chủ nghĩa Bayes và chủ nghĩa thường xuyên. Các câu trả lời cho câu hỏi liên kết không giải thích được sự khác biệt về tiên đề giữa hai cách tiếp cận.
Chill2Macht

Câu trả lời:


14

Không gian xác suất và tiên đề của Kolmogorov

Một không gian xác suất theo định nghĩa là một bộ ba trong đó là một tập hợp các kết quả, là một -đau khớp trên các tập hợp con của và là thước đo xác suất đáp ứng các tiên đề của Kolmogorov, tức là là một hàm từ đến sao cho và để phân biệt trong nó giữ ( Ω , F , P ) Ω F σ Ω P P F [ 0 , 1 ] P ( Ω ) = 1 E 1 , E 2 , ... F P ( k = 1 E j ) = Σ k = 1 P ( E j )P(Ω,F,P)ΩFσΩPPF[0,1]P(Ω)=1E1,E2,FP(j=1Ej)=j=1P(Ej).

Trong không gian xác suất như vậy, người ta có thể, đối với hai sự kiện trong xác định xác suất có điều kiện làF P ( E 1 | E 2 ) d e f = P ( E 1E 2 )E1,E2FP(E1|E2)=defP(E1E2)P(E2)

Lưu ý rằng:

  1. '' xác suất có điều kiện '' này chỉ được xác định khi được xác định trên , vì vậy chúng ta cần một không gian xác suất để có thể xác định xác suất có điều kiện.FPF
  2. Một không gian xác suất được xác định theo các thuật ngữ rất chung chung ( một tập hợp , một -achebra và một thước đo xác suất ), yêu cầu duy nhất là các thuộc tính nhất định phải được đáp ứng nhưng ngoài điều đó ba yếu tố này có thể là "bất cứ điều gì".σ F PΩ σFP

Chi tiết hơn có thể được tìm thấy trong liên kết này

Quy tắc của Bayes giữ trong bất kỳ không gian xác suất (hợp lệ) nào

Từ định nghĩa xác suất có điều kiện, nó cũng cho rằng . Và từ hai phương trình sau, chúng ta tìm thấy quy tắc của Bayes. Vì vậy, quy tắc của Bayes giữ (theo định nghĩa xác suất có điều kiện) trong bất kỳ không gian xác suất nào (để hiển thị nó, xuất phát và từ mỗi phương trình và phương trình chúng (chúng bằng nhau vì giao điểm là giao hoán)). P(E1E2)P(E2E1)P(E2|E1)=P(E2E1)P(E1)P(E1E2)P(E2E1)

Vì quy tắc Bayes là cơ sở cho suy luận Bayes, người ta có thể thực hiện phân tích Bayes trong bất kỳ điều kiện hợp lệ nào (tức là đáp ứng tất cả các điều kiện, tiên đề của áo Kolmogorov).

Định nghĩa xác suất thường xuyên là một '' trường hợp đặc biệt ''

Ở trên có '' nói chung '', tức là chúng ta không có , , trong chừng là một -đau khớp trên các tập con của và đáp ứng các tiên đề của Kolmogorov.F P F σ Ω PΩFPFσΩP

Bây giờ chúng tôi sẽ chỉ ra rằng một định nghĩa '' người thường xuyên '' về đáp ứng các tiên đề của Kolomogorov. Nếu đó là trường hợp thì xác suất '' thường xuyên '' chỉ là một trường hợp đặc biệt của xác suất trừu tượng và chung của Kolmogorov. P

Hãy lấy một ví dụ và tung xúc xắc. Sau đó, tập hợp tất cả các kết quả có thể có là . Chúng ta cũng cần một -đau khớp trên tập hợp này và chúng ta lấy tập hợp tất cả các tập hợp con của , tức là .Ω = { 1 , 2 , 3 , 4 , 5 , 6 } σ Ω F Ω F = 2 ΩΩΩ={1,2,3,4,5,6}σΩFΩF=2Ω

Chúng ta vẫn phải xác định thước đo xác suất theo cách thường xuyên. Do đó, chúng tôi định nghĩa là trong đó là số lượng 'thu được trong cuộn xúc xắc. Tương tự cho , ... .PP({1}) n11nP({2})P({6})P({1})=deflimn+n1nn11nP({2})P({6})

Theo cách này, được xác định cho tất cả các singletons trong . Đối với bất kỳ tập hợp nào khác trong , ví dụ chúng tôi xác định theo cách thường xuyên, ví dụ: , nhưng theo tính tuyến tính của 'lim', điều này bằng với , ngụ ý rằng các tiên đề của Kolmogorov giữ.F F { 1 , 2 } P ( { 1 , 2 } ) P ( { 1 , 2 } ) d e f = lim n + n 1 + n 2PFF{1,2}P({1,2}) P({1})+P({2})P({1,2})=deflimn+n1+n2nP({1})+P({2})

Vì vậy, định nghĩa xác suất thường xuyên chỉ là một trường hợp đặc biệt của định nghĩa chung và trừu tượng của Kolomogorov về thước đo xác suất.

Lưu ý rằng có nhiều cách khác để xác định thước đo xác suất đáp ứng các tiên đề của Kolmogorov, vì vậy định nghĩa thường xuyên không phải là cách duy nhất có thể.

Phần kết luận

Xác suất trong hệ tiên đề của Kolmogorov là '' trừu tượng '', nó không có ý nghĩa thực sự, nó chỉ phải đáp ứng các điều kiện gọi là '' tiên đề ''. Chỉ sử dụng các tiên đề này Kolmogorov đã có thể rút ra một tập các định lý rất phong phú.

Định nghĩa thường xuyên về xác suất chứa đầy các tiên đề và do đó thay thế trừu tượng, '' vô nghĩa '' bằng một xác suất được xác định theo cách thường xuyên, tất cả các định lý này đều hợp lệ vì '' xác suất thường xuyên '' chỉ là một đặc biệt trường hợp xác suất trừu tượng của Kolmogorov (tức là nó đáp ứng các tiên đề).P

Một trong những tính chất có thể bắt nguồn từ khuôn khổ chung của Kolmogorov là quy tắc Bayes. Vì nó giữ trong khuôn khổ chung và trừu tượng, nó cũng sẽ giữ (cfr supra) trong trường hợp cụ thể rằng các xác suất được xác định theo cách thường xuyên (vì định nghĩa thường xuyên đáp ứng các tiên đề và các tiên đề này là điều duy nhất cần thiết để rút ra tất cả các định lý). Vì vậy, người ta có thể thực hiện phân tích Bayes với định nghĩa xác suất thường xuyên.

Xác định theo cách thường xuyên không phải là khả năng duy nhất, có nhiều cách khác để định nghĩa nó sao cho nó đáp ứng các tiên đề trừu tượng của Kolmogorov. Quy tắc của Bayes cũng sẽ được giữ trong các 'trường hợp cụ thể' này. Vì vậy, người ta cũng có thể làm phân tích Bayesian với một phi nghĩa -frequentist của xác suất.P

EDIT 23/8/2016

@mpiktas phản ứng với bình luận của bạn:

Như tôi đã nói, các bộ và thước đo xác suất không có ý nghĩa đặc biệt nào trong hệ tiên đề, chúng là trừu tượng. PΩ,FP

Để áp dụng lý thuyết này, bạn phải đưa ra các định nghĩa xa hơn (vì vậy những gì bạn nói trong nhận xét của mình "không cần phải nhầm lẫn thêm với một số định nghĩa kỳ quái 'sai, bạn cần định nghĩa bổ sung ).

Hãy áp dụng nó cho trường hợp tung đồng xu công bằng. Tập hợp trong lý thuyết của Kolmogorov không có ý nghĩa đặc biệt, nó chỉ phải là '' một tập hợp ''. Vì vậy, chúng ta phải xác định bộ này là gì trong trường hợp của đồng tiền công bằng, tức là chúng ta phải xác định bộ . Nếu chúng tôi đại diện đầu như H và đuôi như T, sau đó set là theo định nghĩa .ΩΩΩ Ω=def{H,T}

Chúng ta cũng phải xác định các sự kiện, tức là -achebra . Chúng tôi xác định là . Thật dễ dàng để xác minh rằng là một hệ số .σFF=def{,{H},{T},{H,T}}Fσ

Tiếp theo, chúng ta phải xác định cho mọi sự kiện trong số đo của nó. Vì vậy, chúng ta cần xác định bản đồ từ trong . Tôi sẽ định nghĩa nó theo cách thường xuyên, đối với một đồng tiền công bằng, nếu tôi ném nó rất nhiều lần, thì phần đầu sẽ là 0,5, vì vậy tôi xác định . Tương tự, tôi định nghĩa , và . Lưu ý rằng là bản đồ từ trong và nó đáp ứng các tiên đề của Kolmogorov.EFF[0,1]P({H})=def0.5P({T})=def0.5P({H,T})=def1P()=def0PF[0,1]

Để tham khảo với định nghĩa xác suất thường xuyên, hãy xem liên kết này (ở cuối phần 'định nghĩa') và liên kết này .


10
Có lẽ người ta cần lưu ý ở đâu đó rằng có một cuộc tranh luận thường xuyên / Bayes về việc giải thích xác suất và có một cuộc tranh luận thường xuyên / Bayes về suy luận thống kê. Đây là hai cuộc tranh luận khác nhau (mặc dù có liên quan). Câu trả lời này chỉ nói riêng về câu đầu tiên, điều này rất tốt (và tôi đoán những gì @William quan tâm ở đây, vì anh ấy đã chọn chấp nhận câu trả lời này), nhưng hầu hết các câu trả lời khác chủ yếu nói về câu hỏi thứ hai. Đây chỉ là một ghi chú cho độc giả tương lai, nhưng cũng là một lưu ý cho William.
amip nói rằng Phục hồi lại

2
Tôi đang bỏ phiếu, vì không có tham chiếu đến định nghĩa của định nghĩa "xác suất thường xuyên", và nếu không có nó, bài viết không có ý nghĩa. Ví dụ, định nghĩa cho thậm chí không đúng về mặt toán học, bởi vì định nghĩa phụ thuộc vào giới hạn của cuộn xúc xắc. Các đối tượng toán học là trừu tượng và không phụ thuộc vào các đối tượng vật lý. Hơn nữa, để chứng minh rằng giới hạn tồn tại, bạn cần xây dựng một không gian xác suất, trong đó biến ngẫu nhiên được xác định, và sau đó chứng minh rằng nó hội tụ, theo đó bạn cần lý thuyết đo lường và ...n n 1 / nP({1})nn1/n
mpiktas

2
định nghĩa xác suất. Vì vậy, ngay cả khi chúng ta cho phép như định nghĩa nó là hình tròn, tức là để kiểm tra xem đối tượng có thỏa mãn định nghĩa bạn cần phải xác định đối tượng hay không. Tôi rất muốn có được một tài liệu tham khảo cho một cuốn sách giáo khoa sử dụng định nghĩa như vậy và cố gắng sử dụng nó để rút ra tất cả các kết quả thông thường trong thống kê.
mpiktas

5
Bài viết dài và chi tiết này trong Bách khoa toàn thư về triết học Stanford về diễn giải xác suất chứa một phần dài và chi tiết về chủ nghĩa thường xuyên và có thể là một tài liệu tham khảo tốt hơn liên kết của bạn với Wikipedia (Từ điển bách khoa Stanford khá có thẩm quyền, không giống như Wikipedia). Điều này cho thấy rõ rằng liệu định nghĩa của người theo chủ nghĩa thường xuyên có hợp lý hay không và ngay cả những gì chính xác cấu thành định nghĩa của người thường xuyên là vấn đề của cuộc tranh luận kéo dài 150 năm mà bạn và @mpiktas dường như đang tái hiện ở đây trong phần bình luận.
amip nói rằng Phục hồi lại

2
@amoeba: Tôi đặc biệt thích lời nhắc trong liên kết của bạn rằng chúng tôi có thể diễn giải "xác suất" theo mọi cách không liên quan gì đến khái niệm như thường được hiểu - ví dụ: chiều dài được chuẩn hóa - và vẫn phù hợp với các tiên đề của Kolmogorov.
Scortchi - Phục hồi Monica

66

Số liệu thống kê không phải là Toán

Đầu tiên, tôi ăn cắp những từ @ whuber từ một bình luận trong Thống kê không phải là toán học? (áp dụng trong một ngữ cảnh khác, vì vậy tôi đang ăn cắp từ, không trích dẫn):

Nếu bạn thay thế "thống kê" bằng "hóa học", "kinh tế học", "kỹ thuật" hoặc bất kỳ lĩnh vực nào sử dụng toán học (như kinh tế gia đình), có vẻ như không có lý lẽ nào của bạn thay đổi.

Tất cả các trường này được phép tồn tại và có những câu hỏi không được giải quyết chỉ bằng cách kiểm tra định lý nào là đúng. Mặc dù một số câu trả lời tại Thống kê không phải là toán học? không đồng ý, tôi nghĩ rõ ràng rằng thống kê không phải là toán học (thuần túy). Nếu bạn muốn làm lý thuyết xác suất, một nhánh của toán học (thuần túy), bạn thực sự có thể bỏ qua tất cả các cuộc tranh luận về loại bạn hỏi về. Nếu bạn muốn áp dụng lý thuyết xác suất vào việc mô hình hóa một số câu hỏi trong thế giới thực, bạn cần một cái gì đó nhiều hơn để hướng dẫn bạn chứ không chỉ là các tiên đề và định lý của khung toán học. Phần còn lại của câu trả lời là lan man về điểm này.

Yêu cầu "nếu chúng ta muốn chính xác về mặt toán học, chúng ta không nên không cho phép bất kỳ sự giải thích nào về xác suất" cũng có vẻ không chính đáng. Đặt một giải thích lên trên một khung toán học không làm cho toán học không chính xác (miễn là việc giải thích không được coi là một định lý trong khung toán học).

Cuộc tranh luận không phải (chủ yếu) về tiên đề

Mặc dù có một số tiên đề thay thế *, cuộc tranh luận (?) Không phải là về tranh chấp tiên đề Kolmogorov. Bỏ qua một số sự tinh tế với các sự kiện điều hòa bằng không, dẫn đến xác suất có điều kiện thường xuyên, v.v., về điều mà tôi không biết đủ, các tiên đề Kolmogorov và xác suất có điều kiện ngụ ý quy tắc Bayes, không ai tranh chấp. Tuy nhiên, nếu thậm chí không phải là biến ngẫu nhiên trong mô hình của bạn (mô hình theo nghĩa thiết lập toán học bao gồm không gian xác suất hoặc họ của chúng, biến ngẫu nhiên, v.v.), thì tất nhiên không thể tính được điều kiện phân phối . Không ai cũng tranh luận rằng các thuộc tính tần số, nếu được tính toán chính xác, là hậu quả của mô hình. Ví dụ: các bản phân phối có điều kiệnP ( X | Y ) p ( y | θ ) p ( y ; θ ) p ( y | θ ) = p ( y ; θ ) θ θXP(XY)p(yθ)trong mô hình Bayes xác định một họ phân phối xác suất được lập chỉ mục bằng cách đơn giản cho và nếu một số kết quả giữ cho tất cả ở sau, họ cũng giữ cho tất cả trước đây.p(y;θ)p(yθ)=p(y;θ)θθ

Cuộc tranh luận là về cách áp dụng toán học

Các cuộc tranh luận (nhiều như bất kỳ tồn tại **), thay vào đó là về cách quyết định loại mô hình xác suất nào được thiết lập cho một vấn đề (thực tế, phi toán học) và ý nghĩa của mô hình có liên quan đến bản vẽ (thực tế - cuộc sống) kết luận. Nhưng những câu hỏi này sẽ tồn tại ngay cả khi tất cả các nhà thống kê đồng ý. Để trích dẫn từ bài đăng trên blog mà bạn đã liên kết đến [1], chúng tôi muốn trả lời các câu hỏi như

Làm thế nào tôi nên thiết kế một roulette để sòng bạc của tôi kiếm được $? Phân bón này có làm tăng năng suất cây trồng không? Có phải streptomycin chữa bệnh lao phổi? Hút thuốc có gây ung thư? Người dùng này sẽ thích bộ phim nào? Red Sox nên ký hợp đồng với cầu thủ bóng chày nào? Bệnh nhân này có nên hóa trị?

Các tiên đề của lý thuyết xác suất thậm chí không chứa định nghĩa về bóng chày, vì vậy rõ ràng là "Red Sox nên ký hợp đồng với cầu thủ bóng chày X" không phải là một định lý trong lý thuyết xác suất.

Lưu ý về các biện minh toán học của phương pháp Bayes

Có 'các biện minh toán học' để coi tất cả các ẩn số là xác suất như định lý Cox mà Jaynes đề cập đến, (mặc dù tôi nghe thấy nó có vấn đề toán học, có thể đã được sửa hoặc không, tôi không biết, xem [2] và tài liệu tham khảo trong đó) hoặc cách tiếp cận man rợ (chủ quan Bayes) (Tôi đã nghe điều này trong [3] nhưng chưa bao giờ đọc cuốn sách) chứng tỏ rằng theo những giả định nhất định, một người ra quyết định hợp lý sẽ có phân phối xác suất theo các trạng thái của thế giới và chọn hành động của mình dựa trên việc tối đa hóa giá trị mong đợi của một hàm tiện ích. Tuy nhiên, liệu người quản lý của Red Sox có nên chấp nhận các giả định hay không, hoặc liệu chúng ta có nên chấp nhận lý thuyết rằng hút thuốc gây ung thư hay không, không thể được suy luận từ bất kỳ khuôn khổ toán học nào,

Chú thích

* Tôi chưa nghiên cứu về nó, nhưng tôi đã nghe de Finetti có một cách tiếp cận trong đó xác suất có điều kiện là nguyên thủy hơn là thu được từ biện pháp (vô điều kiện) bằng điều kiện. [4] đề cập đến một cuộc tranh luận giữa (Bayesians) José Bernardo, Dennis Lindley và Bruno de Finetti trong một nhà hàng Pháp ấm cúng về việc liệu -additivity là cần thiết.σ

** như đã đề cập trong bài đăng trên blog mà bạn liên kết đến [1], có thể không có cuộc tranh luận rõ ràng nào với mọi nhà thống kê thuộc về một nhóm và coi thường nhóm khác. Tôi đã nghe nói rằng tất cả chúng ta đều là những người thực dụng ngày nay và cuộc tranh luận vô ích đã kết thúc. Tuy nhiên, theo kinh nghiệm của tôi, những khác biệt này tồn tại, ví dụ, liệu cách tiếp cận đầu tiên của ai đó là mô hình hóa tất cả các ẩn số dưới dạng các biến ngẫu nhiên hay không và mức độ quan tâm của ai đó trong việc đảm bảo tần số.

Người giới thiệu

[1] Simply Statistics, một blog thống kê của Rafa Irizarry, Roger Peng và Jeff Leek, "Tôi tuyên bố cuộc tranh luận giữa Bayesian và Thường xuyên về các nhà khoa học dữ liệu", ngày 13 tháng 10 năm 2014, http://simplystatistic.org/2014/10 / 13 / as-an-áp dụng-statistician-i-find-the-thườngists-vs.-bayesians-tranh luận-hoàn toàn không quan trọng /

[2] Dupré, MJ, & Tipler, FJ (2009). Các tiên đề mới cho xác suất Bayes nghiêm ngặt. Phân tích Bayes, 4 (3), 599-606. http://projecteuclid.org/doad/pdf_1/euclid.ba/1340369856

[3] man rợ, LJ (1972). Các nền tảng của số liệu thống kê. Tổng công ty chuyển phát nhanh.

[4] Bernardo, JM Câu chuyện về Valencia - Một số chi tiết về nguồn gốc và sự phát triển của các cuộc họp quốc tế của Valencia về Thống kê Bayes. http://www.uv.es/bernardo/ValenciaStory.pdf


13
+1, đặc biệt cho "Các tiên đề của lý thuyết xác suất thậm chí không chứa định nghĩa về bóng chày".
amip nói rằng Phục hồi Monica

5
@William: Tham số không được tin là biến ngẫu nhiên không đổi - đó không phải là thực tế để suy luận hoặc quan sát. Câu hỏi đặt ra là có hay không đại diện cho độ không đảm bảo epistemia về giá trị thực của tham số bằng cách sử dụng phân phối xác suất. (Phân tích thường xuyên chỉ đại diện cho quá trình tạo dữ liệu đầy đủ bằng cách sử dụng phân phối xác suất.)
Scortchi - Tái lập Monica

4
@William Hội trường Monty cổ điển không có gì có thể được hiểu một cách hợp lý là một tham số hoặc là dữ liệu, đó là một vấn đề xác suất. Cách tiếp cận Bayes / thường xuyên sẽ chỉ phát huy tác dụng nếu bạn muốn ước tính, giả sử, tham số của biến thể tham số được mô tả ở đây en.wikipedia.org/wiki/Monty_Hall_probols#Variants bằng cách xem nhiều tập của gameshow. Tôi, với tư cách là một người Bayes, có lẽ sẽ đặt, ví dụ, bản beta trước và bắt đầu cập nhật. Việc này có hoạt động tốt trong mô phỏng máy tính hay không có thể phụ thuộc mạnh mẽ vào cách mô phỏng máy tính chọn . q qqqq
Juho Kokkala

8
Tôi lưu ý rằng tôi không quan tâm đến việc tiếp tục bất kỳ cuộc tranh luận nào về vấn đề này trong phần bình luận, vì nó (cũng không phải trang web này) không phải là nơi để tranh luận.
Juho Kokkala

2
Tôi hoàn toàn đồng ý "thống kê không phải là toán học". Wigner đã viết một bài luận có tên "Hiệu quả phi lý của toán học trong vật lý", lập luận rằng vì không có mối liên hệ cố hữu giữa thế giới trừu tượng của toán học và thế giới vật lý cụ thể. Thật đáng ngạc nhiên (và tuyệt vời) rằng toán học đã làm việc rất tốt trong việc mô tả vật lý. Tôi cảm thấy như vậy là đúng cho thống kê. Tôi mong muốn ai đó viết "Hiệu quả vô lý của toán học trong thống kê". Cá nhân tôi thấy thật tuyệt vời khi toán học trừu tượng hoạt động rất tốt trong việc mô tả các hiện tượng thống kê.
aginensky

32

Cơ sở toán học cho cuộc tranh luận Bayesian và thường xuyên là rất đơn giản. Trong thống kê Bayes, tham số chưa biết được coi là biến ngẫu nhiên; trong thống kê thường xuyên, nó được coi là một yếu tố cố định. Do một biến ngẫu nhiên là một đối tượng toán học phức tạp hơn nhiều so với một yếu tố đơn giản của tập hợp, nên sự khác biệt về toán học là khá rõ ràng.

Tuy nhiên, hóa ra kết quả thực tế về mặt mô hình có thể giống nhau một cách đáng ngạc nhiên. Lấy hồi quy tuyến tính chẳng hạn. Hồi quy tuyến tính Bayes với các linh mục không thông tin dẫn đến phân phối ước lượng tham số hồi quy, có giá trị trung bình bằng ước tính của tham số hồi quy tuyến tính thường xuyên, là một giải pháp cho một vấn đề bình phương nhỏ nhất, thậm chí không phải là vấn đề từ lý thuyết xác suất . Tuy nhiên, toán học được sử dụng để đi đến giải pháp tương tự là khá khác nhau, vì lý do đã nêu ở trên.

Đương nhiên vì sự khác biệt của việc xử lý các thuộc tính toán học tham số chưa biết (biến ngẫu nhiên so với phần tử của tập hợp) cả thống kê Bayes và thường xuyên đánh vào các trường hợp có vẻ thuận lợi hơn khi sử dụng phương pháp cạnh tranh. Khoảng tin cậy là một ví dụ điển hình. Không phải dựa vào MCMC để có được ước tính đơn giản là một điều khác. Tuy nhiên, đây thường là nhiều vấn đề về hương vị và không phải của toán học.


5
Mặc dù hằng số là trường hợp đặc biệt của một biến ngẫu nhiên, tôi sẽ ngần ngại kết luận rằng chủ nghĩa Bayes nói chung hơn. Bạn sẽ không nhận được kết quả thường xuyên từ những người Bayes bằng cách thu gọn biến ngẫu nhiên thành một hằng số. Sự khác biệt là sâu sắc hơn. Khi bạn cho rằng tham số của bạn là hằng số chưa biết, tiêu điểm nghiên cứu sẽ trở thành ước lượng, là biến ngẫu nhiên (vì đây là hàm có thể đo được của mẫu) và mức độ gần với giá trị thực của tham số, hoặc theo cách nào để có được ước tính sao cho gần với ước tính thực.
mpiktas

6
Vì ước tính là một biến ngẫu nhiên, bạn không thể nghiên cứu nó bằng cách bỏ qua lý thuyết đo lường, vì vậy tôi thấy tuyên bố của bạn rằng nhiều nhà thống kê hiển thị một lượng đáng kinh ngạc về sự thiếu hiểu biết và coi thường lý thuyết đo lường là khá đáng ngạc nhiên. Bạn đã đọc Thống kê tiệm cận của A. van der Vaart chưa? Tôi sẽ coi cuốn sách này là một cái nhìn tổng quan rất tốt về thống kê thường xuyên và các tính năng lý thuyết đo lường khá nổi bật ở đó.
mpiktas

3
Mặt khác, số liệu thống kê của Bayes rút ra sự phân phối tham số gần như ngay lập tức và câu hỏi đặt ra là làm thế nào để tính toán nó (rất nhiều nghiên cứu về các thuật toán lấy mẫu khác nhau, Metropolis-Hastings, v.v.) và tầm quan trọng của các linh mục. Tôi không quen thuộc với nghiên cứu về thống kê Bayes, vì vậy việc khái quát hóa của tôi có thể bị chậm lại một chút. Đi theo sở thích cá nhân, không hiểu thực tế là tôi được đào tạo ít nhiều như một người thường xuyên, tôi không thích số liệu thống kê Bayes sử dụng một tập hợp con hạn chế của các bản phân phối có sẵn ...
mpiktas

3
Nó luôn bắt đầu với phân phối bình thường và liên hợp của nó và điều này giúp bạn đi được bao xa. Vì hầu hết tất cả dữ liệu tôi làm việc không được phân phối bình thường, tôi ngay lập tức nghi ngờ và thích làm việc với các phương pháp phân phối bất khả tri. Tuy nhiên đây là một sở thích cá nhân và tôi thấy rằng trong công việc được áp dụng tôi vẫn chưa tìm thấy một vấn đề nào mà cách tiếp cận thường xuyên sẽ thất bại đến mức tôi cần phải chuyển sang Bayesian.
mpiktas

4
"Nó luôn bắt đầu với phân phối bình thường và các liên hợp của nó và điều này giúp bạn tiến xa đến mức nào ..." - đây là lý do tại sao người ta sử dụng các phương pháp Monte Carlo để lấy mẫu từ phân phối tham số sau; những công việc này cũng dành cho các bản phân phối chung (phần mềm BUGS và các biến thể của nó).
John Donn

25

Tôi không thích triết học, nhưng tôi thích toán học và tôi muốn làm việc độc quyền trong khuôn khổ các tiên đề của Kolmogorov.

Làm thế nào chính xác bạn sẽ áp dụng tiên đề của Kolmogorov một mình mà không có bất kỳ sự giải thích? Làm thế nào bạn sẽ giải thích xác suất? Bạn sẽ nói gì với người hỏi bạn "Ước tính xác suất có ý nghĩa gì?" 0.5Bạn có nói rằng kết quả của bạn là một số0.5, đó là chính xác vì nó theo các tiên đề? Không có bất kỳ sự giải thích nào, bạn không thể nói rằng điều này cho thấy mức độ thường xuyên chúng ta mong đợi để xem kết quả nếu chúng ta lặp lại thí nghiệm của mình. Bạn cũng không thể nói rằng con số này cho bạn biết bạn chắc chắn như thế nào về khả năng xảy ra sự kiện. Bạn cũng không thể trả lời rằng điều này cho bạn biết khả năng bạn tin sự kiện sẽ như thế nào. Làm thế nào bạn giải thích giá trị mong đợi - vì một số số nhân với một số số khác và tổng hợp lại với nhau là hợp lệ vì chúng tuân theo các tiên đề và một vài định lý khác?

Nếu bạn muốn áp dụng toán học vào thế giới thực, thì bạn cần phải giải thích nó. Các con số một mình mà không có sự giải thích là ... số. Mọi người không tính toán các giá trị dự kiến ​​để ước tính các giá trị dự kiến, nhưng để tìm hiểu điều gì đó về thực tế.

Hơn nữa, xác suất là trừu tượng, trong khi chúng tôi áp dụng số liệu thống kê (và xác suất mỗi lần) cho các sự kiện trong thế giới thực. Lấy ví dụ cơ bản nhất: một đồng tiền công bằng. Theo cách hiểu thông thường, nếu bạn ném một đồng xu như vậy một số lần lớn, bạn sẽ mong đợi cùng một số đầu và đuôi. Tuy nhiên, trong một thí nghiệm thực tế, điều này gần như không bao giờ xảy ra. Vì vậy, xác suất thực sự không có gì với bất kỳ đồng tiền cụ thể nào được ném bất kỳ số lần cụ thể nào.0.5

Xác suất không tồn tại

- Bruno de Finetti


3
"Nếu bạn đã ném một đồng xu như vậy nhiều lần, bạn sẽ mong đợi cùng một số đầu và đuôi" - đó là một cách hiểu không đúng về luật của số lượng lớn. Xem chương III của Tập 1 của Felliner Giới thiệu về Lý thuyết và Ứng dụng Xác suất . Ví dụ, trên trang 67 "Trong một quần thể tiền xu bình thường, phần lớn nhất thiết phải điều chỉnh sai".
Chill2Macht

1
@William vậy chính xác thì bạn sẽ trả lời câu hỏi "p = 0,5 nghĩa là gì?" p là ước tính xác suất của thí nghiệm tung đồng xu ...?
Tim

1
Bạn cũng đang trích dẫn Feller, người đề cập đến "đa số" - phần lớn chính xác là gì nếu bạn không đưa ra những diễn giải thường xuyên về xác suất ..?
Tim

7
Những điều đơn giản hóa: trong xác suất quan điểm thường xuyên có liên quan đến tỷ lệ các sự kiện xảy ra giữa các sự kiện có thể xảy ra; trong giải thích Bayes là về mức độ đáng tin của một cái gì đó (xem en.wikipedia.org/wiki/Probability#Interpretations ). Bằng cách nói với tôi về không gian mẫu vv bạn giả định rằng có một cái gì đó bên cạnh việc tung đồng xu đơn tương lai - đây là bạn giải thích của xác suất, kể từ khi có được sẽ chỉ tung single, vì vậy toàn bộ lý luận về không gian mẫu không áp dụng cho nó Bạn hoàn toàn đúng với cách giải thích của bạn, nhưng đây là
Tim

5
diễn dịch. Để áp dụng xác suất cho các sự kiện trong thế giới thực, bạn cần đưa ra những diễn giải như vậy. Xác suất mà Trump thắng cử Mỹ năm 2016 là bao nhiêu? Câu hỏi này không thể trả lời được nếu bạn không đưa ra các giả định về xác suất là gì.
Tim

10

Quan điểm của tôi về sự tương phản giữa Bayesian và suy luận thường xuyên là vấn đề đầu tiên là sự lựa chọn của sự kiện mà bạn muốn xác suất. Những người thường xuyên giả định những gì bạn đang cố chứng minh (ví dụ, một giả thuyết khống) sau đó tính xác suất quan sát thứ gì đó mà bạn đã quan sát, theo giả định đó. Có một sự tương đồng chính xác giữa xác suất dòng thông tin ngược như vậy và độ nhạy và độ đặc hiệu trong chẩn đoán y khoa, điều này đã gây ra những hiểu lầm to lớn và cần được giải cứu theo quy tắc của Bayes để có được xác suất chuyển tiếp ("xác suất sau kiểm tra"). Bayes tính toán xác suất của một sự kiện và xác suất tuyệt đối là không thể tính toán nếu không có mỏ neo (trước đó). Xác suất Bayes về tính xác thực của một tuyên bố khác nhiều so với xác suất thường xuyên quan sát dữ liệu theo một giả định không thể biết được. Sự khác biệt rõ rệt hơn khi người thường xuyên phải điều chỉnh các phân tích khác đã được thực hiện hoặc có thể đã được thực hiện (tính đa dạng; thử nghiệm tuần tự, v.v.).

Vì vậy, các cuộc thảo luận về cơ sở toán học là rất thú vị và là một cuộc thảo luận rất thích hợp để có. Nhưng người ta phải đưa ra một lựa chọn cơ bản về xác suất tiến và lùi. Do đó, những gì được dựa trên, không chính xác là toán học, là vô cùng quan trọng. Bayesian tin rằng điều hòa đầy đủ về những gì bạn đã biết là chìa khóa. Những người thường xuyên thường xuyên đặt điều kiện vào những gì làm cho toán học đơn giản.


9

Tôi sẽ chia nó thành hai câu hỏi riêng biệt và trả lời từng câu hỏi.

1.) Đưa ra các quan điểm triết học khác nhau về xác suất có nghĩa là gì trong quan điểm Thường xuyên và Bayes, có quy tắc toán học xác suất nào áp dụng cho một cách giải thích và không áp dụng cho một cách giải thích khác không?

Không. Các quy tắc xác suất vẫn giống hệt nhau giữa hai nhóm.

2.) Người Bayes và Người thường xuyên sử dụng các mô hình toán học giống nhau để phân tích dữ liệu?

Nói chung là không. Điều này là do hai cách giải thích khác nhau cho thấy một nhà nghiên cứu có thể có được cái nhìn sâu sắc từ các nguồn khác nhau. Cụ thể, khung Thường xuyên thường được cho là gợi ý rằng người ta chỉ có thể suy luận về các tham số quan tâm từ dữ liệu được quan sát, trong khi quan điểm của Bayes cho thấy người ta cũng nên bao gồm kiến ​​thức chuyên môn độc lập về chủ đề này. Các nguồn dữ liệu khác nhau có nghĩa là các mô hình toán học khác nhau sẽ được sử dụng để phân tích.

Cũng cần lưu ý rằng có rất nhiều sự phân chia giữa các mô hình được sử dụng bởi hai trại có liên quan nhiều hơn đến những gì đã được thực hiện hơn những gì có thểđược thực hiện (nghĩa là nhiều mô hình được sử dụng theo truyền thống của một trại có thể được biện minh bởi trại khác). Ví dụ: các mô hình BUG (suy luận Bayes sử dụng lấy mẫu Gibbs, một tên không còn mô tả chính xác bộ mô hình vì nhiều lý do) được phân tích theo phương pháp Bayesian, chủ yếu là do có sẵn các gói phần mềm tuyệt vời để làm điều này với (JAGs, Stan chẳng hạn). Tuy nhiên, không có gì nói rằng các mô hình này phải đúng Bayesian. Trên thực tế, tôi đã làm việc với dự án NIMBLE xây dựng các mô hình này trong khung BUGs, nhưng cho phép người dùng tự do hơn nhiều về cách suy luận về chúng. Mặc dù phần lớn các công cụ chúng tôi cung cấp là các phương pháp MCMC Bayes có thể tùy chỉnh, người ta cũng có thể sử dụng ước tính khả năng tối đa, một phương pháp Thường xuyên theo truyền thống, cho các mô hình này. Tương tự như vậy, Các linh mục thường được coi là những gì bạn có thể làm với Bayesian mà bạn không thể làm với các mô hình Thường xuyên. Tuy nhiên, ước tính bị phạt có thể cung cấp cho các mô hình tương tự bằng cách sử dụng ước tính tham số chính quy (mặc dù khung Bayesian cung cấp cách dễ dàng hơn để chứng minh và chọn tham số chính quy, trong khi trường hợp thường gặp, trong trường hợp tốt nhất là có nhiều dữ liệu, "chúng tôi đã chọn các tham số chính quy này bởi vì qua một số lượng lớn các mẫu được xác thực chéo, chúng đã hạ thấp ước tính của lỗi mẫu "... tốt hơn hoặc xấu hơn).


1
Tôi phản đối, phần nào, với trích dẫn này: "Đặc biệt, khung Thường xuyên thường được cho là gợi ý rằng người ta có thể suy luận về các tham số quan tâm chỉ từ dữ liệu được quan sát, trong khi quan điểm của Bayes cho rằng người ta cũng nên bao gồm kiến ​​thức chuyên gia độc lập về môn học". Chủ yếu cho ngụ ý rằng những người thường xuyên, vì lý do nào, không quan tâm đến kiến ​​thức chuyên gia độc lập về chủ đề này. Sự khác biệt giữa người thường xuyên và người Bayes không phải là người trước đây ngoan cố từ chối sử dụng kiến ​​thức hoặc bối cảnh trước đó ... (1/2)
Ryan Simmons

1
... nhưng đúng hơn là hai trường phái tư duy sử dụng kiến ​​thức / bối cảnh trước đó theo những cách khác nhau. Bạn có thể lập luận rằng viễn cảnh Bayes có cách tiếp cận nguyên tắc hơn trong việc kết hợp trực tiếp kiến ​​thức trước đó vào một mô hình (tuy nhiên, tôi sẽ cho rằng việc sử dụng rộng rãi các linh mục không cung cấp thông tin thay vì làm loãng lập luận này). Nhưng tôi không nghĩ thật công bằng khi mô tả nó là vấn đề của những người thường xuyên KHÔNG sử dụng thông tin đó. (2/2)
Ryan Simmons

1
@RyanSimmons: đúng, đây là lý do tại sao tôi tuyên bố "thường được cho là gợi ý ...". Ví dụ, nếu một nhà nghiên cứu quan sát rằng việc chuẩn hóa các ước tính tham số xung quanh ý kiến ​​của một chuyên gia có xu hướng dẫn đến dự đoán tốt hơn về lâu dài, thì không có vấn đề gì trong việc kết hợp điều này trong khuôn khổ Thường xuyên ("dựa trên các biện pháp Thường xuyên, công cụ ước lượng tăng cường này tốt hơn đặc điểm hoạt động lâu dài hơn công cụ ước tính chỉ dữ liệu "). Nhưng điều này không đơn giản như trong khuôn khổ Bayes.
Vách đá AB

1
Đủ công bằng! Tôi đồng tình.
Ryan Simmons

5

Bayes và người thường xuyên nghĩ rằng xác suất đại diện cho những điều khác nhau. Những người thường xuyên nghĩ rằng chúng liên quan đến tần số và chỉ có ý nghĩa trong bối cảnh nơi tần số có thể. Bayes xem chúng như là cách để đại diện cho sự không chắc chắn. Vì bất kỳ thực tế có thể không chắc chắn, bạn có thể nói về xác suất của bất cứ điều gì.

Hậu quả toán học là những người thường xuyên nghĩ rằng các phương trình cơ bản của xác suất đôi khi chỉ áp dụng và Bayes nghĩ rằng họ luôn luôn áp dụng. Vì vậy, họ xem các phương trình tương tự là chính xác, nhưng khác nhau về mức độ chung của chúng.

Điều này có những hậu quả thực tế sau đây:

(1) Người Bayes sẽ rút ra phương pháp của họ từ các phương trình cơ bản của lý thuyết xác suất (trong đó Định lý Bayes chỉ là một ví dụ), trong khi những người thường xuyên phát minh ra một cách tiếp cận trực quan khác để giải quyết từng vấn đề.

(2) Có những định lý chỉ ra rằng nếu bạn suy luận từ thông tin không đầy đủ, bạn nên sử dụng tốt hơn các phương trình cơ bản của lý thuyết xác suất một cách nhất quán, hoặc bạn sẽ gặp rắc rối. Rất nhiều người nghi ngờ về những định lý như vậy có ý nghĩa như thế nào, tuy nhiên đây là những gì chúng ta thấy trong thực tế.

Ví dụ: có thể cho khoảng tin cậy 95% trong thế giới thực bao gồm toàn bộ các giá trị không thể chứng minh được (từ cùng một thông tin được sử dụng để rút ra Khoảng tin cậy). Nói cách khác, các phương pháp Thường xuyên có thể mâu thuẫn với logic suy diễn đơn giản. Các phương pháp Bayes xuất phát hoàn toàn từ các phương trình cơ bản của lý thuyết xác suất không có vấn đề này.

(3) Bayes hoàn toàn chung chung hơn so với Người thường xuyên. Vì có thể không chắc chắn về bất kỳ thực tế nào, bất kỳ thực tế nào cũng có thể được chỉ định một xác suất. Đặc biệt, nếu các sự kiện bạn đang làm có liên quan đến tần số trong thế giới thực (như là điều bạn dự đoán hoặc là một phần của dữ liệu) thì phương pháp Bayes có thể xem xét và sử dụng chúng giống như bất kỳ thực tế nào khác trong thế giới thực.

Do đó, bất kỳ vấn đề nào Người thường xuyên cảm thấy phương pháp của họ áp dụng cho Bayes cũng có thể hoạt động tự nhiên. Tuy nhiên, điều ngược lại thường không đúng trừ khi những người thường xuyên phát minh ra các bộ lọc con để giải thích xác suất của họ là một "tần số", chẳng hạn như tưởng tượng ra nhiều vũ trụ, hoặc phát minh ra các sự lặp lại giả thuyết đến vô cùng không bao giờ được thực hiện và thường không thể theo nguyên tắc .


7
Bạn có thể cung cấp một số tài liệu tham khảo cho các tuyên bố táo bạo bạn đã cung cấp? Ví dụ: "Những người thường xuyên nghĩ rằng các phương trình cơ bản của xác suất đôi khi chỉ áp dụng"? Và các phương trình cơ bản của xác suất là gì?
mpiktas

6
Thú vị hơn nhiều so với cuộc tranh luận B vs F là nhận xét của bạn về khoảng tin cậy chứa các giá trị không thể. Bạn có thể đưa ra hoặc liên kết đến ví dụ cụ thể về CI 95% chỉ chứa các giá trị không thể? Đây có thể là một trong những điều mà mọi nhà thống kê nên nhìn thấy ít nhất một lần trong đời (như một câu chuyện cảnh báo), nhưng tôi không biết.
Vincent

9
Rằng một CI có thể chứa tất cả các giá trị "không thể" hoàn toàn không "mâu thuẫn với logic suy diễn đơn giản". Điều này nghe có vẻ như là một sự hiểu lầm về định nghĩa của CI - hoặc có lẽ là sự nhầm lẫn giữa các diễn giải về TCTD và khoảng tin cậy.
whuber

7
Điều này có vẻ giống như một lời ca ngợi triết học hơn là một câu trả lời cho câu hỏi của OP (hoàn toàn không phải về triết học).
Vách đá AB

5
"Có thể suy luận rằng mọi nhà thống kê sẽ làm từ một CI (mà không có CI nào không có mục đích thực tế hoặc liên hệ với thế giới thực) để phản bác những gì có thể được suy luận từ cùng một bằng chứng". Điều này vẫn không có cách nào ủng hộ yêu cầu của bạn rằng Người thường xuyên bỏ qua các quy tắc xác suất. Và tôi e rằng điều này đang đi xuống con đường mòn của "Bayes vs Người thường xuyên: chiến đấu!" mà hầu hết độc giả ở đây muốn tránh.
Vách đá AB

3

Câu hỏi: Sau đó, nếu chúng ta muốn chính xác về mặt toán học, chúng ta có nên không cho phép bất kỳ giải thích xác suất nào không? Tức là cả Bayes và chủ nghĩa thường xuyên về mặt toán học không chính xác?

Vâng, và đây chính xác là những gì mọi người làm cả trong Triết học Khoa học và Toán học.

  1. Cách tiếp cận triết học. Wikipedia cung cấp một bản tóm tắt các diễn giải / định nghĩa về xác suất .

  2. Các nhà toán học không an toàn. Trước đây, trường phái Kolmogorovian có độc quyền xác suất: xác suất được xác định là thước đo hữu hạn gán 1 cho toàn bộ không gian ... Quyền bá chủ này không còn hiệu lực vì có những xu hướng mới về xác suất xác định như xác suất lượng tửXác suất miễn phí .


Bạn có hiểu những gì có nghĩa là bằng cách giả định thư giãn về tính giao hoán của các biến ngẫu nhiên? (liên quan đến xác suất miễn phí - Tôi không biết đủ QM để hiểu các ý tưởng đằng sau xác suất lượng tử) Điều này có nghĩa là hoặc ? Tôi đoán cuộc thảo luận của đại số von Neumann và đại số ngụ ý sau này. X Y Y X C *X+YY+XXYYXC
Chill2Macht

7
@William đại số không mô hình chính xác hầu hết các thống kê được áp dụng cho. (Bằng cách tương tự, việc phát minh ra các số phức không ảnh hưởng đến bất kỳ ứng dụng nào của số tự nhiên vào hiện tượng. Không thể mở rộng khái niệm toán học về xác suất sẽ thay đổi cách xác suất - như được hiểu hiện tại - được áp dụng.) Tim , câu trả lời này rất khó hiểu: vấn đề toán học thuần túy duy nhất liên quan đến bất kỳ ứng dụng xác suất nào là liệu các tiên đề của nó có nhất quán hay không, và điều đó dễ dàng được chứng minh bằng các mô hình đơn giản. C
whuber

2

Các cuộc tranh luận về vịnh / thường xuyên dựa trên nhiều căn cứ. Nếu bạn đang nói về cơ sở toán học, tôi không nghĩ có nhiều.

Cả hai cần áp dụng các phương pháp gần đúng khác nhau cho các vấn đề phức tạp. Hai ví dụ là "bootstrap" cho người thường xuyên và "mcmc" cho người bay.

Cả hai đều đi kèm với các nghi thức / thủ tục về cách sử dụng chúng. Một ví dụ thường gặp là "đề xuất một công cụ ước tính của một cái gì đó và đánh giá các thuộc tính của nó trong lấy mẫu lặp lại" trong khi một ví dụ bayes là "tính toán phân phối xác suất cho những gì bạn không biết có điều kiện về những gì bạn biết". Không có cơ sở toán học để sử dụng xác suất theo cách này.

Cuộc tranh luận là về ứng dụng, giải thích và khả năng giải quyết các vấn đề trong thế giới thực.

Trên thực tế, điều này thường được sử dụng bởi những người tranh luận về "phía của họ" nơi họ sẽ sử dụng một "nghi thức / thủ tục" cụ thể được sử dụng bởi "phía bên kia" để lập luận rằng toàn bộ lý thuyết nên bị vứt bỏ cho họ. Một số ví dụ bao gồm ...

  • sử dụng các linh mục ngu ngốc (và không kiểm tra chúng)
  • sử dụng các TCTD ngu ngốc (và không kiểm tra chúng)
  • nhầm lẫn một kỹ thuật tính toán với lý thuyết (vịnh không phải là mcmc !! Tương tự như vậy khi đánh đồng xác nhận chéo với học máy)
  • nói về một vấn đề với một ứng dụng cụ thể với một lý thuyết chứ không phải lý thuyết kia sẽ giải quyết vấn đề cụ thể "tốt hơn" như thế nào

Haha vâng điều này rất đúng tôi nghĩ. Tôi đã phải nghe một giáo sư tiếp tục nửa tiếng về việc chủ nghĩa Bayes khủng khiếp như thế nào bởi vì đến với các linh mục một cách chủ quan không có ý nghĩa và toàn bộ thời gian tôi đã nghĩ "tốt, duh, vì vậy đó là lý do tại sao bạn không chọn trước đó ". Quan điểm của tôi, tôi đồng ý rằng lập luận của người rơm rất nhiều.
Chill2Macht

1

Vì vậy, sau đó nó sẽ không tuân theo rằng phiên bản thống kê chính xác duy nhất về mặt toán học là từ chối bất cứ điều gì nhưng hoàn toàn không liên quan đến chủ nghĩa Bayes và chủ nghĩa thường xuyên? Nếu các phương pháp với cả hai cách phân loại đều đúng về mặt toán học, thì đó không phải là cách thực hành không thích hợp hơn các phương pháp khác, bởi vì điều đó sẽ ưu tiên triết lý mơ hồ, không xác định so với toán học chính xác, được xác định rõ?

Không. Nó không theo. Những cá nhân không thể cảm nhận được cảm xúc của họ về mặt sinh học không có khả năng đưa ra quyết định, bao gồm cả những quyết định dường như chỉ có một giải pháp khách quan. Lý do là việc ra quyết định hợp lý phụ thuộc vào năng lực cảm xúc và sở thích của chúng ta cả về nhận thức và cảm xúc. Trong khi đó là đáng sợ, đó là thực tế thực nghiệm.

Gupta R, Koscik TR, Bechara A, Tranel D. Amygdala và ra quyết định. Thần kinh. 2011; 49 (4): 760-766. doi: 10.1016 / j.neuropsychologia.2010.09.029.

Một người thích táo hơn cam không thể bảo vệ điều này vì đó là một sở thích. Ngược lại, một người thích cam hơn táo không thể bảo vệ điều này một cách hợp lý vì đó là một sở thích. Những người thích táo thường sẽ ăn cam vì giá thành của táo quá lớn so với giá của cam.

Phần lớn các cuộc tranh luận Bayes và Thường xuyên, cũng như các cuộc tranh luận về Likabilitiesist và Thường xuyên, tập trung vào những sai lầm của sự hiểu biết. Tuy nhiên, nếu chúng ta tưởng tượng rằng chúng ta có một người được đào tạo tốt về tất cả các phương pháp, bao gồm các phương pháp nhỏ hoặc không còn được sử dụng như xác suất Carnapian hoặc thống kê fiducial, thì việc họ thích một số công cụ hơn các công cụ khác là điều hợp lý.

Tính hợp lý chỉ phụ thuộc vào sở thích; hành vi phụ thuộc vào sở thích và chi phí.

Có thể là từ góc độ toán học thuần túy, một công cụ tốt hơn công cụ kia, nơi được xác định tốt hơn bằng cách sử dụng một số chức năng chi phí hoặc tiện ích, nhưng trừ khi có một câu trả lời duy nhất trong đó chỉ có một công cụ có thể hoạt động, sau đó cả chi phí và các ưu đãi sẽ được cân nhắc.

Hãy xem xét vấn đề của một nhà cái đang cân nhắc việc đưa ra một vụ cá cược phức tạp. Rõ ràng, nhà cái nên sử dụng các phương pháp Bayes trong trường hợp này vì chúng mạch lạc và có các đặc tính tốt đẹp khác, nhưng cũng tưởng tượng rằng nhà cái chỉ có một máy tính và thậm chí không có bút chì và giấy. Nó có thể là trường hợp mà các nhà cái, với việc sử dụng máy tính của mình và bằng cách theo dõi mọi thứ trong đầu có thể tính toán giải pháp Thường xuyên và không có cơ hội trên Trái đất để tính toán Bayes. Nếu anh ta sẵn sàng chấp nhận rủi ro là "Người Hà Lan đặt trước", và cũng thấy chi phí tiềm năng đủ nhỏ, thì việc anh ta đưa ra đặt cược bằng các phương pháp Thường xuyên là hợp lý.

Đó là lý do cho bạnbất khả tri bởi vì sở thích cảm xúc của bạn thấy rằng tốt hơn cho bạn. Không hợp lý cho lĩnh vực này là bất khả tri trừ khi bạn tin rằng tất cả mọi người chia sẻ sở thích cảm xúc và nhận thức của bạn, mà chúng tôi biết không phải là trường hợp.

Nói tóm lại, tôi không hiểu cơ sở toán học là gì cho cuộc tranh luận Bayes so với thường xuyên và nếu không có cơ sở toán học nào cho cuộc tranh luận (đó là những gì Wikipedia tuyên bố), tôi không hiểu tại sao nó lại được dung thứ nghị luận học thuật.

Mục đích của cuộc tranh luận học thuật là mang lại ánh sáng cho cả những ý tưởng cũ và mới. Phần lớn cuộc tranh luận giữa người Bayes và người thường xuyên và cuộc tranh luận Likabilitiesist so với người thường xuyên xuất phát từ sự hiểu lầm và sự trì trệ trong suy nghĩ. Một số đến từ việc không gọi ra sở thích cho những gì họ đang có. Một cuộc thảo luận về những ưu điểm của một người ước tính là không thiên vị và ồn ào so với và người ước tính bị thiên vị và chính xác là một cuộc thảo luận về sở thích cảm xúc, nhưng cho đến khi ai đó có nó, rất có thể suy nghĩ về nó sẽ vẫn còn lầy lội trên khắp lĩnh vực.

Tôi không thích triết học, nhưng tôi thích toán học và tôi muốn làm việc độc quyền trong khuôn khổ các tiên đề của Kolmogorov.

Tại sao? Bởi vì bạn thích Kolmogorov's hơn Cox's, de Finetti hay Savage? Là sở thích đó lẻn vào? Ngoài ra, xác suất và thống kê không phải là toán học, họ sử dụng toán học. Đó là một nhánh của hùng biện. Để hiểu lý do tại sao điều này có thể quan trọng xem xét tuyên bố của bạn:

nếu một phương thức đúng về mặt toán học, thì việc sử dụng phương thức đó là hợp lệ khi các giả định của toán học cơ bản giữ, nếu không, nếu nó không đúng về mặt toán học hoặc nếu các giả định không giữ thì không hợp lệ để sử dụng nó.

Đây không phải là sự thật. Có một bài viết hay về khoảng tin cậy và sự lạm dụng của họ là:

Morey, Richard; Hoekstra, Rink; Rô bốt, Jeffrey; Lee, Michael; Wagenmakers, Eric-Jan, Sai lầm của việc đặt niềm tin vào các khoảng tin cậy, Bản tin & Đánh giá Tâm lý, 2016, Tập 23 (1), tr.103-123

Nếu bạn đọc các khoảng tin cậy tiềm năng khác nhau trong bài viết, thì mỗi khoảng có giá trị toán học, nhưng nếu sau đó bạn đánh giá các thuộc tính của chúng, chúng sẽ rất khác nhau. Thật vậy, một số khoảng tin cậy được cung cấp có thể được coi là có các thuộc tính "xấu", mặc dù chúng đáp ứng tất cả các giả định trong vấn đề. Nếu bạn bỏ khoảng Bayes khỏi danh sách và chỉ tập trung vào bốn khoảng Thường xuyên, thì nếu bạn phân tích sâu hơn khi các khoảng rộng hoặc hẹp, hoặc không đổi, thì bạn sẽ thấy rằng các khoảng đó có thể không "bằng nhau "Mặc dù mỗi đáp ứng các giả định và yêu cầu.

Nó không đủ để nó có giá trị về mặt toán học để nó hữu ích hoặc, thay vào đó, càng hữu ích càng tốt. Tương tự như vậy, nó có thể đúng về mặt toán học, nhưng có hại. Trong bài viết, có một khoảng chính xác nhất là hẹp nhất khi có ít thông tin nhất về vị trí thực và rộng nhất khi kiến ​​thức hoàn hảo hoặc kiến ​​thức gần hoàn hảo tồn tại về vị trí của tham số. Bất kể, nó đáp ứng các yêu cầu bảo hiểm và đáp ứng các giả định.

Toán học không bao giờ có thể là đủ.


Tôi thực sự thích bài viết thứ hai. (Kết luận của bài viết đầu tiên là điều mà tôi đã nghe nói đã lập luận theo cách thuyết phục tôi, vì vậy tôi dường như không cần thiết để đọc.) Tôi hầu như đồng ý với những gì bạn nói. Công bằng mà nói, khi tôi nói toán học, tôi đã nghĩ nhiều hơn về ý nghĩa "toán học ứng dụng" cũng như sự hiểu biết ngầm định rằng các môn học và phương hướng nghiên cứu toán học, cũng như các lựa chọn của các tiên đề toán học, là để mô hình hóa các quan sát về thế giới thực. Ngoài ra, tôi không nghĩ rằng bài viết thứ hai mâu thuẫn với những gì tôi đang nói - các tác giả lấy những ngụy biện phổ biến, cụm từ
Chill2Macht

chúng về mặt toán học (tức là chính xác, chặt chẽ), và sau đó cung cấp các mẫu phản biện cho thấy chúng là sai. Những gì tôi đã cố gắng nói (nếu tôi nhớ chính xác về ý định của tôi nhiều tháng trước), là nếu "triết lý" hoặc "ý tưởng triết học" của bạn hoặc bất cứ điều gì không thể được diễn đạt / thu hẹp thành một tuyên bố chính xác, nghĩa là nói rõ ràng, sau đó nó là vô dụng để ném xung quanh. Ví dụ: những người thường xuyên phân biệt giữa MLE (MAP với căn hộ trước) và các loại linh mục khách quan khác vì những lý do mơ hồ - nếu sự phản đối của bạn không thể được nêu dưới dạng một tiên đề toán học, thì ở đó
Chill2Macht

không có lý do chính đáng để nêu rõ sự phản đối của bạn ngay từ đầu, bởi vì sự phản đối của bạn quá mơ hồ đến mức không thể tin được. Theo tôi, chỉ số thống kê là "sử dụng toán học" không có nghĩa là các nhà thống kê được coi là những người suy nghĩ cẩu thả hơn các nhà toán học. Các nhà toán học tranh luận tất cả thời gian về các tiên đề toán học là "đáng giá" hoặc "thú vị" để xem xét, như bạn chỉ ra, cuối cùng chỉ dựa trên sở thích cảm xúc. Nhưng những lập luận này thực sự có khả năng có các chất và di chuyển các trường về phía trước, bởi vì vị trí của mỗi bên rõ ràng và không rõ
ràng-

ly đã nêu - ví dụ người ta có thể nói một cách rõ ràng rằng những người theo trực giác từ chối sử dụng Định luật trung gian bị loại trừ, trong khi các nhà toán học khác có nội dung sử dụng nó. Cũng lưu ý cuộc tranh luận gay gắt về Tiên đề của sự lựa chọn. Nhưng cả Luật Trung gian bị loại trừ và Tiên đề lựa chọn đều là những tuyên bố chính xác , với những giả định chính xác khác , có thể bị làm sai lệch, được chứng minh là sai lệch, được chứng minh, v.v. (phụ thuộc vào các giả định khác). Tức là những gì tôi đã cố gắng tranh luận là "triết lý" / "cảm xúc" chỉ nên phát huy sở thích của nhà nước đối với các tiên đề rõ ràng / chính xác khác nhau . Như
Chill2Macht

so với ai đó nói rằng "các linh mục là xấu", và không đưa ra một tiên đề toán học mà họ tin rằng suy luận sẽ thỏa mãn, và việc chọn một ưu tiên có thể được hiển thị một cách hợp lý để vi phạm. Cái trước là vô dụng, trong khi cái sau mang tính xây dựng, bởi vì nó mang lại cho đối thủ một thứ gì đó cụ thể để làm việc, ví dụ như cơ hội đề xuất một tiên đề thay thế mà theo họ "có vẻ hợp lý hơn để giả định cho vấn đề này". Đây là lý do tại sao tôi thực sự thích bài viết thứ hai mà bạn liên kết đến, bởi vì nó thực sự chính xác - đó là "toán học hóa" những diễn giải sai về CI, và chứng minh rằng chúng là sai.
Chill2Macht
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.