Ai là người thường xuyên?


55

Chúng tôi đã có một chủ đề hỏi ai là người Bayes và một người hỏi người thường xuyên có phải là người Bayes không , nhưng không có chủ đề nào hỏi trực tiếp ai là người thường xuyên ? Đây là một câu hỏi đã được @whuber hỏi như là một nhận xét cho chủ đề này và nó xin được trả lời. Họ có tồn tại (có bất kỳ người thường xuyên tự xác định)? Có lẽ họ chỉ được tạo ra bởi những người Bayes, những người cần một vật tế thần để đổ lỗi khi chỉ trích các số liệu thống kê chính thống?

Nhận xét tổng hợp cho các câu trả lời đã được đưa ra: Ngược lại, số liệu thống kê Bayes không chỉ được định nghĩa theo cách sử dụng định lý Bayes (những người không phải Bayes cũng sử dụng nó), cũng không sử dụng cách giải thích xác suất chủ quan (bạn sẽ không gọi bất kỳ giáo dân nào nói những điều như "Tôi cá là cơ hội ít hơn 50:50!" một người Bayes) - vì vậy chúng ta có thể định nghĩa chủ nghĩa thường xuyên theo cách giải thích xác suất được chấp nhận không? Hơn nữa, thống kê áp dụng khả năng , vì vậy định nghĩa của frequentism nên tập trung hoàn toàn vào việc giải thích xác suất?


10
Tôi vẫn muốn biết những gì một "frequentist"? Tôi đã thấy thuật ngữ này được sử dụng như một tài liệu tham khảo rõ ràng cho "bất kỳ người không phải Bayes" cũng như một người nào đó đăng ký một triết lý xác suất thường xuyên. Tôi biết có rất nhiều cái trước nhưng tôi không chắc có bất kỳ số mũ sống nào của cái sau!
whuber

9
Vui lòng đếm tôi như một người thường xuyên. Hãy đoàn kết lại! Hoa chúng ta sẽ mạnh mẽ để tiêu diệt Bayesian tại cổng một lần cho tất cả!
Aksakal

10
@Aksakal lặp lại số lần vô hạn và tôi sẽ xem xét nó có ý nghĩa;)
Tim

5
Cẩn thận người mà bạn gọi là Bayes. Per DV Lindley "Không có ai ít Bayes hơn Bayesian theo kinh nghiệm". Nhiều người sử dụng các phương pháp được gọi là Bayes không thực sự là Bayes. Bây giờ với máy tính nhanh và MCMC mọi người đột nhiên là một Bayes? Đối với nhiều người, đó chỉ là một tính toán khác, giống như bất kỳ cách nào khác, không phải là một triết lý sâu sắc. Là dân số phân chia rời rạc, và chỉ giữa Người thường xuyên và Bayes. Làm thế nào về một người không có giáo dục liên quan, họ là gì? Có thể có một mức độ (hoặc tần số) của Bayesianness? Có thể khác nhau vào các ngày khác nhau trong tuần hoặc các loại phân tích?
Mark L. Stone

10
Tim, tôi e rằng chủ đề này có thể bị ảnh hưởng bởi sự nhầm lẫn tương tự như một số chủ đề liên quan: cụ thể là, có các phương pháp thống kê thường xuyên-vs-bayesian và có những diễn giải xác suất thường xuyên-vs-bayesian. Đây là hai vấn đề khác nhau! Bạn đang hỏi về cái nào? Sự nhầm lẫn là rõ ràng bây giờ, trong các ý kiến ​​cho câu trả lời của @ fcop; fcop nói về định nghĩa / giải thích xác suất, trong khi bạn đã đề cập đến OLS và đây là về phương pháp thống kê.
amip nói phục hồi Monica

Câu trả lời:


35

Một số câu trả lời hiện có nói về suy luận thống kê và một số về giải thích xác suất, và không có câu trả lời rõ ràng nào. Mục đích chính của câu trả lời này là để làm cho sự khác biệt này.


Từ "chủ nghĩa thường xuyên" (và "người thường xuyên") có thể đề cập đến HAI ĐIỀU KHÁC NHAU:

  1. Một là câu hỏi về định nghĩa hoặc giải thích "xác suất" là gì. Có nhiều cách hiểu, "diễn giải thường xuyên" là một trong số đó. Những người thường xuyên sẽ là những người tuân thủ cách giải thích này.

  2. Một cách khác là suy luận thống kê về các tham số mô hình dựa trên dữ liệu quan sát. Có một cách tiếp cận Bayes và một người theo chủ nghĩa thường xuyên đối với suy luận thống kê, và những người thường xuyên sẽ là những người thích sử dụng phương pháp thường xuyên hơn.

Bây giờ đến một suy đoán: Tôi nghĩ rằng hầu như không có người thường xuyên thuộc loại thứ nhất (P-thường xuyên) , nhưng có rất nhiều người thường xuyên thuộc loại thứ hai (S-thường xuyên) .


Giải thích thường xuyên về xác suất

Câu hỏi về xác suất là gì là một chủ đề của cuộc tranh luận đang diễn ra với hơn 100 năm lịch sử. Nó thuộc về triết học. Tôi giới thiệu bất kỳ ai không quen thuộc với cuộc tranh luận này với bài viết Giải thích xác suất trong Bách khoa toàn thư Stanford, trong đó có một phần về (các) diễn giải thường xuyên. Một tài khoản rất dễ đọc khác mà tôi tình cờ biết đến là bài báo này: Appleby, 2004, Xác suất là trường hợp đơn lẻ hoặc không có gì - được viết trong bối cảnh nền tảng của cơ học lượng tử, nhưng chứa các phần tập trung vào xác suất là gì.

Appleby viết:

Chủ nghĩa thường xuyên là vị trí mà một tuyên bố xác suất tương đương với một tuyên bố tần số về một số nhóm được chọn phù hợp. Chẳng hạn, theo von Mises [21, 22], tuyên bố, xác suất của đồng xu này sẽ tăng lên 0,5 0,5 tương đương với tuyên bố trong một chuỗi ném vô hạn, đồng xu này sẽ xuất hiện với giới hạn tần số tương đối 0,5. .

Điều này có vẻ hợp lý, nhưng có rất nhiều vấn đề triết học với định nghĩa này mà người ta khó biết bắt đầu từ đâu. Xác suất mà trời sẽ mưa vào ngày mai là gì? Câu hỏi vô nghĩa, bởi vì làm thế nào chúng ta có một chuỗi thử nghiệm vô tận. Xác suất của đồng xu trong túi của tôi sắp lên đầu là gì? Một tần số tương đối của các đầu trong một chuỗi ném vô hạn, bạn nói gì? Nhưng đồng xu sẽ mòn dần và Mặt trời sẽ đi siêu tân tinh trước khi chuỗi vô hạn có thể kết thúc. Vì vậy, chúng ta nên nói về một chuỗi vô hạn giả định . Điều này đưa người ta đến cuộc thảo luận về các lớp tham chiếu, v.v. Trong triết học, người ta không dễ dàng bỏ đi. Và nhân tiện, tại sao giới hạn phải tồn tại?

Hơn nữa, điều gì sẽ xảy ra nếu đồng xu của tôi xuất hiện 50% thời gian trong một tỷ năm đầu tiên nhưng sau đó sẽ bắt đầu tăng lên chỉ 25% thời gian (thử nghiệm từ Appleby)? Điều này có nghĩa là theo định nghĩa. Nhưng chúng ta sẽ luôn quan sát trong suốt một tỷ năm tới. Bạn có nghĩ rằng một tình huống như vậy là không thực sự có thể? Chắc chắn, nhưng tại sao? Vì có thể đột ngột thay đổi? Nhưng câu này là vô nghĩa đối với một P-thường xuyên.P(Heads)=1/4Frequency(Heads)1/2P(Heads)

Tôi muốn giữ câu trả lời này ngắn gọn vì vậy tôi dừng lại ở đây; xem ở trên để tham khảo. Tôi nghĩ rằng thật khó để trở thành một người thường xuyên P khó tính.

(Cập nhật: Trong các bình luận bên dưới, @mpiktas khẳng định rằng đó là do định nghĩa của người thường xuyên là vô nghĩa về mặt toán học . Ý kiến ​​của tôi được trình bày ở trên là định nghĩa của người thường xuyên là có vấn đề về mặt triết học .)


Phương pháp thống kê thường xuyên

Hãy xem xét một mô hình xác suất có một số thông số và cho phép để tính toán khả năng quan sát dữ liệu . Bạn đã làm một thí nghiệm và quan sát một số dữ liệu . Bạn có thể nói gì về ?P(Xθ)θXXθ

S-tần số là vị trí mà không phải là một biến ngẫu nhiên; giá trị thực sự của nó trong thế giới thực là những gì họ đang có. Chúng ta có thể cố gắng ước tính chúng là một số , nhưng chúng ta không thể nói một cách có ý nghĩa về xác suất của trong một khoảng thời gian nào đó (ví dụ như là tích cực). Điều duy nhất chúng ta có thể làm là đưa ra một quy trình xây dựng một số khoảng xung quanh ước tính của chúng ta để thủ tục này thành công trong việc bao gồm đúng với tần suất thành công dài hạn cụ thể (xác suất cụ thể).θθ^θθ

Hầu hết các số liệu thống kê được sử dụng trong khoa học tự nhiên ngày nay đều dựa trên phương pháp này, vì vậy chắc chắn có rất nhiều người thường xuyên sử dụng S xung quanh ngày nay.

(Cập nhật: nếu bạn tìm một ví dụ về triết gia thống kê, trái ngược với các nhà thực hành thống kê, bảo vệ quan điểm của người thường xuyên S, hãy đọc các bài viết của Deborah Mayo; +1 cho câu trả lời của @ NRH.)


CẬP NHẬT: Về mối quan hệ giữa chủ nghĩa thường xuyên P và chủ nghĩa thường xuyên S

@fcop và những người khác hỏi về mối quan hệ giữa P-tần số và S-tần số. Có một trong những vị trí này ngụ ý một vị trí khác? Không có nghi ngờ rằng lịch sử S-thường được phát triển dựa trên lập trường thường xuyên P; Nhưng họ ngụ ý hợp lý cho nhau?

Trước khi tiếp cận câu hỏi này tôi nên nói như sau. Khi tôi viết ở trên rằng hầu như không có P-thường xuyên, tôi không có ý nói rằng hầu hết mọi người đều là P-chủ quan-bayesian-a-la-de-finetti hoặc P-propensitist-a-la-popper. Trên thực tế, tôi tin rằng hầu hết các nhà thống kê (hoặc nhà khoa học dữ liệu hoặc người học máy) là P-nothing-at-all, hoặc P-shut-up-and-tính (để mượn cụm từ nổi tiếng của Mermin ). Hầu hết mọi người có xu hướng bỏ qua các vấn đề nền tảng. Và nó là tốt. Chúng ta không có một định nghĩa tốt về ý chí tự do, hoặc trí thông minh, hoặc thời gian hoặc tình yêu. Nhưng điều này không thể ngăn chúng ta làm việc trên khoa học thần kinh, hoặc AI, hoặc vật lý, hoặc yêu.

Cá nhân, tôi không phải là người thường xuyên S, nhưng tôi cũng không có bất kỳ quan điểm mạch lạc nào về nền tảng của xác suất.

Ngược lại, hầu hết tất cả những người đã thực hiện một số phân tích thống kê thực tế đều là người thường xuyên S hoặc người S-Bayesian (hoặc có lẽ là một hỗn hợp). Cá nhân, tôi đã xuất bản các bài báo có chứa giá trị và tôi chưa bao giờ (cho đến nay) xuất bản các bài báo có chứa các linh mục và hậu thế về các thông số mô hình, vì vậy điều này khiến tôi trở thành một người thường xuyên S, ít nhất là trong thực tế.p

Do đó, rõ ràng có thể là người thường xuyên S mà không phải là người thường xuyên P, bất chấp những gì @fcop nói trong câu trả lời của anh ta.

Được chứ. Khỏe. Nhưng vẫn: P-bayesian có thể là người thường xuyên không? Và một người thường xuyên P có thể là một S-bayesian?

Đối với một P-bayesian bị thuyết phục, có lẽ không điển hình là một người thường xuyên S, nhưng về nguyên tắc hoàn toàn có thể. Ví dụ, một P-bayesian có thể quyết định rằng họ không có bất kỳ thông tin nào trước đó về và do đó áp dụng phân tích S-thường xuyên. Tại sao không. Mọi yêu sách thường xuyên của S-chắc chắn có thể được giải thích với giải thích xác suất P-bayesian.θ

Đối với một người thường xuyên P bị thuyết phục là S-bayesian có lẽ là vấn đề. Nhưng sau đó, rất khó để trở thành một người thường xuyên bị thuyết phục P ...


2
Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
Glen_b

13

Công trình của Kolmogorov về Cơ sở lý thuyết xác suất có phần "Liên quan đến dữ liệu thực nghiệm" trên trang 3. Đây là những gì ông đã viết ở đó:

nhập mô tả hình ảnh ở đây

nhập mô tả hình ảnh ở đây

Anh ta cho thấy cách người ta có thể khấu trừ Tiên đề của mình bằng cách quan sát các thí nghiệm. Đây là một cách khá thường xuyên để giải thích các xác suất.

Anh ta có một trích dẫn thú vị khác cho các sự kiện không thể (bộ trống):

nhập mô tả hình ảnh ở đây

Vì vậy, tôi nghĩ rằng nếu bạn cảm thấy thoải mái với những tranh luận này, thì bạn phải thừa nhận rằng bạn là người thường xuyên. Nhãn này không độc quyền. Bạn có thể là hai người nghịch ngợm (tôi đã tạo nên từ này), tức là cả người thường xuyên và người Bayes. Chẳng hạn, tôi trở thành Bayes khi áp dụng các phương pháp ngẫu nhiên cho các hiện tượng vốn không phải là ngẫu nhiên.

CẬP NHẬT Như tôi đã viết trước đó trên CV, bản thân lý thuyết của Kolmogorov không phải là người thường xuyên. Nó tương thích với chế độ xem Bayes như với chế độ xem thường xuyên. Anh ấy đặt chú thích dễ thương này vào phần để nói rõ rằng anh ấy không tuân theo triết lý:

nhập mô tả hình ảnh ở đây


1
hầu hết các hệ tiên đề đều bắt nguồn từ các khái niệm thế giới thực '' trừu tượng hóa 'hoặc' 'khái quát hóa'. Cũng giống như khái niệm (tiên đề) của một '' số liệu '', họ đã xem xét khái niệm thế giới thực (khoảng cách eucildean) và '' tìm thấy '' ba thuộc tính mà họ sử dụng làm '' tiên đề '' trong không gian số liệu. Nhưng câu trả lời của bạn rất tốt (+1), điều đó cho thấy Kolmogorov không '' phát minh '' tiên đề của mình '' ngoài không khí '', ông đã phát triển một hệ thống tiên đề có liên quan đến sự hiểu biết về khả năng chống đỡ tại thời điểm đó .

1
Bạn có thể xem ý kiến ​​của @mpiktas cho câu hỏi này và nói rằng chính Kolmogorov đã đưa ra định kiến ​​đó? xem bình luận về stats.stackexchange.com/questions/230415/ từ

2
@fcop, em nhớ câu trả lời của anh. Có vẻ hợp lý. Bạn chắc chắn có thể rút ra các tiên đề Bayes, và Kolmogorov cho thấy điều đó trong cuốn sách.
Aksakal

1
+1 Chính xác những gì tôi đã nghĩ (đặc biệt là chú thích) khi tôi đang viết bình luận cho các chủ đề liên quan. Cũng bình luận cuối cùng của @Aksakal.
Graeme Walsh

1
@Aksakal: đề cập đến nhận xét của bạn ở trên: đó không phải là câu trả lời '' của anh ấy 'mà là của tôi :-)

8

Tôi tin rằng có liên quan đến việc đề cập đến Deborah Mayo, người viết blog Triết lý thống kê lỗi .

Tôi sẽ không tuyên bố có hiểu biết sâu sắc về vị trí triết học của cô ấy, nhưng khuôn khổ thống kê lỗi , như được mô tả trong một bài báo với Aris Spanos, bao gồm những gì được coi là phương pháp thống kê thường xuyên cổ điển. Để trích dẫn bài báo:

Theo phương pháp thống kê lỗi, người ta có thể bao gồm tất cả các phương pháp tiêu chuẩn sử dụng xác suất lỗi dựa trên tần số lỗi tương đối trong lấy mẫu lặp lại - thường được gọi là lý thuyết lấy mẫu hoặc thống kê thường xuyên .

Và hơn nữa trong cùng một bài báo bạn có thể đọc rằng:

Đối với xác suất thống kê lỗi phát sinh không phải để đo lường mức độ xác nhận hoặc niềm tin (thực tế hoặc hợp lý) trong các giả thuyết, mà là để định lượng tần suất các phương pháp có khả năng phân biệt giữa các giả thuyết thay thế và chúng đáng tin cậy như thế nào khi phát hiện ra lỗi.


2
+1, Rất tốt khi đề cập đến blog của Mayo. Cô ấy thực sự là nhà triết học có tiếng nói nhất trong số các nhà thống kê đang hỗ trợ thống kê thường xuyên. Hầu hết những người nổi tiếng khác trên internet những ngày này đều ủng hộ số liệu thống kê của Bayes.
amip nói rằng Phục hồi Monica

6

Đề cập đến chủ đề này và các ý kiến ​​về nó, tôi nghĩ rằng những người thường xuyên là những người xác định '' xác suất '' của một sự kiện là tần suất tương đối dài hạn của sự kiện đó. Vì vậy, nếu là số thí nghiệm và số lần xuất hiện của sự kiện thì xác suất của sự kiện , ký hiệu là , được định nghĩa là .nnAAAP(A)

P(A):=limn+nAn

Không khó để thấy rằng định nghĩa này đáp ứng các tiên đề của Kolmogorov (vì lấy giới hạn là tuyến tính, xem thêm Có cơ sở * toán học * nào cho cuộc tranh luận Bayesian và thường xuyên không? ).

Để đưa ra định nghĩa như vậy, họ phải '' tin '' rằng giới hạn này tồn tại. Vì vậy, những người thường xuyên là những người tin vào sự tồn tại của giới hạn này.

EDIT ngày 31/8/2016: về sự phân biệt giữa S- và P-thường xuyên

Vì @amoeba phân biệt trong câu trả lời của anh ấy giữa người thường xuyên S và người thường xuyên P, trong đó người thường xuyên P là loại người thường xuyên mà tôi xác định supra, và anh ấy cũng cho rằng thật khó để trở thành người thường xuyên P, tôi đã thêm phần EDIT cho rằng điều ngược lại là đúng;

Tôi cho rằng tất cả S-frequentists là P-frequentists .

Trong phần thường xuyên S @amoeba nói '' thủ tục này thành công trong việc bao gồm đúng với tần suất thành công dài hạn cụ thể (xác suất cụ thể). ''θ

Trong câu trả lời của mình, ông cũng nói rằng P-thường là một loài quý hiếm.

Nhưng '' tần số thành công dài hạn '' này, được sử dụng để xác định chủ nghĩa thường xuyên S, là cái mà anh ta định nghĩa là chủ nghĩa thường xuyên P vì đó là cách giải thích của .P(CI^θ)

Do đó, theo những khuyết điểm của anh ấy, mỗi người thường xuyên S cũng là người thường xuyên sử dụng P. Do đó, tôi kết luận rằng những người thường xuyên sử dụng P không quá hiếm như tranh luận của amip.

Thậm chí còn nhiều hơn; @amoeba cũng lập luận rằng những người thường xuyên S coi tham số chưa biết là cố định hoặc không ngẫu nhiên, do đó người ta không thể nói về '' xác suất của có giá trị hạt '', ông nói rằngθθ

'' Điều duy nhất chúng tôi có thể làm là đưa ra một quy trình xây dựng một khoảng thời gian xung quanh ước tính của chúng tôi để quy trình này thành công trong việc bao gồm đúng với tần suất thành công dài hạn cụ thể (xác suất cụ thể). ''θ

Tôi có thể hỏi cái gì có thể là nguồn gốc của cái tên '' người thường xuyên '': (a) '' không ngẫu nhiên '' -idea hoặc (b) '' tần số chạy dài '' - ý tưởng?θ

Tôi cũng có thể hỏi @mpiktas, người viết bình luận của mình cho câu trả lời của amip:

'' Rất khó để trở thành một người thường xuyên P, bởi vì thực tế không thể đưa ra định nghĩa âm thanh toán học về xác suất như vậy ''

Nếu bạn cần một định nghĩa về chủ nghĩa thường xuyên P để xác định chủ nghĩa thường xuyên S, làm thế nào người ta có thể trở thành người thường xuyên hơn S so với người thường xuyên P?


3
@Tim: tại sao OLS sẽ là '' người thường xuyên ''?

2
Nếu đúng là như vậy, thì toàn bộ cuộc thảo luận về những người thường xuyên dường như không có nhiều ý nghĩa vì phạm vi quan tâm của họ rất hạn chế và các khu vực thống kê khổng lồ nằm ngoài phạm vi của họ ... (Bao gồm nhiều lĩnh vực được quan tâm Bayesians.) những gì tôi nói là điều này dường như không được các định nghĩa vì nó là quá hẹp.
Tim

2
Những người Bayes (tự xưng, hoặc chỉ là những người thực dụng đang đeo "chiếc mũ Bayes" của họ cho những người khác) tin là ? limn+nAn
Cá bạc

1
@Silverfish Bayesian được tự do sử dụng tần số dài hạn như xác suất nếu họ muốn làm như vậy, đó chỉ là những người thường xuyên không có tùy chọn. Sự khác biệt chính là một Bayes có thể nói rằng , nhưng trong suy luận, chúng tôi quan tâm đến việc xác định phân phối trên các giá trị hợp lý của mà chúng tôi thu được từ các quan sát 1E12. limn+nA/npHlimn+nA/npH
Dikran Marsupial

3
nền tảng của lý thuyết xác suất chính xác cho lý do đó, tức là đưa ra những diễn giải nhất định về nền toán học âm thanh xác suất. Bây giờ bạn muốn quay lại và xác minh lại "xác suất" với định nghĩa "thường xuyên" của bạn. Tôi thấy điều này sai lệch, do đó tôi đánh giá thấp câu trả lời của bạn. Bạn được chào đón để bỏ qua điều này, đây là cách trang web hoạt động, luôn có khả năng bất đồng.
mpiktas

4

Câu hỏi thực sự thú vị!

Tôi đã đặt mình vào trại thường xuyên khi hiểu và giải thích các tuyên bố xác suất, mặc dù tôi không quá khó khăn về sự cần thiết của một chuỗi các thí nghiệm iid thực tế để đưa ra xác suất này. Tôi nghi ngờ hầu hết những người không mua luận án rằng "xác suất là thước đo niềm tin chủ quan" cũng sẽ nghĩ về xác suất theo cách này.

Ý tôi là đây: lấy đồng xu "công bằng" thông thường của chúng tôi, với chỉ định . Khi tôi nghe điều này, tôi tạo thành hình ảnh một người nào đó tung đồng xu này nhiều lần và tỷ lệ đầu người đạt . Bây giờ, nếu được nhấn, tôi cũng sẽ nói rằng tỷ lệ các đầu trong bất kỳ mẫu ngẫu nhiên nào từ một chuỗi hữu hạn của các lần tung đồng xu như vậy cũng sẽ đạt tới khi kích thước mẫu tăng lên (giả định độc lập).0,5 0,5P(H)=0.50.50.5

Như đã được tuyên bố bởi những người khác, giả định lớn nhất là giới hạn này tồn tại và đúng (nghĩa là giới hạn là ), nhưng tôi nghĩ cũng quan trọng là giả định rằng cũng có giới hạn tương tự cho các mẫu phụ được chọn ngẫu nhiên. Mặt khác, giải thích của chúng tôi chỉ có nghĩa là viết toàn bộ chuỗi vô hạn (ví dụ: chúng tôi có thể có tự động tương quan mạnh được lấy trung bình).0.5

Tôi nghĩ rằng ở trên là không gây tranh cãi cho những người thường xuyên. Một người Bayes sẽ tập trung hơn vào thí nghiệm trong tay và ít hơn vào hành vi dài hạn: họ sẽ nói rằng mức độ tin tưởng của họ rằng cú ném tiếp theo sẽ là đầu ... dừng hoàn toàn.P(H)=0.5

Đối với một trường hợp đơn giản như tung đồng xu, chúng ta có thể thấy rằng các phương pháp tiếp cận thường xuyên và Bayes là tương đương về chức năng, mặc dù về mặt triết học rất khác nhau. Như Dikran Marsupial đã chỉ ra, trên thực tế, Bayes có thể đang sử dụng thực tế là chúng ta thấy các đồng tiền xuất hiện thường xuyên như chúng ta thấy chúng xuất hiện (tần số dài / tần số mẫu lớn như trước).

Còn những thứ không thể có tần số chạy dài thì sao? Chẳng hạn, xác suất Triều Tiên sẽ bắt đầu chiến tranh với Nhật Bản trong 10 năm tới là bao nhiêu? Đối với những người thường xuyên, chúng tôi thực sự bị bỏ rơi, vì chúng tôi thực sự không thể mô tả các phân phối lấy mẫu cần thiết để kiểm tra một giả thuyết như vậy. Một Bayes sẽ có thể giải quyết vấn đề này bằng cách đặt phân phối xác suất theo các khả năng, rất có thể dựa trên việc khơi gợi đầu vào của chuyên gia.

Tuy nhiên, một câu hỏi quan trọng được đặt ra: những mức độ niềm tin này (hoặc giá trị giả định cho tần suất dài hạn) đến từ đâu? Tôi tranh luận từ tâm lý học và nói rằng những niềm tin này (đặc biệt là trong các khu vực cách xa dữ liệu thực nghiệm) đến từ những gì được gọi là heuristic có tính đại diệnheuristic . Có hàng loạt người khác có khả năng tham gia. Tôi lập luận điều này bởi vì trong trường hợp không có dữ liệu để hiệu chỉnh niềm tin của chúng tôi (đối với tần suất chạy dài được quan sát!), Chúng tôi phải dựa vào phương pháp phỏng đoán, tuy nhiên chúng tôi có vẻ tinh vi.

Những suy nghĩ heuristic tinh thần ở trên áp dụng như nhau cho những người thường xuyên và Bayes. Điều thú vị đối với tôi là bất kể triết lý của chúng ta, tận gốc, chúng ta đặt niềm tin nhiều hơn vào thứ mà chúng ta nghĩ là có khả năng là đúng và chúng ta tin rằng nó có nhiều khả năng là đúng bởi vì chúng ta tin rằng có nhiều cách hơn cho nó là sự thật, hoặc chúng ta tưởng tượng rằng những con đường dẫn đến nó là sự thật sẽ xảy ra thường xuyên hơn (thường xuyên :-) so với những điều sẽ làm cho nó không đúng sự thật.

Vì đó là một năm bầu cử, chúng ta hãy lấy một ví dụ chính trị: Chúng ta sẽ đặt niềm tin nào vào tuyên bố "Ted Cruz sẽ đề xuất một khẩu súng trường tấn công cấm trong 4 năm tới". Bây giờ, chúng tôi có một số dữ liệu về điều này từ các tuyên bố của anh ấy và chúng tôi có thể đặt niềm tin trước đó vào sự thật của tuyên bố này rất gần với số không. Nhưng tại sao? Tại sao những tuyên bố trước đây của anh ấy khiến chúng ta nghĩ theo cách này? Bởi vì chúng tôi nghĩ rằng những người có ý thức hệ cao có xu hướng "dính súng" hơn các đối tác thực dụng của họ. Trường hợp nào này đến từ đâu? Có khả năng từ các nghiên cứu được thực hiện bởi các nhà tâm lý học và kinh nghiệm của chúng ta với những người có nguyên tắc cao.

Nói cách khác, chúng tôi có một số dữ liệu và niềm tin rằng trong hầu hết các trường hợp ai đó như Cruz có thể thay đổi ý định, họ sẽ không (một lần nữa, đánh giá dài hạn hoặc mẫu lớn về các loại).

Đây là lý do tại sao tôi "họp kín" với những người thường xuyên. Không phải tôi không thích triết lý Bayes (khá hợp lý) hay phương pháp (chúng rất tuyệt!), Nhưng nếu tôi đào sâu vào lý do tại sao tôi có niềm tin thiếu sự ủng hộ mẫu lớn, tôi thấy rằng tôi đang dựa vào một loại nào đó về mô hình tinh thần nơi kết quả có thể được kiểm tra (nếu ngầm) hoặc nơi tôi có thể gọi các xác suất dài hạn trong một quy trình cụ thể (ví dụ, đảng Cộng hòa bỏ phiếu chống lại các biện pháp kiểm soát súng X% thời gian) để cân nhắc niềm tin của tôi theo cách này hay cách khác .

Tất nhiên, đây không phải là chủ nghĩa thường xuyên thực sự đúng, và tôi nghi ngờ rằng có nhiều người đăng ký giải thích von Mieses-esque về xác suất của bức thư. Tuy nhiên, tôi nghĩ rằng nó cho thấy khả năng tương thích cơ bản giữa xác suất Bayes và Thường xuyên: Cả hai đều hấp dẫn các phương pháp phỏng đoán bên trong của chúng tôi về tính khả dụng hoặc cái mà tôi gọi là nguyên tắc "Pachinko" về tần số theo chuỗi nguyên nhân.

Vì vậy, có lẽ tôi nên tự gọi mình là "người sẵn sàng", để chỉ ra rằng tôi chỉ định xác suất dựa trên mức độ thường xuyên tôi có thể tưởng tượng một sự kiện xảy ra như là kết quả của một chuỗi sự kiện (tất nhiên với sự nghiêm ngặt / mô hình hóa). Nếu tôi có nhiều dữ liệu, thật tuyệt. Nếu tôi không, thì tôi sẽ cố gắng phân tách giả thuyết thành một chuỗi các sự kiện và sử dụng dữ liệu tôi có (giai thoại hoặc "lẽ thường", như cần thiết) để đánh giá mức độ thường xuyên tôi sẽ tưởng tượng ra một sự kiện như vậy.

Xin lỗi cho bài viết dài, câu hỏi tuyệt vời BTW!


1
Bạn thực hiện quá đơn giản về cách tiếp cận chủ quan đối với xác suất. Tôi đồng ý rằng tâm lý học đóng vai trò trong cách bạn làm việc với dữ liệu, nhưng bạn cũng có thể phân tích thiên kiến ​​chủ quan theo cách tiếp cận thường xuyên. Một số người Bayes cho rằng trong trường hợp Bayes ít nhất bạn làm cho niềm tin chủ quan của bạn rõ ràng, thay vì bỏ qua chúng.
Tim

1
@Tim Tôi không nói rằng những người thường xuyên là khách quan hơn (xem phần đầu tiên của tôi về những giả định chính cho những người thường xuyên.) Ngoài ra, điều tôi đã chỉ ra là cả những người thường xuyên và Bayes đều đặt ra xác suất của họ về niềm tin của họ về mức độ thường xuyên xảy ra hoặc có bao nhiêu điều cần phải xảy ra (và khả năng cá nhân của họ để làm như vậy) để biến điều đó thành sự thật.

1
@Tim vì đây không phải là một bài viết về chủ nghĩa Bayes vs Chủ nghĩa thường xuyên, tôi nghi ngờ tôi đã đưa ra do họ ... sẽ mất rất nhiều không gian trang! Về cơ bản, tất cả chúng ta đều dựa vào các heuristic tinh thần khi nghĩ về xác suất, và các heuristic này khiến chúng ta nghĩ về một số loại sự kiện có thể xảy ra "theo nhiều cách hơn" hoặc "dễ tiếp cận hơn trong một mạng lưới nhân quả" so với các loại khác.

1
@Tim OK ... Tôi đã thêm vào một số langugae để làm rõ khi tôi chuyển từ cuộc thảo luận (ngắn gọn) về chủ nghĩa Bayes sang chủ đề chính của mình.

4

Như @amoeba nhận thấy, chúng tôi có định nghĩa thường xuyên về xác suấtthống kê thường xuyên . Tất cả các nguồn mà tôi đã thấy cho đến bây giờ nói rằng suy luận thường xuyên dựa trên định nghĩa xác suất thường xuyên, nghĩa là hiểu nó là giới hạn theo tỷ lệ rút ngẫu nhiên số vô hạn (như đã được chú ý bởi @fcop@Aksakal trích dẫn Kolmogorov)

P(A)=limnnAn

Về cơ bản, có một khái niệm về một số dân mà chúng ta có thể lấy mẫu lặp lại từ đó. Ý tưởng tương tự được sử dụng trong suy luận thường xuyên. Tôi đã xem qua một số bài báo kinh điển, ví dụ của Jerzy Neyman , để theo dõi nền tảng lý thuyết của thống kê thường xuyên. Năm 1937 Neyman viết

( Ia ) Các nhà thống kê là có liên quan với dân, , mà đối với một số lý do nào khác không thể được nghiên cứu thấu đáo. Chỉ có thể rút ra một mẫu từ dân số này có thể được nghiên cứu chi tiết và được sử dụng để hình thành ý kiến ​​về các giá trị của các hằng số nhất định mô tả các thuộc tính của dân số . Ví dụ: có thể muốn tính xấp xỉ trung bình của một nhân vật nào đó được sở hữu bởi các cá nhân hình thành nên quần thể , v.v. ( ibpi pi piπππ
) Ngoài ra, nhà thống kê có thể quan tâm đến một số thí nghiệm nhất định, nếu lặp lại trong các điều kiện rõ ràng giống hệt nhau, mang lại kết quả khác nhau. Các thí nghiệm như vậy được gọi là thí nghiệm ngẫu nhiên [...]
Trong cả hai trường hợp được mô tả, vấn đề mà nhà thống kê phải đối mặt là vấn đề ước tính. Vấn đề này bao gồm việc xác định những thao tác số học nào cần được thực hiện trên dữ liệu quan sát để có được kết quả, được gọi là ước tính, có lẽ không khác nhiều so với giá trị thực của ký tự số, của dân số , như trong ( ia ), hoặc của các thí nghiệm ngẫu nhiên, như trong ( ib ). [...] Trong ( iaπ
) chúng tôi nói về một nhà thống kê vẽ một mẫu từ dân số nghiên cứu.

Trong một bài báo khác (Neyman, 1977), ông lưu ý rằng bằng chứng được cung cấp trong dữ liệu cần phải được xác minh bằng cách quan sát bản chất lặp đi lặp lại của hiện tượng nghiên cứu:

Thông thường, 'xác minh' hoặc 'xác nhận' của một mô hình đoán bao gồm việc suy ra một số hậu quả thường gặp của nó trong các tình huống không được nghiên cứu trước đó theo kinh nghiệm và sau đó thực hiện các thí nghiệm phù hợp để xem kết quả của chúng có phù hợp với dự đoán hay không. Nói chung, nỗ lực xác minh đầu tiên là âm tính: tần số quan sát được của các kết quả khác nhau của thử nghiệm không đồng ý với mô hình. Tuy nhiên, trong một số dịp may mắn, có một thỏa thuận hợp lý và người ta cảm thấy sự hài lòng khi có "hiểu" hiện tượng này, ít nhất là theo một cách nào đó. Sau đó, luôn luôn xuất hiện những phát hiện thực nghiệm mới, cho thấy sự không phù hợp của mô hình ban đầu và yêu cầu từ bỏ hoặc sửa đổi nó. Và đây là lịch sử của khoa học!

và trong một bài báo khác, Neyman và Pearson (1933) viết về các mẫu ngẫu nhiên được rút ra từ dân số cố định

Trong thực tế thống kê thông thường, khi các sự kiện quan sát được mô tả là "mẫu" và các giả thuyết liên quan đến "quần thể", trong đó các mẫu được rút ra, các ký tự của mẫu, hoặc như chúng ta sẽ gọi chúng là tiêu chí, đã được gọi là tiêu chí được sử dụng để kiểm tra các giả thuyết, thường xuất hiện để được sửa chữa bằng trực giác hạnh phúc.

Thống kê thường xuyên trong bối cảnh này chính thức hóa lý luận khoa học nơi thu thập bằng chứng, sau đó các mẫu mới được rút ra để xác minh những phát hiện ban đầu và khi chúng tôi tích lũy thêm bằng chứng trạng thái kiến ​​thức của chúng tôi kết tinh. Một lần nữa, như được mô tả bởi Neyman (1977), quy trình thực hiện các bước sau

( i ) Thiết lập theo kinh nghiệm các tần số tương đối ổn định dài hạn (hay "tần số ngắn") của các sự kiện được đánh giá là thú vị, khi chúng phát triển trong tự nhiên.
( ii ) Đoán và sau đó xác minh "cơ chế cơ hội", hoạt động lặp đi lặp lại tạo ra các tần số quan sát được. Đây là một vấn đề của 'lý thuyết xác suất thường xuyên'. Đôi khi, bước này được gắn nhãn 'xây dựng mô hình'. Đương nhiên, cơ chế đoán cơ hội là giả thuyết.
( iii ) Sử dụng cơ chế cơ hội giả thuyết của hiện tượng được nghiên cứu để suy ra các quy tắc điều chỉnh hành động của chúng tôi (hoặc "quyết định") cho các quan sát để đảm bảo "mức độ" thành công cao nhất. [... trong số 'quy tắc điều chỉnh hành động của chúng ta' là một vấn đề của toán học, đặc biệt là thống kê toán học.

Những người thường xuyên lên kế hoạch nghiên cứu của họ trong tâm trí về bản chất ngẫu nhiên của dữ liệu và ý tưởng rút ra nhiều lần từ dân số cố định, họ thiết kế các phương pháp của họ dựa trên nó và sử dụng nó để xác minh kết quả của họ (Neyman và Pearson, 1933),

Không hy vọng biết mỗi giả thuyết riêng biệt là đúng hay sai, chúng ta có thể tìm kiếm các quy tắc để điều chỉnh hành vi của mình đối với chúng, theo đó chúng ta đảm bảo rằng, về lâu dài kinh nghiệm, chúng ta sẽ không quá thường xuyên sai.

Điều này được kết nối với nguyên tắc lấy mẫu lặp lại (Cox và Hinkley, 1974):

(ii) Nguyên tắc lấy mẫu lặp lại mạnh mẽ
Theo nguyên tắc lấy mẫu lặp lại mạnh mẽ, các quy trình thống kê sẽ được đánh giá bằng hành vi của chúng trong các lần lặp lại giả thuyết trong cùng điều kiện. Điều này có hai khía cạnh. Các biện pháp không chắc chắn sẽ được hiểu là tần số giả định trong các lần lặp lại dài hạn; tiêu chí của sự tối ưu sẽ được xây dựng dưới dạng hành vi nhạy cảm trong các lần lặp lại giả thuyết.
Lập luận cho điều này là nó đảm bảo ý nghĩa vật lý cho các đại lượng mà chúng ta tính toán và nó đảm bảo mối quan hệ chặt chẽ giữa phân tích chúng ta thực hiện và mô hình cơ bản được coi là đại diện cho trạng thái "thực".

(iii) Nguyên tắc lấy mẫu lặp lại
yếu Phiên bản yếu của nguyên tắc lấy mẫu lặp lại yêu cầu chúng ta không nên tuân theo các quy trình mà đối với một số giá trị tham số có thể sẽ đưa ra, trong các lần lặp lại giả thuyết, hầu hết các kết luận sai lệch.

Ngược lại, khi sử dụng tối đa khả năng chúng tôi quan tâm đến mẫu mà chúng tôi có , và trong trường hợp Bayes, chúng tôi suy luận dựa trên mẫu và các linh mục của chúng tôi và khi dữ liệu mới xuất hiện, chúng tôi có thể thực hiện cập nhật Bayes. Trong cả hai trường hợp, ý tưởng lấy mẫu lặp lại là không quan trọng. Những người thường xuyên chỉ dựa vào dữ liệu họ có (như được chú ý bởi @WBT ), nhưng hãy nhớ rằng đó là một cái gì đó ngẫu nhiên và nó được coi là một phần của quá trình lấy mẫu lặp lại từ dân số (ví dụ, nhớ lại về độ tin cậy khoảng được xác định).

Trong trường hợp thường xuyên, ý tưởng lấy mẫu lặp đi lặp lại cho phép chúng tôi định lượng độ không đảm bảo (trong thống kê) và cho phép chúng tôi diễn giải các sự kiện trong đời thực theo xác suất .


Một ghi chú bên lề, lưu ý rằng cả Neyman (Lehmann, 1988), hay Pearson (Mayo, 1992) đều không phải là những người thường xuyên thuần túy như chúng ta có thể tưởng tượng. Ví dụ, Neyman (1977) đề xuất sử dụng Empirical Bayesian và Khả năng tối đa để ước tính điểm. Mặt khác (Mayo, 1992),

trong phản ứng của Pearson (1955) với Fisher (và những nơi khác trong công việc của ông) là vì bối cảnh khoa học, Pearson bác bỏ cả lý do xác suất lỗi dài hạn thấp [...]

Vì vậy, có vẻ như rất khó để tìm thấy những người thường xuyên thuần túy ngay cả trong số những người sáng lập.


Neyman, J và Pearson, ES (1933). Về vấn đề kiểm tra hiệu quả nhất các giả thuyết thống kê. Các giao dịch triết học của Hiệp hội Hoàng gia A: Khoa học toán học, vật lý và kỹ thuật. 231 (694 Từ706): 289

Neyman, J. (1937). Sơ lược về một lý thuyết ước tính thống kê dựa trên lý thuyết cổ điển về xác suất. Phil. Xuyên. R. Sóc. Thích A. 236: 333 Cảng 380.

Neyman, J. (1977). Xác suất thường xuyên và thống kê thường xuyên. Synthese, 36 (1), 97-131.

Mayo, DG (1992). Pearson đã từ chối triết lý thống kê của Neyman-Pearson? Synthese, 90 (2), 233-262.

Cox, DR và ​​Hinkley, DV (1974). Thống kê lý thuyết. Chapman và Hội trường.

Lehmann, E. (1988). Jerzy Neyman, 1894 - 1981. Báo cáo kỹ thuật số 155. Khoa Thống kê, Đại học Califomia.


1
+1 (đã vài ngày trước). Cảm ơn bạn đã viết lên đây, có một số trích dẫn hay ở đây và danh sách các tài liệu tham khảo rất hữu ích. Đổi lại, bây giờ tôi đã cập nhật câu trả lời của mình ở một số nơi nhưng chủ yếu là cuối cùng, để làm rõ mối quan hệ giữa P- và S-thường xuyên như tôi thấy. Tôi chắc chắn đồng ý rằng S-freq trong lịch sử được xây dựng trên các ý tưởng P-freq, như bạn tranh luận ở đây, nhưng tôi không nghĩ rằng chúng nhất thiết phải đòi hỏi nhau.
amip nói rằng Phục hồi Monica

4

Hãy để tôi đưa ra một câu trả lời kết nối câu hỏi này với một vấn đề có tầm quan trọng hiện tại và rất thực tế - Chính xác - trong khi đồng thời trả lời nó theo nghĩa đen như đã hỏi: Ai là người thường xuyên?

Những người thường xuyên là những người nói những điều như [1] (nhấn mạnh của tôi):

Rủi ro 10% của một sự kiện trong thập kỷ tới có ý nghĩa gì đối với cá nhân mà nó được tạo ra? Trái với suy nghĩ, mức độ rủi ro này không phải là rủi ro cá nhân của người đó bởi vì xác suất không có ý nghĩa trong bối cảnh cá nhân .

Do đó, những người thường xuyên diễn giải 'xác suất' theo cách mà nó không có ý nghĩa gì trong bối cảnh đơn lẻ giống như của một bệnh nhân . My PubMed Commons bình luận vào [1] khảo sát vặn vẹo tác giả frequentist của nó phải trải qua để phục hồi một semblance của một khái niệm xác suất giống như áp dụng đối với việc chăm sóc một bệnh nhân. Quan sát làm thế nào và tại sao họ làm điều này có thể chứng minh rất hướng dẫn như ai là người thường xuyên . Ngoài ra, việc trao đổi tiếp theo phần lớn không làm sáng tỏ trong phần JAMA Letters [2,3] mang tính hướng dẫn về tầm quan trọng của việc nhận ra rõ ràng các hạn chế trong các khái niệm xác suất thường xuyên và tấn công trực tiếp vào chúngnhư vậy. (Tôi rất tiếc nhiều người dùng CV có thể thấy rằng [1] nằm sau một tường thành.)

Cuốn sách tuyệt vời và rất dễ đọc [4] của L. Jonathan Cohen sẽ trả lại những nỗ lực của bất kỳ ai quan tâm đến câu hỏi của OP. Đáng chú ý, cuốn sách kỳ lạ của Cohen đã được trích dẫn bởi [1] liên quan đến tuyên bố "xác suất không có ý nghĩa trong bối cảnh cá nhân", mặc dù Cohen rõ ràng phản bác quan điểm này như sau [4, tr49]:

Nó cũng không mở cho một nhà lý thuyết tần số để tuyên bố rằng tất cả các xác suất quan trọng thực sự là chung chung, không phải là số ít. Có vẻ như rất quan trọng để có thể tính toán xác suất thành công cho phẫu thuật cắt ruột thừa của con bạn ...


1] Người nhện AD, D'Agostino Sr RB và Pencina MJ. Vai trò của các bác sĩ trong kỷ nguyên của phân tích dự đoán. Rằng JAMA 314, không. 1 (ngày 7 tháng 7 năm 2015): 25 Cung26. doi: 10.1001 / jama.2015.6177. PubMed

2] Van Calster B, Steyerberg EW và Harrell FH. Dự đoán của RI RIsk cho cá nhân. JAMA 314, no. 17 (ngày 3 tháng 11 năm 2015): 1875 Từ1875. doi: 10.1001 / jama.2015.12215. Toàn văn

3] Người nhện AD, D'Agostino Sr RB và Pencina MJ. Dự đoán của RI RIsk cho cá nhân. Trả lời. JAMA 314, no. 17 (ngày 3 tháng 11 năm 2015): 1875 Từ76. doi: 10.1001 / jama.2015.12221. Toàn văn

4] Cohen, L. Jonathan. Giới thiệu về triết lý của cảm ứng và xác suất. Oxford: New York: Clarendon Press; Nhà xuất bản Đại học Oxford, 1989. Liên kết đến các trang được quét 46-53 & 81-83



Tôi thích câu nói "rủi ro có thể được coi là mức độ chủ quan mà một người tin tưởng vào điều đó hoặc là người được đặt cược trước khi đặt cược vào sự xuất hiện của một căn bệnh hoặc sự kiện, chỉ là một lần đặt cược vào các sự kiện 1 lần trong tương lai trong các trò chơi thể thao ". Cảm ơn cho đầu vào và tài liệu tham khảo của bạn.
Tim

2
Có vẻ như một câu trả lời tốt, nhưng tôi hơi bối rối. Tôi tin rằng những người thường xuyên quan tâm đến các thủ tục (thí nghiệm), theo lý thuyết, có thể được chạy vô số lần. Không có nghĩa là họ không thể đưa ra dự đoán về việc tung đồng xu tiếp theo, chỉ là mối quan tâm / đảm bảo của họ tập trung vào quá trình. Đúng, họ sẽ nói rằng "Hoa Kỳ sẽ vô địch World Cup năm nay" không phải là điều họ có thể nói bất cứ điều gì, nhưng họ không thể nói gì về việc cắt ruột thừa của con bạn - nó là duy nhất theo nghĩa, nhưng là phụ lục trẻ em thì không.
Wayne

@Tim, cảm ơn vì liên kết, bao gồm cả [2] và [3]. Tôi đã cập nhật văn bản câu trả lời của tôi cho phù hợp.
David C. Norris

2
@Wayne, tôi muốn đề xuất câu trả lời của amip ở trên - với sự khác biệt giữa các quy trình thống kê được liên kết theo cách thông thường với 'chế độ xem tần suất xác suất' và chính chế độ xem tần số đó - sẽ đưa ra nhận xét của bạn. Mọi người có thể sử dụng các thủ tục thống kê thường xuyên, nhưng giải thíchsử dụng các xác suất kết quả theo các cách thức chủ quan hoặc chủ quan. Người ta chỉ cần nhìn vào lỗi vĩnh viễn của việc diễn giải các giá trị P là 'xác suất giả thuyết null là đúng' để thấy rằng điều này là như vậy.
David C. Norris

3

"Người thường xuyên so với người Bayes" từ XKCD (theo CC-BY-NC 2.5 ), nhấp để thảo luận:

'Máy dò!  Nhà thống kê Bayes sẽ nói gì nếu tôi hỏi anh ấy liệu-- '[roll]' TÔI LÀ NGƯỜI PHÁT HIỆN NEUTRINO, KHÔNG PHẢI LÀ HƯỚNG DẪN TRẺ EM.  NGHIÊM TÚC, BẠN ĐÃ BỎ L BR SAU? '  [cuộn] '... có.'

Điểm chung của triết lý thường xuyên được minh họa ở đây là niềm tin khi đưa ra kết luận về khả năng tương đối của các sự kiện chỉ dựa trên ("hoàn toàn") trên dữ liệu được quan sát, mà không "gây ô nhiễm" quá trình ước tính với các khái niệm được hình thành trước về cách mọi thứ nên hoặc không nên. Khi trình bày ước tính xác suất, người thường xuyên không tính đến niềm tin trước về khả năng xảy ra sự kiện khi có những quan sát có sẵn để hỗ trợ tính toán khả năng theo kinh nghiệm của nó. Người thường xuyên nên tính đến thông tin cơ bản này khi quyết định ngưỡng cho hành động hoặc kết luận.

Như Dikran Marsupial đã viết trong một bình luận ngắn gọn dưới đây , "Điểm đáng giá mà phim hoạt hình (có lẽ vô tình) đưa ra là khoa học thực sự phức tạp hơn và chúng ta không thể chỉ áp dụng" nghi thức vô giá trị "mà không nghĩ về kiến ​​thức trước."

Một ví dụ khác, khi cố gắng xác định / tuyên bố chủ đề nào đang "thịnh hành" trên Facebook, những người thường xuyên có thể sẽ hoan nghênh cách tiếp cận đếm thuật toán thuần túy hơn mà Facebook đang chuyển sang , thay vì mô hình cũ mà nhân viên sẽ quản lý danh sách đó dựa trên một phần của họ quan điểm nền tảng riêng về chủ đề mà họ nghĩ "nên" là quan trọng nhất.


10
-1. Tôi yêu XKCD nhưng không có bất kỳ bình luận nào, tôi e rằng điều này sẽ chỉ gây hiểu lầm trong chủ đề này. Và người ta cần khá nhiều ý kiến ​​để giải thích chính xác những vấn đề liên quan đến truyện tranh này là gì. Nếu bạn cung cấp thảo luận thích hợp, tôi sẽ loại bỏ downvote.
amip nói phục hồi Monica

4
Không phải sự thật là cách tiếp cận thường xuyên không có các khái niệm được che giấu trước, chúng được mã hóa trong ngưỡng có ý nghĩa thống kê. ISTR có một trích dẫn hay từ Fisher về điều này tùy thuộc vào bản chất của thí nghiệm. Đây hoàn toàn là vấn đề với người thường xuyên trong phim hoạt hình, họ chỉ chưa đặt ra một giá trị phù hợp cho vì họ chưa tính đến "kiến thức trước" về vấn đề này (rằng mặt trời sẽ rất khó xảy ra) và điều chỉnh bài kiểm tra cho phù hợp. Sử dụng 95% mọi lúc là một phần của "nghi lễ null" bị chỉ trích nhiều. α
Dikran Marsupial

4
"Nghi thức null" là ứng dụng tồi của thống kê thường xuyên, nhưng nó không phải là vấn đề với chủ nghĩa thường xuyên.
Dikran Marsupial

2
@Dikran Nhận xét của bạn dường như (không chính xác) để đánh đồng "Người thường xuyên" với "người dùng NHST". Đó là loại nhầm lẫn mà tôi đã quan tâm.
whuber

3
@luchonacho FWIW có một cuộc thảo luận về phim hoạt hình XKCD tại đây stats.stackexchange.com/questions/43339/ nam Điểm đáng giá mà phim hoạt hình (có lẽ vô tình) đưa ra là khoa học thực sự phức tạp hơn và chúng ta không thể chỉ áp dụng "null nghi thức "mà không cần suy nghĩ về kiến ​​thức trước.
Dikran Marsupial

3

(Một nhận xét, chỉ liên quan hữu hình cho câu hỏi và trang web.)

Xác suất là về tình trạng khách quan của những thứ cá nhân . Mọi thứ không thể có ý định và họ nhận được trạng thái của họ từ vũ trụ. Với một điều, một sự kiện (cho nó là tình trạng) luôn luôn xảy ra: sự kiện đã hoàn thành, ngay cả khi nó chưa thực sự xảy ra - tương lai của một thứ, còn được gọi là "định mệnh" hoặc dự phòng.

Một lần nữa, với xác suất, các thực tế của sự kiện - đã chưa xảy ra hay không, không quan trọng - đã có [như trái ngược với ý nghĩa mà không bao giờ có]; và như vậy nó đã không cần thiết và không cần thiết. Thực tế nên được loại bỏ, và sự vô hiệu của nó là cái mà chúng ta gọi là "sự kiện có thể xảy ra". Bất kỳ sự thật nào về một thứ mang trong mình khía cạnh không thuyết phục nguyên thủy của nó, hoặc xác suất của sự thật (ngay cả thực tế đã xảy ra - chúng tôi nhận ra nó bằng cách không tin tưởng). Chúng tôi chắc chắn "mệt mỏi với mọi thứ" tiền tâm lý đến một mức độ. Do đó, vẫn chỉ để định lượng sự phủ định một phần của tính thực tế, nếu cần một số. Một cách để định lượng là đếm. Một cách khác là cân . Một người thường xuyên thực hiện hoặc tưởng tượng ra một loạt các thử nghiệm nằm trước mặt anh ta mà anh ta quay mặt lại để xem sự kiện có thực sự xảy ra hay không; anh ấy đếm. Một người Bayes xem xét một loạt các động cơ tâm lý kéo theo anh ta mà anh ta sàng lọc; ông cân chúng như mọi thứ. Cả hai người đàn ông đang bận rộn với trò chơi tâm trí / lý do. Về cơ bản, không có nhiều sự khác biệt giữa chúng.

Khả năng là về tiềm năng của tôi trong thế giới. Khả năng luôn là của tôi (cơ hội mưa là vấn đề của tôi khi chọn lấy ô hoặc bị ướt) và mối quan tâm không phải là một vật thể (thứ mà tôi đang xem là có thể hoặc có khả năng) mà là cả thế giới đối với tôi. Khả năng luôn là 50/50 và nó luôn có sức thuyết phục, bởi vì nó ngụ ý - hoặc là kêu gọi trước hoặc đòi hỏi sau - quyết định của tôi về cách ứng xử. Bản thân mọi thứ không có ý định và do đó khả năng. Chúng ta không nên nhầm lẫn khả năng của chúng ta về những điều này với chúng ta với xác suất riêng của họ về "chủ nghĩa quyết định ngẫu nhiên". Xác suất không bao giờ có thể là "chủ quan" theo nghĩa của con người.


Một độc giả quan sát có thể cảm thấy trong câu trả lời, một người đào đeo mặt nạ ở câu trả lời sáng sủa trong chủ đề này, nơi @amoeba nói rằng anh ta nghĩ "there are almost no frequentists of the [probability definition] kind (P-frequentists)". Nó có thể được đảo ngược: các xác định xác suất bayes không tồn tại như các lớp khác nhau. Bởi vì, như tôi đã thừa nhận, những người Bayes coi những cuộc trò chuyện thực tế giống như những người thường xuyên làm - như một loạt sự thật; chỉ những sự thật này không phải là thử nghiệm, những hồi ức sớm hơn về "sự thật" và "lập luận". Nhưng những dạng kiến thức như vậy là thực tế và chỉ có thể được tính hoặc cân. Xác suất mà nó dựng lên không được tổng hợp là chủ quan, nghĩa là dự đoán ("bayesian") trừ khi con người kỳ vọng(khả năng) vào hiện trường để can thiệp. Và @amoeba lo lắng cho phép nó vào khi tưởng tượng là "đồng xu sẽ biến mất và Mặt trời sẽ trở thành siêu tân tinh".


0

Ồ, tôi đã là người thường xuyên trong nhiều năm
và tôi đã dành toàn bộ thời gian để chơi dữ liệu bằng tai,
nhưng bây giờ tôi trở lại với Bayes trong cửa hàng tuyệt vời,
và tôi sẽ không bao giờ chơi trò thường xuyên nữa.

Vì nó không bao giờ, không bao giờ, không bao giờ, không còn nữa,
tôi sẽ chơi thường xuyên, không bao giờ, không còn nữa!

Tôi đã đi vào một phòng thí nghiệm nơi tôi từng tham khảo.
Họ đã cho tôi một số dữ liệu, nói rằng 'vì điều đó cho chúng tôi',
tôi đã nói 'Không thể nào, Jose' với một nụ cười,
giá trị P và hiển nhiên là không hòa giải!

Điệp khúc

Tôi nói rằng đó là ưu tiên hàng đầu của bạn mà chúng ta cần làm sáng tỏ,
Và đôi mắt của nhà nghiên cứu mở to thích thú,
Ông nói, 'Quan điểm trước đây của tôi cũng tốt như phần còn lại,
và chắc chắn yếu tố Bayes là thứ sẽ hoạt động tốt nhất!'

Điệp khúc

Tôi sẽ quay lại với các giáo viên của mình, thú nhận những gì tôi đã làm,
và yêu cầu họ tha thứ cho đứa con hoang đàng của họ,
nhưng khi họ đã tha thứ cho tôi, như thường lệ,
tôi sẽ không bao giờ chơi trò thường xuyên nữa!

Điệp khúc

Và không, không bao giờ, không bao giờ không còn nữa,
tôi sẽ chơi thường xuyên, không bao giờ, không còn nữa!

Nguồn: AE Raftery, trong The Bayesian Songbook, được chỉnh sửa bởi BP Carlin, tại http://www.biostat.umn.edu/ . Sung theo giai điệu dân gian truyền thống của 'The Wild Rover'. Trích dẫn trong Thống kê toán học Đại học mở M347, bài 9.


2
Điều này nên được đăng ở đây: stats.stackexchange.com/questions/1337/statistic-jokes
Tim

Đồng ý với @Tim và -1 vì tôi không thấy cách này bổ sung vào cuộc thảo luận hiện tại.
amip nói phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.