Khi nào (nếu có) là một cách tiếp cận thường xuyên tốt hơn đáng kể so với Bayes?


72

Bối cảnh : Tôi không được đào tạo chính thức về thống kê Bayes (mặc dù tôi rất thích tìm hiểu thêm), nhưng tôi biết đủ - tôi nghĩ - để có được ý chính tại sao nhiều người cảm thấy thích hợp với thống kê Thường xuyên hơn. Ngay cả những sinh viên đại học trong lớp thống kê giới thiệu (về khoa học xã hội) tôi đang giảng dạy cũng thấy cách tiếp cận Bayes hấp dẫn - "Tại sao chúng ta quan tâm đến việc tính xác suất của dữ liệu, đưa ra giá trị null? Tại sao chúng ta không thể định lượng xác suất của Giả thuyết khống? Hoặc giả thuyết thay thế? Và tôi cũng đã đọc những chủ đề như thế này , chứng thực cho lợi ích thực nghiệm của thống kê Bayes. Nhưng sau đó tôi đã xem qua trích dẫn này của Blasco (2001; nhấn mạnh thêm):

Nếu người gây giống động vật không quan tâm đến các vấn đề triết học liên quan đến cảm ứng, nhưng trong các công cụ để giải quyết vấn đề, cả hai trường phái suy luận Bayesian và thường xuyên đều được thiết lập tốt và không cần thiết phải giải thích tại sao một hoặc trường khác được ưa thích. Hiện tại cả hai đều không gặp khó khăn trong hoạt động, ngoại trừ một số trường hợp phức tạp ... Để chọn trường này hay trường khác phải liên quan đến việc có giải pháp nào trong trường này mà trường kia không đưa ra , để giải quyết vấn đề dễ dàng như thế nào và để các nhà khoa học cảm thấy thoải mái như thế nào với kết quả biểu hiện cụ thể.

Câu hỏi : Trích dẫn của Blasco dường như gợi ý rằng có thể có những lúc phương pháp Thường xuyên thực sự thích hợp hơn so với phương pháp Bayes. Và vì vậy tôi tò mò: khi nào thì một cách tiếp cận thường xuyên sẽ thích hợp hơn so với cách tiếp cận Bayes? Tôi quan tâm đến các câu trả lời giải quyết câu hỏi cả về mặt khái niệm (nghĩa là khi biết xác suất của dữ liệu dựa trên giả thuyết null đặc biệt hữu ích?) Và theo kinh nghiệm (nghĩa là trong những điều kiện nào phương pháp Thường xuyên vượt trội so với Bayesian?).

Cũng tốt hơn nếu các câu trả lời được truyền đạt càng dễ càng tốt - thật tuyệt khi đưa một số câu trả lời trở lại lớp học của tôi để chia sẻ với các học sinh của tôi (mặc dù tôi hiểu một số mức độ kỹ thuật là bắt buộc).

Cuối cùng, mặc dù là người thường xuyên sử dụng số liệu thống kê Thường xuyên, tôi thực sự cởi mở với khả năng Bayesian chỉ thắng trên bảng.


10
Khi bạn đối phó với xác suất khách quan, tức là các quá trình ngẫu nhiên tự nhiên. Chẳng hạn, sự phân rã phóng xạ không liên quan gì đến niềm tin chủ quan của bạn hoặc thông tin không xác định, hoặc khá nhiều thứ khác. Nó chỉ đi theo tốc độ riêng của nó, và các nguyên tử thực sự chia tay ngẫu nhiên .
Aksakal

6
Xem câu hỏi gần đây không may cuối cùng đã đóng cửa vì quá rộng (tôi đã bỏ phiếu để mở lại nhưng chưa bao giờ): stats.stackexchange.com/questions/192572 . Bạn đang hỏi gần như chính xác điều tương tự. Kiểm tra câu trả lời ở đó.
amip nói rằng Phục hồi lại

5
@Aksakal: Tôi rất thích có cuộc thảo luận này nhưng nó không có chủ đề và chúng tôi sẽ được thông báo nên tôi im lặng (và tính toán).
amip nói Phục hồi lại

12
"Người Bayes giải quyết câu hỏi mà mọi người quan tâm bằng cách sử dụng các giả định không ai tin, trong khi những người thường xuyên sử dụng logic hoàn hảo để giải quyết vấn đề không quan tâm đến bất cứ ai" - Louis Lyons
Ruggero Turra 4/2/2016

4
@jsakaluk, chú ý cách các thành trì của Bayes là những khu vực không có đủ dữ liệu hoặc khi các quá trình không ổn định, ví dụ như khoa học xã hội, khoa học psudo, khoa học đời sống, v.v. Không cần Bayesian trong cơ học lượng tử hay hầu hết vật lý. Cấp, bạn cũng có thể là Bayes ở đó, chỉ là suy luận của bạn sẽ không khác với người thường xuyên
Aksakal

Câu trả lời:


54

Dưới đây là năm lý do tại sao các phương pháp thường xuyên có thể được ưa thích:

  • Nhanh hơn. Cho rằng các số liệu thống kê của Bayes thường đưa ra các câu trả lời gần như giống hệt nhau cho các câu trả lời thường xuyên (và khi họ không biết, Bayesian luôn luôn đi đúng hướng), thực tế là các số liệu thống kê thường xuyên có thể thu được thường nhanh hơn vài bậc một lập luận mạnh mẽ. Tương tự, các phương thức thường xuyên không cần nhiều bộ nhớ để lưu trữ kết quả. Mặc dù những điều này có vẻ hơi tầm thường, đặc biệt là với các bộ dữ liệu nhỏ hơn, thực tế là Bayesian và Người thường xuyên đồng ý về kết quả (đặc biệt là nếu bạn có nhiều dữ liệu thông tin) có nghĩa là nếu bạn quan tâm, bạn có thể bắt đầu quan tâm đến việc ít quan trọng hơn nhiều thứ. Và tất nhiên, nếu bạn sống trong thế giới dữ liệu lớn, những thứ này không hề nhỏ.

  • Thống kê không tham số. Tôi nhận ra rằng số liệu thống kê Bayes có số liệu thống kê không tham số, nhưng tôi cho rằng phía thường xuyên của lĩnh vực này có một số công cụ thực tế không thể phủ nhận, chẳng hạn như Hàm phân phối theo kinh nghiệm. Không có phương pháp nào trên thế giới sẽ thay thế EDF, cũng như các đường cong Kaplan Meier, v.v. (mặc dù rõ ràng điều đó không có nghĩa là các phương pháp đó là kết thúc của một phân tích).

  • Chẩn đoán ít hơn. Các phương thức MCMC, phương pháp phổ biến nhất để phù hợp với các mô hình Bayes, thường đòi hỏi nhiều công việc của người dùng hơn là bộ phận đối tác thường xuyên của họ. Thông thường, chẩn đoán cho ước tính MLE đơn giản đến mức mọi thực thi thuật toán tốt sẽ tự động thực hiện (mặc dù điều đó không có nghĩa là mọi triển khai có sẵn đều tốt ...). Do đó, chẩn đoán thuật toán thường xuyên thường là "đảm bảo không có văn bản màu đỏ khi lắp mô hình". Cho rằng tất cả các nhà thống kê có băng thông hạn chế, điều này giải phóng nhiều thời gian hơn để đặt câu hỏi như "dữ liệu của tôi có thực sự xấp xỉ bình thường không?" hoặc "những mối nguy hiểm này có thực sự tỷ lệ thuận không?", v.v.

  • Suy luận hợp lệ theo mô hình sai chính tả. Chúng ta đều đã nghe nói rằng "Tất cả các mô hình đều sai nhưng một số là hữu ích", nhưng các lĩnh vực nghiên cứu khác nhau thực hiện điều này ít nhiều nghiêm trọng. Tài liệu Thường xuyên có đầy đủ các phương pháp để khắc phục suy luận khi mô hình bị sai chính tả: công cụ ước tính bootstrap, xác thực chéo, công cụ ước tính sandwich (liên kết cũng thảo luận về suy luận MLE chung theo sai chính tả mô hình), phương trình ước lượng tổng quát (GEE), phương pháp ước lượng tổng quát, vv Theo như tôi biết, có rất ít trong tài liệu Bayes về suy luận theo lỗi chính tả mô hình (mặc dù có rất nhiều cuộc thảo luận về kiểm tra mô hình, tức là kiểm tra dự báo sau). Tôi không nghĩ điều này chỉ là tình cờ: đánh giá cách một người ước tính hành xử qua các thử nghiệm lặp đi lặp lại không yêu cầu người ước tính phải dựa trên mô hình "đúng", nhưng sử dụng định lý Bayes thì có!

  • Tự do từ trước (đây có lẽ là lý do phổ biến nhất cho lý do tại sao mọi người không sử dụng phương pháp Bayes cho mọi thứ). Sức mạnh của quan điểm Bayes thường được quảng cáo là việc sử dụng các linh mục. Tuy nhiên, trong tất cả các lĩnh vực ứng dụng mà tôi đã làm việc, ý tưởng về một thông tin trước khi phân tích không được xem xét. Đọc tài liệu về cách khơi gợi các linh mục từ các chuyên gia phi thống kê đưa ra lý do chính đáng cho việc này; Tôi đã đọc những bài báo có nội dung như (người rơm độc ác như tự diễn giải cho tôi) "Hãy hỏi nhà nghiên cứu đã thuê bạn vì họ gặp khó khăn trong việc hiểu số liệu thống kê để đưa ra một phạm vi mà họ chắc chắn 90% kích thước hiệu ứng mà họ gặp khó khăn khi tưởng tượng ở trong. Phạm vi này thường sẽ quá hẹp, vì vậy hãy tùy tiện cố gắng khiến họ mở rộng nó ra một chút. Hỏi họ xem niềm tin của họ có giống như phân phối gamma không. Bạn có thể sẽ phải vẽ một bản phân phối gamma cho chúng và chỉ ra làm thế nào nó có thể có đuôi nặng nếu tham số hình dạng nhỏ. Điều này cũng sẽ liên quan đến việc giải thích PDF là gì đối với họ. "(Lưu ý: Tôi không nghĩ ngay cả các nhà thống kê cũng thực sự có thể nói chính xácmột tiên nghiệm cho dù họ chắc chắn 90% hay 95% cho dù kích thước hiệu ứng nằm trong một phạm vi và sự khác biệt này có thể có ảnh hưởng đáng kể đến phân tích!). Sự thật mà nói, tôi khá là không tử tế và có thể có những tình huống khơi gợi một ưu tiên có thể đơn giản hơn một chút. Nhưng bạn có thể thấy đây là một con giun như thế nào. Ngay cả khi bạn chuyển sang các linh mục không thông tin, nó vẫn có thể là một vấn đề; Khi chuyển đổi các tham số, những gì dễ bị nhầm lẫn với các linh mục không có thông tin đột nhiên có thể được xem là rất nhiều thông tin! Một ví dụ khác về điều này là tôi đã nói chuyện với một số nhà nghiên cứu, những người kiên quyết khôngmuốn nghe cách giải thích dữ liệu của một chuyên gia khác bởi vì theo kinh nghiệm, các chuyên gia khác có xu hướng quá tự tin. Họ chỉ muốn biết những gì có thể được suy ra từ dữ liệu của chuyên gia khác và sau đó đi đến kết luận của riêng họ. Tôi không thể nhớ lại nơi tôi đã nghe nó, nhưng ở đâu đó tôi đã đọc cụm từ "nếu bạn là người Bayes, bạn muốn mọi người trở thành người thường xuyên". Tôi giải thích điều đó có nghĩa là về mặt lý thuyết, nếu bạn là người Bayes và ai đó mô tả kết quả phân tích của họ, trước tiên bạn nên cố gắng loại bỏ ảnh hưởng của họ trước và sau đó tìm hiểu xem tác động sẽ là gì nếu bạn sử dụng chính mình. Bài tập nhỏ này sẽ được đơn giản hóa nếu họ đã cho bạn một khoảng tin cậy chứ không phải là một khoảng tin cậy!

Tất nhiên, nếu bạn từ bỏ các linh mục thông tin, vẫn có tiện ích trong các phân tích Bayes. Cá nhân, đây là nơi tôi tin rằng tiện ích cao nhất của họ nằm; có một số vấn đề cực kỳ khó nhận được bất kỳ câu trả lời nào khi sử dụng các phương pháp MLE nhưng có thể được giải quyết khá dễ dàng với MCMC. Nhưng quan điểm của tôi về việc đây là tiện ích cao nhất của Bayes là do các linh mục mạnh về phía tôi, vì vậy hãy dùng nó với một hạt muối.


1
(+1) Câu trả lời hay, mặc dù tôi cho rằng bạn không cần nhiều bộ nhớ để lưu trữ kết quả?
jsakaluk

1
Về mặt tự do khỏi các linh mục: bạn có nói rằng bạn càng ít phải suy nghĩ và hiểu vấn đề của mình thì càng tốt? Tôi biết một số nhà cung cấp phần mềm muốn nói chuyện với bạn, vì vậy bạn có thể chỉ vào một lần nhấp - hoặc tốt hơn là một lần nhấp - và có câu trả lời cho bất kỳ vấn đề nào bạn có thể tưởng tượng! Heck, bạn thậm chí không cần một vấn đề, chỉ cần đưa dữ liệu của bạn vào trang web của họ và họ sẽ tìm thấy tất cả các vấn đề có thể và giải quyết chúng, thật tuyệt! (Xin lỗi, không thể cưỡng lại việc trả lời bằng một bình luận giống như người rơm tàn nhẫn.)
Wayne

1
@Wayne: Tôi biết bạn đang nói đùa, nhưng điều đó đúng 100%. Thống kê là một công cụ để trả lời các vấn đề trong thế giới thực. Tôi thực sự muốn nhấn mạnh rằng nó là một công cụ, không phải là một sản phẩm cuối cùng. Bất kể bên nào của cuộc tranh luận băm xuyên suốt "Thường xuyên và Bayesian" (tôi ngồi trên "bất cứ điều gì cho tôi câu trả lời tốt nhất cho câu hỏi của tôi", có nghĩa là tôi thích cả hai cho các vấn đề khác nhau), không có gì phải bàn cãi rằng một tiện ích rất thực cho bất kỳ công cụ.
Vách đá AB

Tất nhiên, nếu công cụ của bạn thường xuyên sản xuất một sản phẩm khủng thì đó là một vấn đề. Và nếu tôi bị thuyết phục rằng một phương pháp thường xuyên đang làm điều này, nhưng một phương pháp Bayes thì không, tôi sẽ nhanh chóng tán thành phương pháp Bayes.
Vách đá AB

1
@CliffAB: Dễ sử dụng là quan trọng, và như bạn nói nếu kết quả có chất lượng tương đương, tại sao chọn khó sử dụng hơn? Đồng thời, suy nghĩ về, làm cho rõ ràng và hiểu các linh mục (không phải Bayes, tôi có nghĩa đen là các linh mục mà mọi nhà khoa học, mọi lĩnh vực và mọi nghiên cứu đều có) rất quan trọng đối với khoa học tốt. Số liệu thống kê Bayes là rõ ràng và buộc bạn phải suy nghĩ và hiểu một số vấn đề này. Trong phạm vi mà điều này không chỉ đơn thuần là sự bất tiện về mặt phạm vi, nó được cho là tốt, và do đó, điều ngược lại cũng không phải là tốt.
Wayne

23

Một vài lợi thế cụ thể của thống kê thường xuyên:

  • Thường có các giải pháp dạng đóng cho các vấn đề thường gặp trong khi bạn sẽ cần một liên hợp trước khi có một giải pháp dạng đóng trong tương tự Bayes. Điều này hữu ích cho một số lý do - một trong số đó là thời gian tính toán.
  • Một lý do mà cuối cùng sẽ biến mất: giáo dân được dạy những người thường xuyên thống kê. Nếu bạn muốn được nhiều người hiểu, bạn cần nói thường xuyên.
  • Cách tiếp cận "Vô tội cho đến khi được chứng minh có tội" Null Giả thuyết Kiểm tra Ý nghĩa Giả thuyết (NHST) rất hữu ích khi mục tiêu là chứng minh ai đó sai (Tôi sẽ thừa nhận quyền của bạn và hiển thị dữ liệu áp đảo cho thấy bạn sai). Vâng, có NHST tương tự trong Bayesian nhưng tôi thấy các phiên bản thường xuyên hơn và dễ hiểu hơn nhiều.
  • Không có thứ gọi là thực sự không thông minh trước đó khiến một số người khó chịu.

1
(+1) Cảm ơn - bạn có thể làm rõ điểm đầu tiên một chút không? Là một người không rành về Bayesian, quan điểm mà bạn đang đưa ra về sự cần thiết của "liên hợp trước" (?) Đã mất đối với tôi một chút ...
jsakaluk

5
P(H0|Data)P(Data|H0)α

@ZacharyBlumenfeld Cảm ơn bạn đã chỉ ra rằng, tôi đã nghĩ đến Bayesian. Tôi sẽ sửa nó ngay.
TrynnaDoStat

1
αβα+i=1nxiβ+ni=1nxi) mà không phải thực hiện bất kỳ mô phỏng, lấy mẫu hoặc tính toán mạnh mẽ.
TrynnaDoStat

16

Lý do quan trọng nhất để sử dụng các phương pháp Thường xuyên, điều đáng ngạc nhiên chưa được đề cập, là kiểm soát lỗi. Rất thường xuyên, nghiên cứu dẫn đến những diễn giải phân đôi (tôi có nên thực hiện một nghiên cứu xây dựng về điều này hay không? Có nên thực hiện can thiệp hay không?). Phương pháp tiếp cận thường xuyên cho phép bạn kiểm soát chặt chẽ tỷ lệ lỗi Loại 1 của mình. Các cách tiếp cận Bayes không (mặc dù một số kế thừa phổ quát ràng buộc từ các cách tiếp cận khả năng, nhưng ngay cả khi đó, tỷ lệ lỗi có thể khá cao trong các mẫu nhỏ và với ngưỡng bằng chứng tương đối thấp (ví dụ: BF> 3). Các yếu tố của Bayes (xem ví dụ: http://epage.ssrn.com/sol3/ con.cfm? Abauge_id = 604513) nhưng đó vẫn là một cách tiếp cận thường xuyên. Tôi nghĩ rất thường xuyên, các nhà nghiên cứu quan tâm đến việc kiểm soát lỗi hơn là định lượng bằng chứng mỗi lần (liên quan đến một số giả thuyết cụ thể) và tôi nghĩ ít nhất, mọi người đều quan tâm đến việc kiểm soát lỗi ở một mức độ nào đó, và do đó nên sử dụng hai cách tiếp cận bổ sung.


Điểm tốt. Tôi cũng đang nghĩ đến các phương pháp tuần tự theo nhóm và các hình thức thử nghiệm đa dạng khác, ở đó dường như (theo quan điểm hạn hẹp của tôi, có thể đã bỏ qua các phần quan trọng của tài liệu) đã không được quan tâm ở phía Bayes (vì vậy xa) về việc nhận được một số loại kiểm soát lỗi. Tất nhiên, trong nhiều trường hợp, các phương pháp Bayes - đặc biệt là với các linh mục hơi hoài nghi hoặc một số loại co rút thông qua một mô hình phân cấp làm các lỗi kiểm soát phần nào ở một mức độ không thể chấp nhận được, nhưng nhiều suy nghĩ đã được thực hiện ở phía thường xuyên ở đó.
Bjorn

3
(+1) Tôi thực sự thích điểm này ... vì đó là lý do tôi thường xuyên sử dụng triết lý .... khi chúng tôi thống kê để giúp suy luận, thì chúng tôi muốn suy luận của mình chính xác hơn (nghĩa là ít lỗi hơn) hơn là đoán mù. Trong thực tế, nếu tôi quan tâm tất cả về những suy luận của tôi là thực sự đúng hay sai (theo nghĩa được xác nhận bởi các nghiên cứu tiếp theo), thì tỷ lệ lỗi là rất quan trọng. Tôi chỉ không thể cảm thấy thoải mái với xác suất Bayes (tuy nhiên, bản thân các phương pháp này rất hữu ích vì "công cụ ước lượng chính quy" hợp lý cho một số lượng khi kích thước mẫu nhỏ ... nghĩ Agresit-Coull)

Điều này nghe có vẻ giống như lý thuyết quyết định hơn so với vịnh / so sánh thường xuyên. Ngoài ra, với cách tiếp cận bayes, bạn không cần phải lo lắng về việc dừng quy tắc .... Tôi cũng hiểu rằng các vịnh có thể đạt được "sự cân bằng" tốt hơn giữa tỷ lệ lỗi loại 1 và loại 2 ....
xác suất

8

Tôi nghĩ một trong những câu hỏi lớn nhất, với tư cách là một nhà thống kê, bạn phải tự hỏi mình là liệu bạn có tin hay không muốn tuân thủ nguyên tắc khả năng. Nếu bạn không tin vào nguyên tắc khả năng thì tôi nghĩ rằng mô hình thống kê thường xuyên có thể cực kỳ mạnh mẽ, tuy nhiên, nếu bạn tin vào nguyên tắc khả năng đó, thì (tôi tin) bạn chắc chắn phải tán thành mô hình Bayes trong hoặc để không vi phạm nó.


Trong trường hợp bạn không quen thuộc với nó, nguyên tắc khả năng cho chúng ta biết là gì:

θx

(θ;x)=p(x|θ)
x

xy(θ;x)(θ;y)C(x,y)

(θ;x)=C(x,y)(θ;y)for all θ,

xy

C(x,y)(x,y)C(x,y)θ

C(x,y)=1θθ


Bây giờ, một trong những điểm thu hút của thống kê Bayes là, theo các linh mục đúng đắn, mô hình Bayes không bao giờ vi phạm nguyên tắc khả năng. Tuy nhiên, có những kịch bản rất đơn giản trong đó mô hình thường xuyên sẽ vi phạm nguyên tắc khả năng.

Dưới đây là một ví dụ rất đơn giản dựa trên thử nghiệm giả thuyết. Hãy xem xét những điều sau đây:

Hãy xem xét một thử nghiệm trong đó 12 thử nghiệm Bernoulli đã được thực hiện và 3 thành công đã được quan sát. Tùy thuộc vào quy tắc dừng, chúng tôi có thể mô tả dữ liệu như sau:

  • X|θBin(n=12,θ)x=3
  • Y|θNegBin(k=3,θ)y=12

Và do đó, chúng tôi sẽ có được các hàm khả năng sau: ngụ ý rằng và do đó, theo Nguyên tắc Khả năng, chúng ta sẽ có được những suy luận tương tự về từ khả năng.

1(θ;x=3)=(123)θ3(1θ)92(θ;y=12)=(112)θ3(1θ)9
1(θ;x)=C(x,y)2(θ,y)
θ

Bây giờ, hãy tưởng tượng thử nghiệm các giả thuyết sau từ mô hình thường xuyên

Ho:θ12versusHa:θ<12

Đối với mô hình Binomial, chúng ta có các phần sau:

p-value=P(X3|θ=12)=(120)(12)12+(121)(12)12+(122)(12)12+(123)(12)12=0.0723

Lưu ý rằng nhưng các điều khoản khác làm không thỏa mãn nguyên tắc khả năng.(123)(12)12=1(12;x=3)

Đối với mô hình nhị thức âm, chúng ta có các phần sau:

p-value=P(Y12|θ12)=(112)(12)12+(122)(12)12+(132)(12)12+...=0.0375

Từ các tính toán giá trị p ở trên, chúng ta thấy rằng trong mô hình Binomial, chúng ta sẽ không từ chối nhưng sử dụng mô hình Binomial âm, chúng ta sẽ từ chối . Do đó, mặc dù có giá trị p và các quyết định dựa trên các giá trị p này, không trùng khớp. Đối số giá trị p này thường được sử dụng bởi người Bayes chống lại việc sử dụng giá trị p thường xuyên.HoHo1(θ;x)2(θ;y)

Bây giờ hãy xem xét lại việc kiểm tra các giả thuyết sau, nhưng từ mô hình Bayes

Ho:θ12versusHa:θ<12

Đối với mô hình Binomial, chúng ta có các phần sau:

P(θ12|x)=1/21π(θ|x)dx=1/21θ3(1θ)9π(θ)dθ/01θ3(1θ)9π(θ)dθ

Tương tự, đối với mô hình nhị thức âm, chúng ta có các phần sau:

P(θ12|y)=1/21π(θ|x)dx=1/21θ3(1θ)9π(θ)dθ/01θ3(1θ)9π(θ)dθ

Bây giờ sử dụng quy tắc quyết định Bayes, chọn nếu (hoặc một số ngưỡng khác) và lặp lại tương tự cho .Ho yP(θ12|x)>12y

Tuy nhiên, và vì vậy chúng tôi đến cùng kết luận và do đó phương pháp này thỏa mãn Nguyên tắc khả năng.P(θ12|x)=P(θ12|y)


Và vì vậy, để kết luận những lời huyên thuyên của tôi, nếu bạn không quan tâm đến nguyên tắc khả năng thì việc thường xuyên là tuyệt vời! (Nếu bạn không thể nói, tôi là người Bayes :))


1
Tôi đánh giá cao câu trả lời rõ ràng (và có thể tiêu tốn thời gian), nhưng tôi cảm thấy câu trả lời này hơi khác so với "câu trả lời ... được truyền tải càng dễ càng tốt ..." câu hỏi.
jsakaluk

1
@jsakaluk Tôi đoán những gì tôi đang nhắm đến, và muốn chắc chắn sao lưu lập luận, là nếu bạn sẵn sàng bỏ qua những điều nhất định mà nhiều nhà thống kê áp dụng đã đưa ra, tất cả, theo nguyên tắc khả năng, sau đó sử dụng mô hình thường xuyên có thể là một sự thay thế đơn giản hơn nhiều so với mô hình Bayes. Tuy nhiên, nếu bạn không thể thì rất có thể bạn sẽ phải tìm giải pháp thay thế.
RustyStatistician 6/2/2016

4
@RustyStatistician Nguyên tắc khả năng là một nguyên lý trung tâm cho những người có khả năng. Likelihoodists không Bayesian ở tất cả . Tôi đã đăng các liên kết trong câu trả lời của tôi. Yêu cầu của bạn "nếu bạn tin vào nguyên tắc khả năng, thì (tôi tin) bạn chắc chắn phải tán thành mô hình Bayes" là sai.
stan

@Stan Tôi đồng ý với bạn rằng có những người có khả năng tin vào nguyên tắc khả năng chắc chắn. Nhưng tôi sẽ rất khó tin rằng nếu bạn hỏi bất kỳ người Bayes nào nếu họ tin vào việc tuân thủ nguyên tắc khả năng họ sẽ nói không họ không (đó chỉ là ý kiến ​​của tôi bạn không cần phải đồng ý).
RustyStatistician 7/2/2016

2
Vai trò của nguyên tắc khả năng (LP), nguyên tắc điều kiện (CP) và nguyên tắc đầy đủ (SP) trong suy luận là không đơn giản..đây là vì những nguyên tắc này liên quan đến bằng chứng (như được trình bày bởi dữ liệu), trong khi suy luận liên quan đến việc vượt ra ngoài bằng chứng . Điều này luôn có rủi ro, nhưng cần thiết để đạt được tiến bộ. Xem Định lý Birnbaums (thảo luận tại đây ... Tôi không nhất thiết phải đồng ý với phần còn lại của bài báo): arxiv.org/abs/1302.5468

6

Bạn và tôi đều là nhà khoa học, và là nhà khoa học, chủ yếu quan tâm đến câu hỏi về bằng chứng. Vì lý do đó, tôi nghĩ cách tiếp cận Bayes, khi khả thi, là thích hợp hơn.

Phương pháp tiếp cận Bayes trả lời câu hỏi của chúng tôi: sức mạnh của bằng chứng cho một giả thuyết so với giả thuyết khác là gì? Mặt khác, các phương pháp tiếp cận thường xuyên thì không: Họ chỉ báo cáo liệu dữ liệu có kỳ lạ khi đưa ra một giả thuyết hay không.

Điều đó nói rằng, Andrew Gelman, Bayesian đáng chú ý, dường như tán thành việc sử dụng các giá trị p (hoặc kiểm tra đồ họa giống như giá trị p) để kiểm tra các lỗi trong đặc tả mô hình. Bạn có thể thấy một ám chỉ đến phương pháp này trong bài viết trên blog này .

Cách tiếp cận của anh ấy, theo tôi hiểu, là một quá trình gồm hai bước: Đầu tiên, anh ấy hỏi câu hỏi Bayes về bằng chứng cho một mô hình so với mô hình kia là gì. Thứ hai, ông đặt câu hỏi Thường xuyên về việc liệu mô hình ưa thích có thực sự xem xét tất cả các dữ liệu hợp lý hay không. Có vẻ như một cách tiếp cận lai hợp lý với tôi.


1
Mặc dù liên kết đến blog Gelman vẫn còn hiệu lực, nhưng nó sẽ không "hôm nay" sau nửa đêm. Chỉnh sửa cho phù hợp.
Nick Cox

8
Tôi hoàn toàn không đồng ý với ký hiệu rằng các phương pháp tiếp cận thường xuyên không đo lường được bằng chứng và rằng điều này chỉ có trong thế giới Bayes. Bạn đang bỏ qua nguồn gốc của thử nghiệm giả thuyết, chẳng hạn như thử nghiệm LR, đo lường bằng chứng của một giả thuyết chống lại bằng chứng cho cái kia.
Vách đá AB

1
(+1) đến @CliffAB - cho mọi người nghĩ về thống kê "thường xuyên", xin vui lòng tìm kiếm "tỷ lệ khả năng", "Định lý của Birnbaum", và có lẽ đọc một chút về Royall .... đừng nhảy vào rơm- những tranh luận của con người liên quan đến NHST - nhân tiện, dường như không làm giảm tiến bộ khoa học mặc dù lỗ hổng được cho là thảm khốc của nó .... đó là bởi vì các nhà thống kê không phải là chương trình MINITAB dựa trên carbon ... họ nghĩ rằng thực sự là một nghề, giống như y học, hoặc kinh tế học hoặc cơ khí tự động, ... bạn không thể chỉ đọc một cuốn sách, thử một công thức và mong đợi sự thật sẽ rơi vào lòng bạn].

2
@Bey: Cá nhân tôi tin rằng giá trị p đã làm giảm bớt quá trình khoa học (trong đó các nhà sinh học buộc phải trở thành nhà thống kê bán thời gian để xuất bản các bài báo, giảm thời gian họ trở thành nhà sinh vật học), nhưng tôi không đừng nghĩ rằng các lựa chọn thay thế cho giá trị p theo bất kỳ cách nào làm giảm vấn đề này! Tôi cảm thấy rằng vấn đề của giá trị p không phải là nền tảng lý thuyết của họ, mà là sự dễ sử dụng của những người không thống kê. Xác suất hậu thế, (ví dụ) Tôi nghĩ làm cho vấn đề cụ thể đó trở nên tồi tệ hơn là tốt hơn.
Vách đá AB

2
@CliffAB không thể đồng ý nhiều hơn ... tôi đã không nghĩ về nó từ phía đó..nhưng đó chỉ là bản chất của xuất bản mà tôi đoán ... trừ khi các bộ phận nghiên cứu có thể đủ khả năng để có các nhà thống kê nhân viên. Bất kỳ công cụ thống kê nào cũng có thể bị sử dụng sai bởi một người không am hiểu về việc sử dụng ... công cụ thống kê đáng tiếc này có vẻ rất dễ sử dụng ...

6

Cá nhân tôi đang gặp khó khăn khi nghĩ về một tình huống mà câu trả lời thường xuyên sẽ được ưu tiên hơn một câu hỏi Bayes. Suy nghĩ của tôi được trình bày chi tiết ở đây và trong các bài viết trên blog khác trên fharrell.com về các vấn đề với giá trị p và kiểm tra giả thuyết null. Những người thường xuyên có xu hướng bỏ qua một vài vấn đề cơ bản. Đây chỉ là một mẫu:

  • Bên ngoài mô hình tuyến tính Gaussian có phương sai không đổi và một vài trường hợp khác, các giá trị p được tính toán có độ chính xác không xác định cho tập dữ liệu và mô hình của bạn
  • Khi thử nghiệm là tuần tự hoặc thích ứng, thường thì giá trị p thậm chí không thể được tính toán và người ta chỉ có thể đặt mức tổng thể để đạt đượcα
  • Những người thường xuyên có vẻ rất vui khi không để lỗi loại I bên dưới, giả sử, 0,05 cho dù bây giờ kích thước mẫu tăng lên
  • Không có toa thuốc thường xuyên cho cách hiệu chỉnh bội số được hình thành, dẫn đến một phương pháp đặc biệt

Về điểm đầu tiên, một mô hình thường được sử dụng là mô hình logistic nhị phân. Khả năng đăng nhập của nó là rất không bậc hai, và phần lớn giới hạn độ tin cậy và giá trị p được tính cho các mô hình như vậy là không chính xác. Trái ngược với mô hình logistic Bayes, cung cấp suy luận chính xác.

Những người khác đã đề cập đến kiểm soát lỗi là một lý do cho việc sử dụng suy luận thường xuyên. Tôi không nghĩ rằng điều này là hợp lý, bởi vì lỗi mà họ đề cập là lỗi dài hạn, hình dung một quá trình trong đó hàng ngàn thử nghiệm thống kê được chạy. Một thẩm phán cho biết "xác suất kết án sai trong thời gian dài tại phòng xử án của tôi chỉ là 0,03" nên bị từ chối. Cô bị buộc tội có xác suất cao nhất để đưa ra quyết định chính xác cho người bị kiện hiện tại . Mặt khác, trừ đi xác suất hậu quả của hiệu ứng là xác suất của hiệu ứng 0 hoặc ngược và là xác suất lỗi chúng ta thực sự cần.


2
"Không có toa thuốc thường xuyên cho cách sửa chữa đa bội được hình thành, dẫn đến một phương pháp đặc biệt." Mặt khác, tôi chưa bao giờ thấy một Bayes nào thực hiện chỉnh sửa bội số cả. Andrew Gelman thậm chí còn tự hào tuyên bố rằng ông không bao giờ sử dụng chúng. Chẳng hạn, tôi đã thấy mọi người báo cáo các khoảng tin cậy cận biên 95% cho , nhưng độ tin cậy chung của các khoảng đó không phải là 95%. Cũng không rõ ràng làm thế nào tốt nhất để giải quyết điều này. Bạn có lời khuyên hay ví dụ nào không? kθ1,,θkk
Civilstat

5

Nhiều người dường như không nhận thức được một trường phái triết học thứ ba: chủ nghĩa khả năng. Cuốn sách của AWF Edwards, Likabilities, có lẽ là nơi tốt nhất để đọc về nó. Đây là một bài viết ngắn, ông đã viết.
Chủ nghĩa khả năng tránh những giá trị p, như chủ nghĩa Bayes, nhưng cũng tránh những người Bayes thường hay nghi ngờ trước đây. Có một điều trị giới thiệu ở đây là tốt.


5
Có cách tiếp cận xác suất thuật toán của Vovk, được phát triển từ ý tưởng của Kolmogorov.
Aksakal

2
"Nhiều người dường như không biết về một trường phái triết học thứ ba: chủ nghĩa khả năng" Tôi không nghĩ rằng câu này là đúng trong năm 2016 ...
Tim

4
@Tim, mặc dù tất cả mọi người tôi biết đều quen thuộc với chủ nghĩa thường xuyên và chủ nghĩa Bayes, tôi chưa bao giờ gặp bất cứ ai đã nghe về khả năng. Người hỏi ban đầu có vẻ giống như các đồng nghiệp của tôi, những người được đào tạo về chủ nghĩa thường xuyên và ngày càng quan tâm đến chủ nghĩa Bayes. Có lẽ hầu hết những người đọc câu trả lời của tôi ở trên đều nghĩ rằng tôi đang đề cập đến ước tính khả năng tối đa hoặc các giả thuyết thử nghiệm sử dụng tỷ lệ khả năng. Không! Tôi đề nghị Yudi Pawitanbài giảng này
stan

7
Không có cách tiếp cận nào là tôn giáo, vì vậy không có gì đáng tin, chúng chỉ hữu ích cho một số loại vấn đề nhất định và một số cách tiếp cận phù hợp hơn cho một số vấn đề và khác cho các vấn đề khác :)
Tim

1
(+1) để đề cập đến khả năng trường học và cho nhận xét liên quan đến Pawitan. Cuốn sách "Trong tất cả khả năng" của Pawitan được mở rộng và tăng cường đáng kể nhờ thực hành thống kê ... Tôi cũng chỉ biết về Bayes vs Thường xuyên. Ông đã giải quyết rất nhiều khía cạnh triết học và phương pháp luận của Bayes, chủ nghĩa thường xuyên "cổ điển", và, tất nhiên, bao trùm cả trường phái khả năng thuần túy. Chỉ là một cuốn sách tuyệt vời để trở thành một người sử dụng số liệu thống kê tinh vi hơn ... bất kể khuynh hướng triết học của bạn.

4

Một trong những nhược điểm lớn nhất của cách tiếp cận thường xuyên đối với việc xây dựng mô hình luôn là, như TrynnaDoStats lưu ý ở điểm đầu tiên, những thách thức liên quan đến việc đảo ngược các giải pháp dạng đóng lớn. Đảo ngược ma trận dạng đóng yêu cầu toàn bộ ma trận nằm trong RAM, một hạn chế đáng kể trên các nền tảng CPU đơn với số lượng lớn dữ liệu hoặc các tính năng phân loại ồ ạt. Các phương pháp Bayes đã có thể giải quyết thách thức này bằng cách mô phỏng các lần rút ngẫu nhiên từ một lần xác định trước. Đây luôn là một trong những điểm bán hàng lớn nhất của các giải pháp Bayes, mặc dù câu trả lời chỉ thu được với chi phí đáng kể trong CPU.

Andrew Ainslie và Ken Train, trong một bài báo từ khoảng 10 năm trước, tôi đã mất tham chiếu, so sánh hỗn hợp hữu hạn (là dạng thường xuyên hoặc dạng đóng) với các cách tiếp cận Bayesian để xây dựng mô hình và thấy rằng qua một loạt các dạng chức năng và số liệu hiệu suất, hai phương pháp mang lại kết quả cơ bản tương đương. Trong đó các giải pháp Bayes có lợi thế hoặc sở hữu tính linh hoạt cao hơn là trong những trường hợp thông tin vừa thưa thớt vừa rất cao.

Tuy nhiên, bài báo đó đã được viết trước khi các thuật toán "phân chia và chinh phục" được phát triển nhằm tận dụng các nền tảng song song ồ ạt, ví dụ, xem bài viết của Chen và Minge để biết thêm về http://dimacs.rutgers.edu/TechnicalReports/TechReports/2012/2012- 01.pdf

Sự ra đời của các phương pháp D & C có nghĩa là, ngay cả đối với các vấn đề hai chiều nhất, thưa thớt nhất, cao nhất, các phương pháp Bayes không còn có lợi thế hơn các phương pháp thường xuyên. Hai phương pháp là ngang nhau.

Sự phát triển tương đối gần đây này đáng chú ý trong bất kỳ cuộc tranh luận nào về những lợi thế hoặc hạn chế thực tế của một trong hai phương pháp.


Tôi nghĩ rằng đây là một bổ sung tốt đẹp cho cuộc thảo luận (+1) nhưng tôi thấy khó theo dõi. Nó thực sự, thực sự, thực sự trì hoãn cú đấm của nó ... Có lẽ bạn có thể tổ chức lại nó một chút? :)
usεr11852 nói Phục hồi Monic

@ user11852 Bạn không nói rằng bài đăng không truyền đạt được điều gì hữu ích trong khi bạn thấy sự phát triển của logic không theo tiêu chuẩn báo chí. Vì chủ đề này đã đi "cộng đồng", tôi không quá thiên về (có động lực?) Để làm việc sắp xếp lại nó xung quanh đề xuất của bạn. Nó có thể đứng như là. Nhưng dù sao cũng cảm ơn bạn vì upvote và bình luận.
Mike Hunter

1.) Đảo ngược ma trận thường được sử dụng để ước tính MLE (chỉ là một trong nhiều phương pháp thường xuyên), nhưng không phải lúc nào cũng vậy. Công việc của tôi trong ước tính MLE liên quan đến tối ưu hóa thường xuyên lên đến tham số (tức là không gian tham số có thể tăng tuyến tính với kích thước mẫu) và đảo ngược ma trận hoàn toàn không phải là một lựa chọn ... nhưng tôi vẫn tối ưu hóa khả năng! 2.) Đảo ngược ma trận vẫn luôn xảy ra trong các số liệu thống kê Bayes, chẳng hạn như bộ lấy mẫu cập nhật khối. n
Vách đá AB

@CliffAB Tôi đã nghĩ đến việc đảo ngược kiểu ANOVA của ma trận các sản phẩm chéo.
Mike Hunter

@DJohnson: Tôi hiểu rồi. Nhưng quan điểm của tôi là đảo ngược ma trận là trực giao với phương pháp thường xuyên và phương pháp Bayes; cả hai trại đều sử dụng các công cụ làm một cái gì đó rất giống nhau (ít nhất là về chi phí tính toán) trong nhiều phương pháp của họ.
Vách đá AB

3

Các bài kiểm tra thường xuyên tập trung vào việc làm sai lệch giả thuyết null. Tuy nhiên, Thử nghiệm Ý nghĩa Giả thuyết Null (NHST) cũng có thể được thực hiện từ góc độ Bayes, bởi vì trong mọi trường hợp NHST chỉ đơn giản là một phép tính của P (Hiệu ứng quan sát | Hiệu ứng = 0). Vì vậy, thật khó để xác định thời điểm cần thiết phải tiến hành NHST từ góc độ thường xuyên.

Điều đó đang được nói, lập luận tốt nhất để tiến hành NHST bằng cách sử dụng phương pháp thường xuyên là dễ dàng và khả năng tiếp cận. Mọi người được dạy thống kê thường xuyên. Vì vậy, việc điều hành NHST thường xuyên sẽ dễ dàng hơn, bởi vì có nhiều gói thống kê khác giúp cho việc thực hiện điều này trở nên đơn giản. Tương tự, việc truyền đạt kết quả của NHST thường xuyên sẽ dễ dàng hơn, bởi vì mọi người đã quen thuộc với hình thức NHST này. Vì vậy, tôi thấy đó là lý lẽ tốt nhất cho các phương pháp tiếp cận thường xuyên: khả năng tiếp cận các chương trình thống kê sẽ điều hành chúng và dễ dàng truyền đạt kết quả cho các đồng nghiệp. Tuy nhiên, đây chỉ là văn hóa, vì vậy lập luận này có thể thay đổi nếu cách tiếp cận thường xuyên mất quyền bá chủ.


5
Các ý kiến ​​về những gì Fisher nghĩ dường như quá căng thẳng ở đây trừ khi bạn có thể cung cấp trích dẫn chính xác. Giả thuyết khống là một thiết bị như là một phần của một bài kiểm tra quan trọng để cố gắng ngăn cản các nhà khoa học giải thích quá nhiều kết quả từ các mẫu nhỏ. Fisher cũng nhạy bén như bất kỳ ai khác mà các nhà khoa học nên sử dụng số liệu thống kê để làm khoa học tốt; bản thân ông là người đóng góp rất nghiêm trọng cho di truyền học.
Nick Cox

4
Tôi hoàn toàn đồng ý, và vì vậy tôi đã chỉnh sửa câu trả lời để loại bỏ suy đoán về trạng thái tinh thần của Fisher.
Liz Page-Gould

3

Một số ý kiến:

  • Sự khác biệt cơ bản giữa người thống kê Bayes và người theo chủ nghĩa thường xuyên là người Bayes sẵn sàng mở rộng các công cụ xác suất cho các tình huống mà người thường xuyên sẽ không.

    • Cụ thể hơn, người Bayes sẵn sàng sử dụng xác suất để mô hình hóa sự không chắc chắn trong tâm trí của cô qua các thông số khác nhau. Đối với người thường xuyên, các tham số này là vô hướng (mặc dù vô hướng trong đó nhà thống kê không biết giá trị thực). Đối với Bayes, các tham số khác nhau được biểu diễn dưới dạng các biến ngẫu nhiên! Điều này là vô cùng khác nhau. Sự không chắc chắn của Bayes trên các thông số valeus được thể hiện trước .
  • Trong thống kê của Bayes, hy vọng là sau khi quan sát dữ liệu, hậu thế áp đảo cái trước, rằng cái trước không quan trọng. Nhưng điều này thường không phải là trường hợp: kết quả có thể nhạy cảm với sự lựa chọn trước! Bayes khác nhau với các linh mục khác nhau không cần phải đồng ý về hậu thế.

Một điểm quan trọng cần ghi nhớ là các tuyên bố của nhà thống kê thường xuyên là những tuyên bố mà bất kỳ hai người Bayes nào cũng có thể đồng ý, bất kể niềm tin trước đó của họ là gì!

Người thường xuyên không bình luận về các linh mục hoặc hậu thế, chỉ đơn thuần là khả năng.

Các tuyên bố của nhà thống kê thường xuyên trong một số ý nghĩa là ít tham vọng hơn, nhưng các tuyên bố táo bạo hơn của Bayesian có thể dựa đáng kể vào sự phân công trước. Trong các tình huống mà các linh mục quan trọng và nơi có sự bất đồng về các linh mục, các tuyên bố có điều kiện, hạn chế hơn về thống kê thường xuyên có thể đứng trên nền tảng vững chắc hơn.


2

Mục tiêu của nhiều nghiên cứu không phải là đi đến kết luận cuối cùng, mà chỉ để có thêm một chút bằng chứng để tăng dần ý thức của cộng đồng về một câu hỏi theo một hướng .

Số liệu thống kê Bayes là không thể thiếu khi những gì bạn cần là đánh giá một quyết định hoặc kết luận dựa trên bằng chứng có sẵn. Kiểm soát chất lượng sẽ là không thể nếu không có số liệu thống kê Bayes. Bất kỳ thủ tục nào mà bạn cần lấy một số dữ liệu và sau đó hành động trên nó (robot, học máy, ra quyết định kinh doanh) đều có lợi từ thống kê Bayes.

Nhưng rất nhiều nhà nghiên cứu không làm điều đó. Họ đang chạy một số thí nghiệm, thu thập một số dữ liệu và sau đó nói "Dữ liệu chỉ theo cách này", mà không thực sự lo lắng quá nhiều về việc liệu đó có phải là kết luận tốt nhất cho tất cả các bằng chứng mà những người khác đã thu thập được cho đến nay. Khoa học có thể là một quá trình chậm chạp và một tuyên bố như "Xác suất mô hình này đúng là 72%!" thường sớm hoặc không cần thiết.

Điều này cũng phù hợp theo một cách toán học đơn giản, bởi vì các số liệu thống kê thường xuyên thường hóa ra giống như bước cập nhật của một thống kê Bayes. Nói cách khác, trong khi số liệu thống kê Bayes là (Mô hình trước, Bằng chứng) → Mô hình mới, thống kê thường xuyên chỉ là Bằng chứng và để lại cho người khác để điền vào hai phần khác.


Mặc dù phần lớn bài đăng này là thú vị, nó bao gồm nhiều ý kiến ​​không được hỗ trợ. Vui lòng tham khảo trung tâm trợ giúp của chúng tôi về loại câu trả lời nào được mong đợi trên trang web này.
whuber

@whuber tôi thấy. Tôi đã thêm một trích dẫn mà tôi có thể nhớ ra khỏi đỉnh đầu, nhưng phần còn lại tôi không có trích dẫn, vì vậy nếu nó không được hỗ trợ, tôi có thể xóa nó.
Owen

5
Tôi ngạc nhiên khi bạn đề cập đến kiểm soát chất lượng, vì có vẻ như đó là một lĩnh vực mà việc giải thích xác suất thường xuyên (tần suất tương đối qua nhiều thử nghiệm) sẽ rất tự nhiên: do nhà máy đang hoạt động chính xác, chúng ta có thể thấy điều này nhiều đến mức nào (hoặc nhiều hơn) các vật dụng bị hỏng? Tôi có thể thúc đẩy bạn giải thích những gì làm cho số liệu thống kê Bayes đặc biệt hữu ích cho QC không?
Matt Krause

@MattKrause Giả sử mục tiêu của chúng tôi là vận chuyển các vật dụng bị lỗi với tỷ lệ <1%. Chúng tôi biết nhà máy sản xuất các vật dụng bị lỗi với tỷ lệ 10% và chúng tôi có một thử nghiệm có tỷ lệ lỗi Loại I và Loại II là s và 1 / (sqrt (4 - 1 / s ^ 2)) trong đó s là một tham số nghiêm ngặt. Chúng ta nên sử dụng những gì cho sự nghiêm ngặt?
Owen

2
Ý tưởng rằng số liệu thống kê thường xuyên không thể kết hợp thông tin từ các nghiên cứu kế tiếp dường như bỏ qua lĩnh vực phân tích tổng hợp.
Vách đá AB

2

Việc thực hiện một phương pháp Bayes thực tế là kỹ thuật hơn so với Phương pháp thường xuyên. Theo "kỹ thuật hơn", ý tôi là: 1) chọn linh mục, 2) lập trình mô hình của bạn theo BUGS / JAGS / STAN và 3) suy nghĩ về việc lấy mẫu và hội tụ.

Rõ ràng, # 1 là khá nhiều không phải là tùy chọn, theo định nghĩa của Bayesian. Mặc dù với một số vấn đề và thủ tục, có thể có các mặc định hợp lý, phần nào che giấu vấn đề từ người dùng. (Mặc dù điều này cũng có thể gây ra vấn đề!)

Việc # 2 có phải là vấn đề hay không phụ thuộc vào phần mềm bạn sử dụng. Số liệu thống kê Bayes thiên về các giải pháp tổng quát hơn các phương pháp thống kê thường xuyên và các công cụ như BUGS, JAGS và STAN là một biểu hiện tự nhiên của điều này. Tuy nhiên, có các hàm Bayes trong các gói phần mềm khác nhau có vẻ hoạt động giống như quy trình thường xuyên thông thường, vì vậy đây không phải lúc nào cũng là một vấn đề. (Và các giải pháp gần đây như các gói R rstanarmbrmsđang thu hẹp khoảng cách này.) Tuy nhiên, sử dụng các công cụ này rất giống với lập trình bằng ngôn ngữ mới.

Mục số 3 thường được áp dụng, vì phần lớn các ứng dụng Bayes trong thế giới thực sẽ sử dụng lấy mẫu MCMC. (Mặt khác, các quy trình dựa trên MLE thường xuyên sử dụng tối ưu hóa có thể hội tụ đến cực tiểu cục bộ hoặc hoàn toàn không hội tụ và tôi tự hỏi có bao nhiêu người dùng nên kiểm tra điều này và không?)

Như tôi đã nói trong một bình luận, tôi không chắc rằng tự do khỏi các linh mục thực sự là một lợi ích khoa học. Nó chắc chắn thuận tiện theo nhiều cách và tại một số điểm trong quy trình xuất bản, nhưng tôi không chắc nó thực sự làm cho khoa học tốt hơn. (Và trong bức tranh lớn, tất cả chúng ta phải nhận thức được các linh mục của mình là nhà khoa học, hoặc chúng ta sẽ phải chịu mọi loại sai lệch trong các cuộc điều tra, bất kể chúng ta sử dụng phương pháp thống kê nào.)


Liên quan đến (3), nhiều mô hình thống kê cổ điển (ví dụ như glm) có khả năng đăng nhập lõm, do đó, rất hiếm khi các thuật toán tiêu chuẩn bị lỗi, bên ngoài các trường hợp góc cực. Liên quan đến các vấn đề không lõm (ví dụ như NN), trong khi những vấn đề này đòi hỏi sự quan tâm lớn về sự hội tụ không đúng (thường được người dùng hiểu), thì đây cũng là những vấn đề mà thuật toán MCMC cổ điển sẽ thất bại khủng khiếp nếu chỉ chạy nói rằng, cuộc sống của một con người. Tuy nhiên, nhìn chung việc sửa lỗi MCMC thường ít hơn so với thuật toán tối ưu hóa!
Vách đá AB

2

Về mặt khái niệm : Tôi không biết. Tôi tin rằng số liệu thống kê Bayes là cách suy nghĩ hợp lý nhất nhưng tôi không biện minh tại sao.

Ưu điểm của người thường xuyên là dễ dàng hơn cho hầu hết mọi người ở cấp tiểu học. Nhưng đối với tôi nó thật kỳ lạ. Phải mất nhiều năm cho đến khi tôi thực sự có thể làm rõ về mặt trí tuệ một khoảng tin cậy là gì. Nhưng khi tôi bắt đầu đối mặt với các tình huống thực tế, các ý tưởng thường xuyên có vẻ đơn giản và có liên quan cao.

Theo kinh nghiệm

Câu hỏi quan trọng nhất mà tôi cố gắng tập trung hiện nay là về hiệu quả thực tế: thời gian làm việc cá nhân, độ chính xác và tốc độ tính toán.

Thời gian làm việc cá nhân: Đối với các câu hỏi cơ bản, tôi thực sự gần như không bao giờ sử dụng các phương pháp Bayes: Tôi sử dụng các công cụ thường xuyên cơ bản và sẽ luôn thích kiểm tra t hơn so với tương đương Bayes sẽ khiến tôi đau đầu. Khi tôi muốn biết liệu tôi có giỏi về tictactoe hơn bạn gái hay không, tôi thực hiện một bình phương :-). Trên thực tế, ngay cả trong công việc nghiêm túc như một nhà khoa học máy tính, các công cụ cơ bản thường xuyên chỉ là vô giá để điều tra các vấn đề và tránh kết luận sai do ngẫu nhiên.

Độ chính xác: Trong học máy, nơi dự đoán quan trọng hơn phân tích, không có ranh giới tuyệt đối giữa Bayes và người thường xuyên. MLE là một người phê duyệt thường xuyên: chỉ là một người ước tính. Nhưng MLE thường xuyên (MAP) là một cách tiếp cận Bayes một phần : bạn tìm thấy chế độ của hậu thế và bạn không quan tâm đến phần còn lại của hậu thế. Tôi không biết về sự biện minh thường xuyên về lý do tại sao sử dụng chính quy. Trên thực tế, việc chính quy hóa đôi khi chỉ là không thể tránh khỏi vì ước tính MLE thô được đánh giá quá cao đến mức 0 sẽ là một công cụ dự đoán tốt hơn. Nếu chính quy hóa được đồng ý là một phương pháp Bayes thực sự, thì điều này một mình biện minh rằng Bayes có thể học với ít dữ liệu hơn.

Tốc độ tính toán: các phương thức thường xuyên thường được tính toán nhanh hơn và đơn giản hơn để thực hiện. Và bằng cách nào đó chính quy hóa cung cấp một cách rẻ tiền để giới thiệu một chút Bayes trong đó. Có thể là do các phương thức Bayes vẫn chưa được tối ưu hóa như có thể. Ví dụ, một số triển khai LDA hiện nay rất nhanh. Nhưng họ đòi hỏi công việc rất khó khăn. Đối với ước tính entropy, các phương pháp tiên tiến đầu tiên là Bayes. Họ đã làm việc rất tốt nhưng các phương pháp thường xuyên sớm được phát hiện và mất ít thời gian tính toán hơn ... Đối với thời gian tính toán, các phương pháp thường xuyên thường vượt trội hơn hẳn. Không phải là vô lý, nếu bạn là người Bayes, hãy nghĩ về các phương pháp thường xuyên như là xấp xỉ của các phương pháp Bayes.


2
"Tôi không biết về một biện minh thường xuyên về lý do tại sao [để] sử dụng chính quy". Điều đó thật dễ dàng; trong các thử nghiệm lặp đi lặp lại, nó đã cho thấy lỗi ngoài mẫu thấp hơn.
Vách đá AB

2

Một loại vấn đề trong đó một cách tiếp cận dựa trên Thường xuyên cụ thể đã chi phối bất kỳ Bayes nào là vấn đề dự đoán trong trường hợp M-open.

M-open có nghĩa là gì?

M-open ngụ ý rằng mô hình thực sự tạo ra dữ liệu không xuất hiện trong tập hợp các mô hình mà chúng tôi đang xem xét. Ví dụ, nếu giá trị trung bình thực của là bậc hai là hàm của , tuy nhiên chúng ta chỉ xem xét các mô hình với hàm trung bình là hàm tuyến tính của , chúng ta đang ở trong trường hợp mở M. Nói cách khác, mô hình lỗi đặc tả kết quả trong trường hợp mở M.yxx

Trong hầu hết các trường hợp, đây là một vấn đề lớn đối với các phân tích Bayes; gần như tất cả các lý thuyết mà tôi biết về việc dựa vào mô hình được chỉ định chính xác. Tất nhiên, là các nhà thống kê quan trọng, chúng ta nên nghĩ rằng mô hình của chúng ta luôn bị sai lệch. Đây là một vấn đề khá; hầu hết lý thuyết của chúng tôi dựa trên mô hình là chính xác, nhưng chúng tôi biết nó không bao giờ đúng. Về cơ bản, chúng tôi chỉ khoanh tay với hy vọng rằng mô hình của chúng tôi không quá sai.

Tại sao các phương pháp thường xuyên xử lý việc này tốt hơn?

Không phải tất cả làm. Ví dụ: nếu chúng tôi sử dụng các công cụ MLE tiêu chuẩn để tạo ra các lỗi tiêu chuẩn hoặc xây dựng các khoảng dự đoán, chúng tôi sẽ không tốt hơn so với sử dụng các phương pháp Bayes.

Tuy nhiên, có một công cụ Thường xuyên cụ thể được dành riêng cho mục đích chính xác này: xác thực chéo. Ở đây, để ước tính mô hình của chúng tôi sẽ dự đoán tốt như thế nào về dữ liệu mới, chúng tôi chỉ cần để lại một số dữ liệu khi điều chỉnh mô hình và đo xem mô hình của chúng tôi dự đoán dữ liệu không nhìn thấy tốt như thế nào.

Lưu ý rằng phương pháp này hoàn toàn phù hợp với mô hình lỗi đặc tả, nó chỉ cung cấp một phương pháp để chúng tôi ước tính mức độ mô hình sẽ dự đoán trên dữ liệu mới, bất kể mô hình đó có "chính xác" hay không.

Tôi không nghĩ rằng nó quá khó để tranh luận rằng điều này thực sự làm thay đổi cách tiếp cận để xây dựng mô hình tiên đoán rằng thật khó để biện minh từ góc độ Bayesian (trước khi được cho là đại diện cho kiến thức trước khi trước khi dữ liệu thấy, hàm likelihood là các mô hình, vv) để một điều đó rất dễ dàng để biện minh từ quan điểm của Người thường xuyên (chúng tôi đã chọn mô hình + các tham số chính quy hóa, qua lấy mẫu lặp lại, dẫn đến các lỗi mẫu tốt nhất).

Điều này đã hoàn toàn cách mạng hóa cách suy luận dự đoán được thực hiện. Tôi không nghĩ rằng bất kỳ nhà thống kê nào sẽ (hoặc ít nhất, nên) nghiêm túc xem xét một mô hình dự đoán không được xây dựng hoặc kiểm tra với xác thực chéo, khi nó có sẵn (nghĩa là chúng ta có thể cho rằng các quan sát là độc lập, không cố gắng tính toán để lấy mẫu thiên vị, v.v.).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.