Danh sách các tình huống trong đó cách tiếp cận Bayes đơn giản hơn, thực tế hơn hoặc thuận tiện hơn


63

Đã có nhiều cuộc tranh luận trong số liệu thống kê giữa người Bayes và người thường xuyên. Tôi thường tìm thấy những thứ này khá khó chịu (mặc dù tôi nghĩ rằng nó đã chết). Mặt khác, tôi đã gặp một số người có quan điểm hoàn toàn thực tế về vấn đề này, nói rằng đôi khi việc phân tích thường xuyên sẽ thuận tiện hơn và đôi khi việc phân tích Bayes dễ dàng hơn. Tôi thấy quan điểm này thực tế và mới mẻ.

Nó xảy ra với tôi rằng nó sẽ hữu ích để có một danh sách các trường hợp như vậy. Bởi vì có quá nhiều phân tích thống kê và vì tôi cho rằng việc tiến hành phân tích thường xuyên là thực tế hơn (mã hóa kiểm tra t trong WinBUGS có liên quan nhiều hơn so với lệnh gọi chức năng duy nhất được yêu cầu để thực hiện phiên bản dựa trên thường xuyên trong R , ví dụ), thật tuyệt khi có một danh sách các tình huống trong đó cách tiếp cận Bayes đơn giản hơn, thực tế hơn và / hoặc thuận tiện hơn so với cách tiếp cận thường xuyên.


(Hai câu trả lời mà tôi không có hứng thú là: 'luôn luôn' và 'không bao giờ'. Tôi hiểu mọi người có ý kiến ​​mạnh mẽ, nhưng xin đừng phát sóng chúng ở đây. Nếu chủ đề này trở thành một địa điểm cho cuộc cãi vã nhỏ nhặt, tôi có thể sẽ xóa Mục tiêu của tôi ở đây là phát triển một nguồn tài nguyên sẽ hữu ích cho một nhà phân tích có công việc phải làm, không phải là một cái rìu để nghiền.)

Mọi người được hoan nghênh đề xuất nhiều hơn một trường hợp, nhưng vui lòng sử dụng các câu trả lời riêng biệt để làm như vậy, để mỗi tình huống có thể được đánh giá (bỏ phiếu / thảo luận) riêng lẻ. Câu trả lời nên liệt kê: (1) những gì bản chất của tình hình, và (2) tại sao phương pháp Bayes đơn giản trong trường hợp này. Một số (giả sử, trong WinBUGS) cho thấy cách phân tích sẽ được thực hiện và tại sao phiên bản Bayes thực tế hơn sẽ là lý tưởng, nhưng tôi hy vọng sẽ quá cồng kềnh. Nếu nó có thể được thực hiện dễ dàng tôi sẽ đánh giá cao nó, nhưng vui lòng bao gồm tại sao một trong hai cách.

Cuối cùng, tôi nhận ra rằng tôi chưa xác định ý nghĩa của một cách tiếp cận là 'đơn giản' hơn so với cách tiếp cận khác. Sự thật là, tôi không hoàn toàn chắc chắn ý nghĩa của một phương pháp này là thực tế hơn phương pháp khác. Tôi cởi mở với các đề xuất khác nhau, chỉ cần xác định cách giải thích của bạn khi bạn giải thích lý do phân tích Bayes thuận tiện hơn trong tình huống bạn thảo luận.


7
Mô hình đa cấp chắc chắn dễ dàng hơn cho bayesian, đặc biệt là về mặt khái niệm.
xác suất

Người hỏi có thể không thích điều này, nhưng không có xung quanh thực sự suy nghĩ và hiểu những gì suy luận hoặc phương pháp mô hình đang thực sự làm, và làm thế nào để giải thích chúng. Không có ý nghĩa gì khi tìm kiếm cái nào đơn giản hơn khi họ đang đạt được các mục tiêu khác nhau.

1
Tôi ổn với lời khuyên nên suy nghĩ rõ ràng về những gì bạn đang cố gắng làm và cách phân tích hoạt động, @Mayo. Tôi đã đưa ra lời khuyên đó cho mình ;-). Tôi cũng quen thuộc với ý tưởng phân tích Bayesian và người thường xuyên đưa ra các giả định khác nhau về bản chất của xác suất. Tuy nhiên, như tôi lưu ý trong câu hỏi, tôi đã gặp một số người (ví dụ, số liệu thống kê của Tiến sĩ, những người hiểu rất rõ vấn đề), họ nói rằng có những lúc chúng đủ giống nhau & 1 là thuận tiện hơn. Các câu trả lời khác chứng minh rằng có thể đưa ra ví dụ như vậy. Tôi rất thích xem bất kỳ trường hợp bổ sung mà bạn biết.
gung - Phục hồi Monica

Chỉ tò mò - khi bạn nói "phân tích thường xuyên là thực tế hơn", bạn đang nói về phần mềm - chẳng hạn như sử dụng lm ()trong R có dễ sử dụng hơn không? Hoặc là có cái gì khác?
xác suất

@probabilityislogic, về cơ bản. Ví dụ của tôi là sử dụng t.test()trái ngược với việc mã hóa bài kiểm tra t Bayes trong WinBUGS, đòi hỏi nhiều mã hơn. Có lẽ thay vì "thực tế hơn", tôi nên nói "dễ dàng hơn".
gung - Phục hồi Monica

Câu trả lời:


26

(1) Trong các bối cảnh mà hàm khả năng có thể điều chỉnh được (ít nhất là bằng số), việc sử dụng phương pháp Bayes, bằng phương pháp tính toán gần đúng Bayesian (ABC), đã đạt được một số đối thủ cạnh tranh thường xuyên như khả năng tổng hợp ( 1 , 2 ) hoặc khả năng thực nghiệm vì nó có xu hướng dễ thực hiện hơn (không nhất thiết phải đúng). Do đó, việc sử dụng ABC đã trở nên phổ biến ở những khu vực thường gặp các khả năng khó chữa như sinh học , di truyềnsinh thái . Ở đây, chúng ta có thể đề cập đến một đại dương ví dụ.

Một số ví dụ về khả năng khó hiểu là

  • N

  • 1000+


1
Đây là những tuyệt vời! Bạn có thể chia chúng thành 2 câu trả lời (để tôi có thể nâng cao bạn hai lần ;-) và chỉ cung cấp một ví dụ điển hình (đồ chơi) không? Cảm ơn.
gung - Phục hồi Monica

2
@Procrastinator Bạn có thể giải thích một chút về lý do tại sao trong một số bối cảnh, khả năng là không thể tìm thấy. Cho rằng bạn đề cập đến sinh học, di truyền và sinh thái, tôi tưởng tượng rằng nó được liên kết với các phụ thuộc phức tạp giữa các tham số. Tôi nghĩ rằng điều này sẽ đặc biệt hữu ích cho những người không quen thuộc với phân tích Bayes (trong đó tôi), đặc biệt là trang wikipedia trên ABC mà bạn liên kết đến không cung cấp nhiều ngữ cảnh. Cảm ơn
Antoine Vernet

15

Khi phần mềm Bayes được cải thiện, vấn đề "dễ áp ​​dụng hơn" sẽ trở thành vấn đề. Phần mềm Bayes đang trở nên đóng gói ở dạng dễ dàng và dễ dàng hơn. Một trường hợp gần đây là từ một bài báo có tiêu đề, ước tính Bayes thay thế bài kiểm tra t . Trang web sau đây cung cấp các liên kết đến bài viết và phần mềm: http://www.indiana.edu/~kruschke/BEST/

Một đoạn trích từ phần giới thiệu của bài viết:

... một số người có ấn tượng rằng các kết luận từ phương pháp NHST và Bayes có xu hướng đồng ý trong các tình huống đơn giản như so sánh hai nhóm: Vì vậy, nếu câu hỏi quan tâm chính của bạn có thể được thể hiện đơn giản dưới dạng có thể chấp nhận được trong bài kiểm tra, hãy nói , thực sự không cần phải thử và áp dụng toàn bộ máy móc Bayes cho một vấn đề đơn giản như vậy (Brooks, 2003, trang 2694). Bài viết này cho thấy, ngược lại, ước tính tham số Bayes cung cấp thông tin phong phú hơn nhiều so với thử nghiệm NHST t và kết luận của nó có thể khác với thử nghiệm NHST t. Các quyết định dựa trên ước tính tham số Bayes được thiết lập tốt hơn so với các quyết định dựa trên NHST, cho dù các quyết định có được từ hai phương pháp có đồng ý hay không.


10
Tôi tập hợp câu trả lời của bạn là luôn luôn hoặc 'nó sẽ luôn luôn sớm'. Đây là câu trả lời của một đảng phái Bayes.
gung - Phục hồi Monica

3
Và đây là một triển khai javascript trực tuyến TỐT NHẤT của Kruschke. Phân tích Bayes trong trình duyệt :) sumsar.net/best_online
Rasmus Bååth

13

θ=P(X<Y)XYXYθ

Xf(x;ξ1)F(x;ξ1)Yg(y;ξ2)G(y;ξ2)

()θ=F(y;ξ1)g(y;ξ2)dy.

(ξ1,ξ2)θ

(ξ1,ξ2)()θ


4
+1 cho cả hai câu trả lời của bạn - đây là những ví dụ thú vị. Bạn dường như cho rằng giải pháp thường xuyên phải dựa trên khả năng, dường như bỏ qua các phương pháp phi tham số. Trong trường hợp cụ thể này, các phương pháp thường xuyên không theo tỷ lệ của Chương 5 trong cuốn sách mà bạn liên kết với tôi dường như dễ sử dụng như các phương pháp Bayes.
MånsT

@ MånsT Điểm tốt. Thật vậy, câu trả lời này tập trung vào Bayesian so với khả năng suy luận dựa trên khả năng. Tôi đã viết một câu trả lời một thời gian trước đây về một giải pháp không phải của vấn đề này, như bạn chỉ ra, cũng dễ như cách tiếp cận Bayes.

@ MånsT & Procrastinator, tôi cũng đã nêu lên điều này. Tôi không rõ "dễ nhất" nghĩa là gì trong bối cảnh của câu hỏi này / những bình luận được đưa ra cho tôi trong những năm qua đã thúc đẩy nó. Chủ yếu tôi muốn loại trừ các câu trả lời trong đó nhà phân tích có vị trí lý thuyết sao cho người ta luôn tốt hơn vì những lý do không liên quan đến tình huống. Tất nhiên, một vị trí như vậy có thể phòng thủ được và có rất nhiều nơi trên internet để xem các đối số như vậy (bao gồm cả một số trên CV), nhưng tôi nghĩ rằng sẽ rất thú vị khi có một nơi mà mọi người liệt kê các trường hợp mà họ sẽ sử dụng khác & tại sao.
gung - Phục hồi Monica

13

Tôi được đào tạo về thống kê thường xuyên (thực tế là kinh tế lượng), nhưng tôi chưa bao giờ có lập trường đối đầu với cách tiếp cận Bayes, vì quan điểm của tôi là nguồn gốc triết học của trận chiến "sử thi" này về cơ bản đã sai lầm ngay từ đầu (tôi đã lên sóng quan điểm của tôi ở đây ). Trên thực tế, tôi dự định cũng sẽ rèn luyện bản thân theo cách tiếp cận Bayes trước mắt.

Tại sao? Bởi vì một trong những khía cạnh của thống kê thường xuyên làm tôi say mê nhất là một nỗ lực toán học và khái niệm, đồng thời nó gây rắc rối cho tôi nhiều nhất: tiệm cận cỡ mẫu. Ít nhất là trong kinh tế lượng, hầu như khôngbài báo nghiêm túc ngày nay tuyên bố rằng bất kỳ công cụ ước tính nào khác thường được áp dụng trong kinh tế lượng thường xuyên sở hữu bất kỳ tính chất "mẫu nhỏ" mong muốn nào chúng ta muốn từ một người ước tính. Tất cả đều dựa vào các đặc tính tiệm cận để biện minh cho việc sử dụng của họ. Hầu hết các thử nghiệm được sử dụng chỉ có các đặc tính mong muốn không có triệu chứng ... Nhưng chúng tôi không còn ở "z-đất / t-đất" nữa: tất cả các bộ máy tinh vi (và ghê gớm) của ước lượng và suy luận thường xuyên hiện đại cũng rất bình dị - có nghĩa là rất bình dị - có nghĩa là đôi khi, một mẫu laaaaaaaaa ... thực sự cần thiết để các tính chất tiệm cận quý giá này xuất hiện và ảnh hưởng tốt đến các ước tính có được từ các công cụ ước tính, như đã được chứng minh bằng nhiều mô phỏng khác nhau. Có nghĩa là hàng chục ngàn quan sát - mặc dù chúng bắt đầu có sẵn cho một số lĩnh vực hoạt động kinh tế (như thị trường lao động hoặc tài chính), có những lĩnh vực khác (như kinh tế vĩ mô) mà chúng sẽ không bao giờ làm (ít nhất là trong suốt cuộc đời tôi). Và tôi khá bận tâm vì điều đó, bởi vì nó làm cho kết quả thu được thực sựkhông chắc chắn (không chỉ ngẫu nhiên).

Kinh tế lượng Bayes cho các mẫu nhỏ không dựa vào kết quả tiệm cận. "Nhưng họ dựa vào sự chủ quan trước !" là câu trả lời thông thường ... mà câu trả lời đơn giản, thực tế của tôi là như sau: "nếu hiện tượng này đã cũ và được nghiên cứu trước, thì có thể ước tính trước từ dữ liệu trong quá khứ. Nếu hiện tượng đó là mới , thì còn gì nữa không bằng những lập luận chủ quan chúng ta có thể bắt đầu cuộc thảo luận về nó không?


5
Đây là một viễn cảnh đáng giá, nhưng lưu ý rằng có những cách tiếp cận thường xuyên không phụ thuộc quá nhiều vào sự không có triệu chứng, chẳng hạn như mô phỏng Monte Carlo, bootstrapping và kiểm tra hoán vị.
gung - Tái lập Monica

1
Và nếu một người cố gắng để có được điều tốt nhất từ ​​cả hai thế giới? Một nỗ lực: Bartels, Christian (2017): Sử dụng kiến ​​thức trước trong các bài kiểm tra thường xuyên. vả doi.org/10.6084/m9.figshare.4819597.v3 Truy xuất: 17 18, ngày 10 tháng 5 năm 2017 (GMT)
user36160

13

Đây là một trả lời muộn, tuy nhiên tôi hy vọng nó thêm một cái gì đó. Tôi đã được đào tạo về viễn thông, nơi hầu hết thời gian chúng tôi sử dụng phương pháp Bayes.

Dưới đây là một ví dụ đơn giản: Giả sử bạn có thể truyền bốn tín hiệu có thể là +5, +2,5, -2,5 và -5 volt. Một trong những tín hiệu từ bộ này được truyền đi, nhưng tín hiệu bị hỏng bởi nhiễu Gaussian tại thời điểm nó đến đầu nhận. Trong thực tế, tín hiệu cũng bị suy giảm, nhưng chúng tôi sẽ loại bỏ vấn đề này để đơn giản. Câu hỏi là: Nếu bạn ở đầu nhận, làm thế nào để bạn thiết kế một máy dò cho bạn biết tín hiệu nào được truyền đi ban đầu?

Vấn đề này rõ ràng nằm trong lĩnh vực kiểm tra giả thuyết. Tuy nhiên, bạn không thể sử dụng giá trị p, vì thử nghiệm quan trọng có khả năng từ chối cả bốn giả thuyết có thể và bạn biết rằng một trong những tín hiệu này đã thực sự được truyền đi. Chúng ta có thể sử dụng phương pháp Neyman-Pearson để thiết kế máy dò theo nguyên tắc, nhưng phương pháp này hoạt động tốt nhất cho các giả thuyết nhị phân. Đối với nhiều giả thuyết, nó trở nên quá vụng về khi bạn cần xử lý một số ràng buộc đối với xác suất báo động sai. Một thay thế đơn giản được đưa ra bởi thử nghiệm giả thuyết Bayes. Bất kỳ tín hiệu nào trong số này có thể được chọn để truyền đi, do đó, tín hiệu trước có thể được trang bị. Trong các trường hợp có thể trang bị như vậy, phương pháp sẽ tập trung vào việc chọn tín hiệu với khả năng tối đa. Phương pháp này có thể được đưa ra một giải thích hình học tốt đẹp: chọn tín hiệu xảy ra gần nhất với tín hiệu thu được. Điều này cũng dẫn đến việc phân vùng không gian quyết định thành một số vùng quyết định, do đó nếu tín hiệu thu được nằm trong một vùng cụ thể, thì quyết định giả thuyết liên quan đến vùng quyết định đó là đúng. Do đó, việc thiết kế một máy dò được thực hiện dễ dàng.


4
Cảm ơn bạn đã chia sẻ kinh nghiệm của bạn với chúng tôi. Chào mừng đến với trang web của chúng tôi!
whuber

4

Vì vậy, các cuộc kiểm tra thống kê 'Người thường xuyên' thường tương đương với phương pháp tiếp cận Bayes phức tạp hơn về nguyên tắc theo các giả định nhất định. Khi các giả định này được áp dụng, thì một trong hai cách tiếp cận sẽ cho kết quả tương tự, vì vậy sẽ an toàn khi sử dụng thử nghiệm Thường xuyên dễ dàng hơn. Cách tiếp cận Bayes nói chung an toàn hơn vì nó làm cho các giả định rõ ràng nhưng nếu bạn biết những gì bạn đang làm thì bài kiểm tra Thường xuyên thường tốt như cách tiếp cận Bayes và thường dễ áp ​​dụng hơn.


1
Cảm ơn. Bạn lưu ý rằng các bài kiểm tra thường xuyên "thường dễ áp ​​dụng hơn". Bạn có biết về một tình huống cụ thể khi đây không phải là trường hợp (nếu F chỉ "điển hình" dễ dàng hơn, thì phải có một số trường hợp như vậy). Hiện tại, chúng ta có thể đặt sang một bên các vấn đề về cách tiếp cận nào sẽ "an toàn" hơn, và chỉ tập trung vào phần dễ áp ​​dụng hơn .
gung - Phục hồi Monica

4

(Tôi sẽ thử những gì tôi nghĩ sẽ là loại câu trả lời điển hình nhất.)

Giả sử bạn có một tình huống có một số biến và một phản hồi và bạn biết rất nhiều về cách một trong các biến phải liên quan đến phản hồi, nhưng không nhiều về các biến khác.

Trong tình huống như thế này, nếu bạn thực hiện phân tích hồi quy bội tiêu chuẩn, kiến ​​thức trước đó sẽ không được tính đến. Một phân tích tổng hợp có thể được tiến hành sau đó, điều này có thể thú vị trong việc làm sáng tỏ liệu kết quả hiện tại có phù hợp với các kết quả khác hay không và có thể cho phép ước tính chính xác hơn một chút (bằng cách bao gồm kiến ​​thức trước đó vào thời điểm đó). Nhưng cách tiếp cận đó sẽ không cho phép những gì đã biết về biến đó ảnh hưởng đến ước tính của các biến khác.

Một tùy chọn khác là có thể mã hóa và tối ưu hóa chức năng của chính bạn để sửa mối quan hệ với biến đang được đề cập và tìm giá trị tham số cho các biến khác tối đa hóa khả năng của dữ liệu được đưa ra hạn chế đó. Vấn đề ở đây là mặc dù tùy chọn đầu tiên không hạn chế đầy đủ ước tính beta, nhưng cách tiếp cận này đã quá hạn chế nó.

Có thể ban giám khảo một số thuật toán sẽ giải quyết tình huống phù hợp hơn, các tình huống như thế này có vẻ như là ứng cử viên lý tưởng cho phân tích Bayes. Bất cứ ai không phản đối giáo điều đối với phương pháp Bayes nên sẵn sàng thử nó trong những trường hợp như thế này.


2

Một lĩnh vực nghiên cứu trong đó các phương pháp Bayes cực kỳ đơn giản và các phương pháp Thường xuyên cực kỳ khó thực hiện là Phương pháp Thiết kế Tối ưu .

x(1)βx(2)β

βx(i)β^ββ^x(i)β

ββxx

Từ quan điểm của Bayes, vấn đề này rất dễ dàng.

  1. β
  2. x
  3. x
  4. Lặp lại các bước 2 & 3 cho đến khi đạt được độ chính xác mong muốn

x


2

Có lẽ một trong những trường hợp đơn giản và phổ biến nhất mà cách tiếp cận Bayes dễ dàng hơn là định lượng độ không đảm bảo của các tham số.

Trong câu trả lời này, tôi không đề cập đến việc giải thích các khoảng tin cậy so với các khoảng tin cậy. Hiện tại, hãy giả sử rằng người dùng vẫn ổn khi sử dụng một trong hai phương pháp.

Như đã nói, trong khuôn khổ Bayes, nó thẳng tiến; đó là phương sai biên của hậu thế cho bất kỳ tham số quan tâm riêng lẻ nào. Giả sử bạn có thể lấy mẫu từ phía sau, sau đó chỉ cần lấy mẫu của bạn và tính toán phương sai của bạn. Làm xong!

Trong trường hợp Thường xuyên, điều này thường chỉ đơn giản trong một số trường hợp và đó là một nỗi đau thực sự khi không. Nếu chúng ta có số lượng mẫu lớn so với số lượng tham số nhỏ (và ai thực sự biết mức độ lớn đủ lớn), chúng ta có thể sử dụng lý thuyết MLE để lấy ra CI. Tuy nhiên, những tiêu chí đó không phải lúc nào cũng giữ, đặc biệt là đối với các trường hợp thú vị (ví dụ: mô hình hiệu ứng hỗn hợp). Đôi khi chúng ta có thể sử dụng bootstrapping, nhưng đôi khi chúng ta không thể! Trong các trường hợp chúng ta không thể, có thể rất khó, thực sự rất khó để đưa ra các ước tính lỗi và thường đòi hỏi một chút thông minh (ví dụ, công thức của Greenwood để lấy SE cho các đường cong Kaplan Meier). "Sử dụng một số thông minh" không phải lúc nào cũng là một công thức đáng tin cậy!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.