Ví dụ về cách tiếp cận Bayes và thường xuyên đưa ra các câu trả lời khác nhau


54

Lưu ý: Tôi nhận thức triết học khác nhau giữa thống kê Bayes và frequentist.

Ví dụ: "xác suất mà đồng xu trên bàn là gì" không có ý nghĩa gì trong thống kê thường xuyên, vì nó đã hạ cánh hoặc đuôi - không có gì có thể xảy ra về nó. Vì vậy, câu hỏi không có câu trả lời trong thuật ngữ thường xuyên.

Nhưng sự khác biệt như vậy đặc biệt không phải là loại khác biệt mà tôi đang hỏi về.

Thay vào đó, tôi muốn biết dự đoán của họ cho các câu hỏi được hình thành thực sự khác nhau như thế nào trong thế giới thực, không bao gồm bất kỳ sự khác biệt về lý thuyết / triết học nào như ví dụ tôi đã đề cập ở trên.

Nói cách khác:

Ví dụ về một câu hỏi , có thể trả lời được trong cả thống kê thường xuyên Bayes, câu trả lời của ai khác nhau?

(ví dụ: Có lẽ một trong số họ trả lời "1/2" cho một câu hỏi cụ thể và các câu trả lời khác "2/3".)

Có sự khác biệt nào như vậy không?

  • Nếu vậy, một số ví dụ là gì?

  • Nếu không, thì khi nào nó thực sự tạo ra sự khác biệt cho dù tôi sử dụng số liệu thống kê Bayes hay thường xuyên khi giải quyết một vấn đề cụ thể?
    Tại sao tôi lại tránh cái này để ủng hộ cái kia?


8
John Kruschke chỉ sản xuất hai video mà anh so sánh các phương pháp thống kê tiêu chuẩn và Bayes. Anh ta có nhiều ví dụ trong đó phương pháp Bayes bác bỏ nhưng phương pháp tiêu chuẩn thì không. Có thể không chính xác những gì bạn đang tìm kiếm, nhưng dù sao đi nữa ... youtu.be/YyohWpjl6KUyoutu.be/IhlSD-lIQ_Y .
Rasmus Bååth

4
Phân phối nhị thức cung cấp một ví dụ khác trong đó suy luận thường xuyên (dựa trên khả năng) và suy luận Bayes khác nhau trong một số trường hợp. Khả năng cấu hình của tham số không phân rã thành là ( xem ) đối với một số mẫu. Điều này ngụ ý rằng một số khoảng tin cậy khả năng có độ dài vô hạn. Mặt khác, phân phối hậu biên của luôn phân rã thành vì cho rằng nó có thể tích hợp được. N0NN0N

@Procrastinator: Cảm ơn, tôi đang xem các slide được đề cập ngay bây giờ. Điều này có vẻ hơi dữ dội hơn nền toán học của tôi nhưng hy vọng tôi sẽ nhận được một cái gì đó từ nó. :)
Mehrdad

2
Bạn có thể muốn xem ví dụ của Stone. Tôi giải thích nó trên blog của tôi ở đây: Normaldeviate.wordpress.com/2012/12/08/ Khăn
Larry Wasserman

1
@mbq: Chỉ tự hỏi, tại sao điều này được tạo ra cộng đồng wiki?
Mehrdad

Câu trả lời:


9

Ví dụ này được lấy từ đây . (Tôi thậm chí nghĩ rằng tôi đã nhận được liên kết này từ SO, nhưng không thể tìm thấy nó nữa.)

Một đồng xu đã được tung lần, đi lên đầu lần. Nếu nó được ném thêm hai lần nữa, bạn có đặt cược vào hai cái đầu không? Giả sử bạn không được xem kết quả của lần ném đầu tiên trước lần ném thứ hai (và cũng có điều kiện độc lập trên ), do đó bạn không thể cập nhật ý kiến ​​của mình về ở giữa hai lần ném.n=14k=10θθ

Bằng tính độc lập, Sau đó, phân phối dự đoán được cung cấp một -pancer, trở thành

f(yf,1=heads,yf,2=heads|θ)=f(yf,1=heads)f(yf,2=heads|θ)=θ2.
Beta(α0,β0)
f(yf,1=heads,yf,2=heads|y)=f(yf,1=heads,yf,2=heads|θ)π(θ|y)dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)θ2θα0+k1(1θ)β0+nk1dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)Γ(α0+k+2)Γ(β0+nk)Γ(α0+β0+n+2)=(α0+k)(α0+k+1)(α0+β0+n)(α0+β0+n+1)
Dành cho đồng phục trước ( mộtBeta(1,1)-p Warrior), điều này mang lại khoảng 0,485. Do đó, bạn có thể không đặt cược. Dựa trên MLE 10/14, bạn sẽ tính xác suất hai đầu của , như vậy cá cược sẽ có ý nghĩa.(10/14)2.51

+1 chính xác là loại câu trả lời tôi đang tìm kiếm, cảm ơn.
Mehrdad

5
Thực sự có một bản cập nhật cho bài đăng được tham chiếu trong câu trả lời ... Mặc dù anh ấy đã đăng bài lên, "thay vì sử dụng phân phối thống nhất như trước, chúng tôi thậm chí có thể không tin hơn. Trong trường hợp này, chúng tôi có thể sử dụng bản Beta ( 0,0) phân phối như trước. Phân phối như vậy tương ứng với trường hợp bất kỳ giá trị trung bình nào của phân phối đều có khả năng như nhau. Trong trường hợp này, hai cách tiếp cận, Bayesian và người thường xuyên cho kết quả như nhau. " !!! Vì vậy, chúng ta vẫn cần một ví dụ để trả lời câu hỏi này! Do đó +1 cho câu trả lời dưới đây là câu trả lời thực sự cho câu hỏi này.
dùng1745038

10

Xem câu hỏi của tôi ở đây , trong đó đề cập đến một bài báo của Edwin Jaynes đưa ra ví dụ về khoảng tin cậy thường xuyên được xây dựng chính xác, trong đó có đủ thông tin trong mẫu để biết chắc chắn rằng giá trị thực của thống kê không nằm trong khoảng tin cậy ( và do đó, khoảng tin cậy khác với khoảng tin cậy Bayes).

Tuy nhiên, lý do cho điều này là sự khác biệt trong định nghĩa về khoảng tin cậy và khoảng tin cậy, do đó là hậu quả trực tiếp của sự khác biệt trong định nghĩa xác suất thường xuyên và Bayesian. Nếu bạn yêu cầu một người Bayes tạo ra khoảng tin cậy Bayes (chứ không phải đáng tin cậy), thì tôi nghi ngờ rằng sẽ luôn có một khoảng trước mà các khoảng sẽ giống nhau, do đó, sự khác biệt sẽ tùy thuộc vào lựa chọn trước.

Cho dù phương pháp thường xuyên hay phương pháp Bayes là phù hợp tùy thuộc vào câu hỏi bạn muốn đặt ra và vào cuối ngày, chính sự khác biệt trong triết học quyết định câu trả lời (với điều kiện là nỗ lực tính toán và phân tích cần thiết không phải là một sự cân nhắc).

Có đôi chút lúng túng, có thể lập luận rằng tần suất chạy dài là cách hoàn toàn hợp lý để xác định tính hợp lý tương đối của một đề xuất, trong trường hợp thống kê thường xuyên là một tập hợp hơi kỳ lạ của chủ nghĩa Bayes chủ quan - vì vậy bất kỳ câu hỏi nào mà một người thường xuyên có thể trả lời một người theo chủ nghĩa chủ nghĩa Bayes cũng có thể trả lời theo cùng một cách, hoặc theo một cách khác, họ nên chọn các linh mục khác nhau. ; o)


4
Việc sử dụng "Bayesian chủ quan" là một chút tự phá hoại ( xem ). Mô hình hóa nói chung mang đầy tính chủ quan, việc lựa chọn phân phối để mô hình hóa một mẫu cũng mang tính chủ quan. Ngay cả việc lựa chọn một mức độ tốt của kiểm tra sự phù hợp để kiểm tra xem một mô hình nhất định là hợp lý là chủ quan.

2
Tôi thực sự không đồng ý với điều đó, nếu ai đó coi "chủ quan" là sai lầm, đó là lỗi của họ. Đôi khi khi chúng ta muốn nói đến xác suất, chúng ta thực sự có nghĩa là niềm tin cá nhân chủ quan - tôi thấy không có lý do gì để không gọi nó là nếu đó là ý nghĩa thực sự (chọn chỉ chấp nhận tần số chạy dài vì định nghĩa xác suất là lựa chọn hoàn toàn chủ quan).
Dikran Marsupial

1
+1 cảm ơn vì liên kết, nó rất ngộ. Và cũng cho lưu ý về sự khác biệt giữa khoảng tin cậy và khoảng tin cậy là tốt.
Mehrdad

8

Tôi tin rằng bài viết này cung cấp một ý nghĩa có mục đích hơn về sự đánh đổi trong các ứng dụng thực tế giữa hai. Một phần của điều này có thể là do sở thích của tôi trong các khoảng thời gian hơn là các bài kiểm tra.

Gustafson, P. và Greenland, S. (2009). Ước tính khoảng cho dữ liệu quan sát lộn xộn . Khoa học thống kê 24: 328 Từ342.

Liên quan đến các khoảng, có thể đáng lưu ý rằng các khoảng tin cậy thường xuyên yêu cầu / bảo hiểm thống nhất theo yêu cầu (chính xác hoặc ít nhất là lớn hơn x% cho mỗi và mọi giá trị tham số không có xác suất bằng 0) và nếu chúng không có điều đó - họ không thực sự khoảng tin cậy. (Một số người sẽ đi xa hơn và nói rằng họ cũng phải loại trừ các tập hợp con có liên quan thay đổi phạm vi bảo hiểm.)

Phạm vi bảo hiểm Bayes thường được xác định bằng cách thư giãn rằng "mức độ bao phủ trung bình" được đưa ra giả định trước đó hóa ra là chính xác. Gustafson và Greenland (2009) gọi những linh mục toàn năng này và xem xét những người dễ sai lầm để đưa ra đánh giá tốt hơn.


1
+1 Tôi chưa bao giờ biết về sự khác biệt này trong giới hạn, cảm ơn vì đã chỉ ra.
Mehrdad

3

Nếu ai đó đặt ra một câu hỏi có cả câu trả lời thường xuyên và Bayes, tôi nghi ngờ rằng ai đó sẽ có thể xác định một sự mơ hồ trong câu hỏi, do đó làm cho nó không được "hình thành tốt".

Nói cách khác, nếu bạn cần một câu trả lời thường xuyên, hãy sử dụng các phương pháp thường xuyên. Nếu bạn cần một câu trả lời Bayes, hãy sử dụng các phương pháp Bayes. Nếu bạn không biết bạn cần gì, thì bạn có thể không xác định rõ ràng câu hỏi.

Tuy nhiên, trong thế giới thực thường có một số cách khác nhau để xác định vấn đề hoặc đặt câu hỏi. Đôi khi không rõ ràng những cách nào là thích hợp hơn. Điều này đặc biệt phổ biến khi khách hàng của một người thống kê ngây thơ. Những lần khác, một câu hỏi khó trả lời hơn nhiều so với câu hỏi khác. Trong những trường hợp đó, người ta thường đi với sự dễ dàng nhất trong khi cố gắng đảm bảo khách hàng của mình đồng ý với chính xác câu hỏi anh ta đang hỏi hoặc vấn đề nào anh ta đang giải quyết.


3

Tôi khuyên bạn nên xem Bài tập 3.15 của sách giáo khoa Lý thuyết thông tin, suy luận và thuật toán học tập có sẵn miễn phí của MacKay.

Khi quay vòng trên 250 lần, một đồng xu một euro của Bỉ đã xuất hiện 140 lần và đuôi 110. 'Nó trông rất đáng nghi với tôi', Barry Blight, giảng viên thống kê tại Trường Kinh tế Luân Đôn cho biết. 'Nếu đồng xu không thiên vị, cơ hội nhận được kết quả cực kỳ thấp hơn mức đó sẽ dưới 7%'. Nhưng những dữ liệu này có đưa ra bằng chứng rằng đồng xu bị sai lệch hơn là công bằng không?

Ví dụ này được trình bày chi tiết trên trang 63-64 của sách giáo khoa. Kết luận là giá trị là , nhưng cách tiếp cận Bayes đưa ra các mức hỗ trợ khác nhau cho giả thuyết, tùy thuộc vào trước. Điều này nằm trong phạm vi từ một câu trả lời được đề xuất không có bằng chứng nào cho thấy đồng xu bị sai lệch (khi sử dụng trước một căn hộ) cho đến câu trả lời không quá chống lại giả thuyết không thiên vị, trong trường hợp sử dụng cực kỳ giả tạo trước.p0.076:1

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.