Các ví dụ cụ thể về cách tiếp cận thường xuyên vượt trội so với phương pháp Bayes [đóng]


8

Bạn có thể giúp tôi hiểu quan điểm thường xuyên trong cuộc tranh luận về Bayesian và thường xuyên không? Tôi đã đọc rất nhiều và tất cả các nguồn tôi tìm thấy đều chứa đầy các phương trình phức tạp hoặc được viết từ quan điểm bayes, hoặc cả hai. Tôi đã không tìm thấy một vấn đề mẫu nào trong đó cách tiếp cận thường xuyên sẽ tạo ra đầu ra hữu ích hơn so với phương pháp bayesian. Tôi cảm thấy như tôi chỉ hiểu một mặt của cuộc tranh luận này và tôi cũng muốn hiểu về mặt khác. Tôi không có bất kỳ nền tảng nào trong thống kê, vì vậy tôi sẽ đánh giá cao các ví dụ đơn giản về các trường hợp trong đó các phương thức thường xuyên tạo ra nhiều giá trị hơn các phương pháp bayes.

Một ví dụ điển hình sẽ là một kịch bản cá cược trong đó một người thường xuyên và người Bayes đặt cược với nhau về một số kết quả trong tương lai và người thường xuyên có giá trị kỳ vọng tích cực.


3
Chắc chắn bạn có thể tìm thấy một vài chục ngàn ví dụ như vậy chỉ bằng cách duyệt qua trang web này. Trong bối cảnh này, bạn đang tìm kiếm loại câu trả lời nào?
whuber

7
Sau 2 giờ googling tôi đã tìm thấy 0 ví dụ trong đó cách tiếp cận thường xuyên hữu ích hơn Bayesian. Nếu bạn có 10 000 ví dụ, bạn có thể cung cấp 1 trong số đó không? Cảm ơn.
Atte Juvonen

2
Tôi không biết liệu đây có phải là cấp độ bạn muốn không, nhưng bạn có thể tìm thấy một cuộc thảo luận có liên quan trong cuốn sách của L. Wasserman có sẵn trên mạng. read.pudn.com/doads158/ebook/702714/ . Nếu bạn đi đến trang 216, bạn sẽ tìm thấy một ví dụ liên quan đến khoảng tin cậy nơi phương pháp tiếp cận thường xuyên vượt trội hơn Bayesian.
JohnK

2
@whuber: Tôi không tin định nghĩa "hữu ích" của bạn sẽ khác với tôi theo cách mà nó có ý nghĩa để thảo luận về nó. Tôi không ở đây để suy luận rằng bayesian> thường xuyên. Gần đây tôi đã học về những chủ đề này và tôi cảm thấy mình chỉ hiểu một khía cạnh của cuộc tranh luận. Tôi cũng muốn hiểu về phía bên kia. Tôi thấy dễ dàng nhất để nắm bắt các khái niệm mới thông qua các ví dụ thực tế; trong trường hợp này là một ví dụ trong đó chủ nghĩa thường xuyên cung cấp một cái gì đó có giá trị (trong đó các phương pháp bayes không bao lâu)
Atte Juvonen

3
Tôi bỏ phiếu để mở lại. @whuber, thực tế là 20k + người đã đến đây để đặt câu hỏi về các kỹ thuật thường xuyên và nhận được câu trả lời hữu ích không ngụ ý rằng các kỹ thuật thường xuyên phù hợp hơn các kỹ thuật Bayes trong các trường hợp cụ thể đó; nó chỉ có nghĩa là chúng phổ biến.
amip

Câu trả lời:


7

Một ví dụ điển hình sẽ là một kịch bản cá cược trong đó một người thường xuyên và Bayesian đặt cược với nhau về một số kết quả trong tương lai và người thường xuyên có giá trị kỳ vọng tích cực.

Tôi sẽ không đưa ra ví dụ này bởi vì một ví dụ như vậy sẽ thiên về cách tiếp cận Bayes trừ khi Bayes chọn một ưu tiên xấu là một ví dụ đồng thanh toán không thực sự đáng để viết.

Cách tiếp cận thường xuyên nhất không được thiết kế để đạt được giá trị kỳ vọng cao nhất trong các kịch bản cá cược (may mắn là thế giới thống kê và xác suất rộng hơn nhiều so với điều đó). Thay vào đó, các kỹ thuật thường xuyên được thiết kế để đảm bảo các thuộc tính tần số mong muốn nhất định, đặc biệt là phạm vi bảo hiểm. Các tính chất này rất quan trọng để ước tính tham số và suy luận trong bối cảnh nghiên cứu và nghiên cứu khoa học.

Tôi khuyến khích bạn kiểm tra liên kết này ở đây đến một bài đăng trên blog của Tiến sĩ Larry Wasserman. Trong đó, ông nói về đảm bảo tần số sâu hơn (xem các ví dụ ông đưa ra).

Giả sử chúng tôi có một số dữ liệu và chúng tôi nghĩ rằng nó được phân phối theo một số phân phối có điều kiện (nếu bạn muốn bạn có thể tưởng tượng rằng được phân phối bình thường và là giá trị trung bình và \ hoặc phương sai). Chúng tôi không biết giá trị của , vì vậy chúng tôi phải ước tính nó. Chúng ta có thể sử dụng một cách tiếp cận thường xuyên hoặc Bayes để làm như vậy.YYf(Y|θ)Yθθ

Theo cách tiếp cận thường xuyên, chúng tôi sẽ có được ước tính điểm và khoảng tin cậy cho ước tính đó. Giả sử tồn tại và mô hình hợp lệ và hoạt động tốt, khoảng tin cậy thường xuyên được đảm bảo chứa % bất kể thời gian nào thực sự là . có thể là 0, có thể là 1.000.000, có thể là -53.2, không thành vấn đề, tuyên bố trên vẫn đúng.θ^θ(1α)θ (1α)θθ

Tuy nhiên, những điều trên không đúng với khoảng tin cậy Bayes hay còn gọi là khoảng tin cậy. Điều này là do, trong cài đặt Bayes, chúng ta phải chỉ định và mô phỏng từ phía sau, . Chúng tôi có thể hình thành % khoảng tin cậy bằng cách sử dụng mẫu kết quả, nhưng xác suất các khoảng này sẽ chứa tùy thuộc vào mức độ có thể xảy ra của . θπ(θ)π(θ|Y)f(Y|θ)π(θ)(1α)θθ

Trong kịch bản cá cược, chúng tôi có thể tin rằng các giá trị nhất định ít có khả năng là sau đó là các giá trị khác và chúng tôi có thể chỉ định trước để phản ánh những niềm tin này. Nếu niềm tin của chúng tôi là chính xác thì xác suất chứa trong khoảng tin cậy sẽ cao hơn. Đây là lý do tại sao những người thông minh sử dụng các kỹ thuật Bayes trong các tình huống cá cược đánh bại người thường xuyên.θ *θθ

Nhưng hãy xem xét một kịch bản khác, như một nghiên cứu mà bạn đang kiểm tra ảnh hưởng của giáo dục đối với tiền lương, gọi đó là , trong mô hình hồi quy. Rất nhiều nhà nghiên cứu muốn khoảng tin cậy của có thuộc tính tần số bảo hiểm hơn là phản ánh mức độ tin tưởng của chính họ về giáo dục hiệu quả đối với tiền lương.βββ

Từ quan điểm thực dụng, cũng cần lưu ý rằng trong ví dụ trước đây của tôi, khi kích thước mẫu tiến đến vô cùng, cả người thường xuyên và Bayesian posterior hội tụ vào . Vì vậy, khi bạn có được càng nhiều dữ liệu, sự khác biệt giữa phương pháp Bayes và người thường xuyên trở nên không đáng kể. Vì ước lượng Bayes thường (không phải luôn luôn) nghiêm ngặt hơn về mặt tính toán và toán học so với ước lượng thường xuyên, nên các học viên thường lựa chọn các kỹ thuật thường xuyên khi họ có bộ dữ liệu "lớn". Điều này đúng ngay cả khi mục tiêu chính là dự đoán trái ngược với ước tính / suy luận tham số. pi(θ|Y)θ*θ^π(θ|Y)θ


+1 nhưng liên quan đến ví dụ hồi quy của bạn (kiểm tra ảnh hưởng của giáo dục đối với tiền lương), trong khi tôi đồng ý rằng "rất nhiều nghiên cứu" (bao gồm cả bản thân tôi!) Thích sử dụng các quy trình thường xuyên, có nhiều người, bao gồm các nhà thống kê, nói rằng toàn bộ cách tiếp cận là sai lầm và không hoạt động đúng hoặc thậm chí như dự định. Đây không phải là nơi để tranh luận về nó, nhưng nên đề cập rằng quan điểm này cũng tồn tại.
amip

@amoeba, khá nhiều trong số những tranh luận đó không phải là về cách tiếp cận thường xuyên được sử dụng đúng cách mà là lạm dụng, lạm dụng và hiểu sai về chúng.
Giăng

Zachary, khi chủ đề này được đóng lại, bạn có phiền hay có lẽ thích hơn nếu câu trả lời của bạn được di chuyển trong thống kê.stackexchange.com /questions / 194035 ? Điều này có thể được thực hiện nếu chủ đề này được "hợp nhất" vào chủ đề đó (nghĩa là đóng lại dưới dạng trùng lặp và tất cả các câu trả lời được di chuyển). Tôi nghĩ rằng điều này có thể hữu ích.
amip

@amoeba chắc chắn, nếu bạn nghĩ rằng nó sẽ hữu ích.
Zachary Blumenfeld

1
"Tôi sẽ không đưa ra ví dụ này bởi vì một ví dụ như vậy sẽ thiên về cách tiếp cận Bayes trừ khi Bayes chọn một ưu tiên xấu trước đây là một ví dụ đồng thanh toán không thực sự đáng để viết." Tôi hoàn toàn không đồng ý với điều này. Đây là lý do cơ bản để xem xét thống kê thường xuyên ở nơi đầu tiên: các linh mục tốt rất khó để có được. Kết quả Bayes là trivially tốt hơn với một tốt trước, nhưng một việc có được một tốt trước là rất không tầm thường.
Vách đá AB
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.