Khi nào phương pháp Bayes thích hợp hơn với Người thường xuyên?


16

Tôi thực sự muốn tìm hiểu về các kỹ thuật Bayes, vì vậy tôi đã cố gắng dạy bản thân mình một chút. Tuy nhiên, tôi gặp khó khăn khi sử dụng các kỹ thuật Bayes từng có lợi thế hơn các phương pháp Thường xuyên. Ví dụ: Tôi đã thấy trong tài liệu một chút về cách một số sử dụng linh mục thông tin trong khi những người khác sử dụng thông tin không thông tin trước. Nhưng nếu bạn đang sử dụng một thông tin không có thông tin trước (có vẻ như rất phổ biến?) Và bạn thấy rằng phân phối sau là, phân phối beta ... bạn không thể vừa phù hợp với phân phối beta ngay từ đầu và được gọi có tốt không Tôi không thấy cách xây dựng một bản phân phối trước đó cho bạn biết điều gì ... có thể, thực sự có thể cho bạn biết bất cứ điều gì không?

Nó chỉ ra rằng một số phương pháp tôi đã sử dụng trong R sử dụng hỗn hợp các phương pháp Bayes và Thường xuyên (các tác giả thừa nhận điều này hơi không nhất quán) và tôi thậm chí không thể nhận ra phần nào là Bayesian. Ngoài việc phù hợp với phân phối, tôi thậm chí không thể hiểu được bạn sẽ sử dụng các phương pháp Bayes như thế nào. Có "hồi quy Bayes" không? Nó sẽ trông như thế nào? Tất cả những gì tôi có thể tưởng tượng là đoán đi phân phối cơ bản hết lần này đến lần khác trong khi Người thường xuyên nghĩ về một số dữ liệu, nhìn vào nó, thấy một bản phân phối Poisson và chạy GLM. (Đây không phải là một lời chỉ trích ... Tôi thực sự không hiểu!)

Vì vậy, có thể một số ví dụ cơ bản sẽ giúp đỡ? Và nếu bạn biết một số tài liệu tham khảo thực tế cho những người mới bắt đầu thực sự như tôi, điều đó cũng thực sự hữu ích!


Có thể trùng lặp điều này ?
Glen_b -Reinstate Monica

Er, hình như thế nào? Chào mừng bạn đến gần vì điều đó đến gần để trả lời câu hỏi của tôi. Tôi vẫn tự hỏi về các tình huống đơn giản hơn mà tôi đã mô tả (vì tôi chưa bao giờ nghe về các kỹ thuật được liệt kê trên luồng đó) nhưng tôi cho rằng câu trả lời của tôi là mọi người KHÔNG sử dụng các kỹ thuật bayesian để hồi quy / vv bởi vì các kỹ thuật thường xuyên được thiết lập và dễ dàng tồn tại?
HFBrown

2
Người ta sử dụng kỹ thuật Bayes cho hồi quy. Nhưng vì các phương pháp thường xuyên rất thuận tiện và nhiều người thực dụng về cách tiếp cận họ sử dụng, nên những người thường sử dụng sẽ sử dụng hồi quy thông thường nếu không cần điều gì phức tạp hơn. Nhưng ngay khi bạn cần giải quyết một chút phức tạp hơn, hoặc chính thức kết hợp thông tin trước đó, hoặc bất kỳ lý do nào khác thì công việc bổ sung khiêm tốn trong phương pháp Bayesian bắt đầu có vẻ tốt.
Glen_b -Reinstate Monica

Điều đó có ý nghĩa, cảm ơn bạn. Đọc xung quanh một số chủ đề khác cũng đã làm rõ việc sử dụng cho tôi.
HFBrown

Một cái gì đó khác có liên quan .. đối với hồi quy trong môi trường Bayes, các linh mục được sử dụng nhiều nhất cho các hệ số là Bình thường đa biến và Laplace đa biến. Việc sử dụng các mục sư này có tác dụng đưa ra các hình phạt co ngót cho các hệ số, làm cho chúng tương đương với sử dụng hồi quy sườn hoặc LASSO, tương ứng, nếu người ta lấy ước tính MAP của các hệ số sau thuật toán Bayes. Việc tính toán các kết quả này theo cách không hoàn toàn Bayesian sẽ kinh tế hơn nhiều và nếu về cơ bản chúng tương đương .. tại sao phải bận tâm?

Câu trả lời:


10

Dưới đây là một số liên kết có thể khiến bạn quan tâm khi so sánh các phương pháp thường xuyên và Bayes:

Tóm lại, theo cách tôi hiểu, được cung cấp một bộ dữ liệu cụ thể, người thường xuyên tin rằng có một phân phối cơ bản, thực sự mà từ đó dữ liệu được tạo ra. Không thể có được các tham số chính xác là một hàm của cỡ mẫu hữu hạn. Mặt khác, Bayes nghĩ rằng chúng ta bắt đầu với một số giả định về các tham số (ngay cả khi không biết) và sử dụng dữ liệu để tinh chỉnh ý kiến ​​của chúng tôi về các tham số đó. Cả hai đang cố gắng phát triển một mô hình có thể giải thích các quan sát và đưa ra dự đoán; sự khác biệt là trong các giả định (cả thực tế và triết học). Là một tuyên bố chính đáng, không nghiêm ngặt, người ta có thể nói rằng người thường xuyên tin rằng các tham số là cố định và dữ liệu là ngẫu nhiên; Bayesian tin rằng dữ liệu là cố định và các tham số là ngẫu nhiên. Cái nào tốt hơn hay thích hơn? Để trả lời rằng bạn phải đào sâu và nhận ranhững giả định nào mà mỗi đòi hỏi (ví dụ như các tham số bình thường không có triệu chứng?).


2
Rất nhiều câu trả lời hay và thú vị, nhưng điều này đã trả lời câu hỏi của tôi trực tiếp nhất. Cảm ơn
HFBrowning

@Avraham liên kết đầu tiên bị hỏng
Erik Hambardzumyan

8

Một trong nhiều khía cạnh thú vị của sự tương phản giữa hai cách tiếp cận là rất khó có cách giải thích chính thức cho nhiều đại lượng chúng ta có được trong miền thường xuyên. Một ví dụ là tầm quan trọng ngày càng tăng của các phương pháp xử phạt (co ngót). Khi một người có được ước tính khả năng tối đa bị phạt, ước tính điểm sai lệch và "khoảng tin cậy" là rất khó để giải thích. Mặt khác, phân phối sau Bayes cho các tham số bị phạt về 0 bằng cách sử dụng phân phối trước tập trung quanh 0 có các cách hiểu hoàn toàn tiêu chuẩn.


1
đây là một quan điểm tốt. Tôi tự hỏi nếu điều đó chủ yếu là đúng khi lambda được chọn a-prori, mặc dù. Thông thường, người ta có thể chọn lambda bằng cách sử dụng xác thực chéo để tối ưu hóa lỗi dự đoán mẫu. Trong trường hợp đó, tôi cảm thấy kỳ lạ khi nói rằng lambda tương đương với 'thông tin trước' mà bạn đã mang đến phân tích.
gung - Phục hồi Monica

1
λ= =σ-2λ

3
Tôi muốn nói Lambda là một siêu tham số của trước đó (vì có nhiều Bayes hơn, bạn có thể có một siêu ưu tiên và ngoài lề về điều đó cũng như jmlr.org/ con / vololume8 / cawley07a / cawley07a.pdf )
Dikran Marsupial

5

Tôi đang ăn cắp bán buôn này từ nhóm người dùng Stan. Michael Betancourt đã cung cấp cuộc thảo luận thực sự tốt về nhận dạng này trong suy luận Bayes, mà tôi tin rằng có yêu cầu của bạn về sự tương phản của hai trường thống kê.

Sự khác biệt đầu tiên với phân tích Bayes sẽ là sự hiện diện của các linh mục, ngay cả khi yếu, sẽ buộc khối lượng sau cho 4 tham số đó vào một vùng lân cận hữu hạn (nếu không bạn sẽ không có giá trị trước ở vị trí đầu tiên). Mặc dù vậy, bạn vẫn có thể không nhận dạng theo nghĩa là hậu thế sẽ không hội tụ đến một khối điểm trong giới hạn của dữ liệu vô hạn. Tuy nhiên, theo một nghĩa rất thực, điều đó không thành vấn đề bởi vì (a) giới hạn dữ liệu vô hạn không phải là bất kỳ cách nào và (b) suy luận Bayes không báo cáo ước tính điểm mà là phân phối. Trong thực tế việc không nhận dạng như vậy sẽ dẫn đến mối tương quan lớn giữa các tham số (thậm chí có thể không lồi) nhưng một phân tích Bayes thích hợp sẽ xác định các mối tương quan đó. Ngay cả khi bạn báo cáo các tham số đơn lẻ bạn '

μ1μ2N(x|μ1+μ2,σ)μ1+μ2= =0μ1μ2 tại bất kỳ điểm nào trên đường thẳng đó sẽ rất nhỏ, mặc dù thực tế là các tham số không thể thực sự được xác định.

μ1μ2μ1μ2


3

Sự khác biệt chính giữa phương pháp tiếp cận Bayes và người theo chủ nghĩa thường xuyên nằm ở định nghĩa xác suất, vì vậy nếu cần phải xử lý nghiêm ngặt các tần suất dài hạn thì phương pháp tiếp cận thường xuyên là hợp lý, nếu không thì bạn nên sử dụng phương pháp Bayesian. Nếu một trong hai cách giải thích được chấp nhận, thì phương pháp tiếp cận Bayes và thường xuyên có thể là hợp lý.

Một cách khác để đặt nó, là nếu bạn muốn biết những suy luận nào bạn có thể rút ra từ một thí nghiệm cụ thể, bạn có thể muốn trở thành Bayes; nếu bạn muốn đưa ra kết luận về một số dân số thí nghiệm (ví dụ: kiểm soát chất lượng) thì các phương pháp thường xuyên rất phù hợp.

Về cơ bản, điều quan trọng là phải biết câu hỏi nào bạn muốn trả lời, và chọn hình thức phân tích trả lời câu hỏi trực tiếp nhất.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.