Khi nào nên sử dụng kỹ thuật bootstrap so với bayesian?


12

Tôi có một vấn đề phân tích quyết định khá phức tạp liên quan đến kiểm tra độ tin cậy và cách tiếp cận logic (với tôi) dường như liên quan đến việc sử dụng MCMC để hỗ trợ phân tích Bayes. Tuy nhiên, nó đã được đề xuất rằng nó sẽ phù hợp hơn để sử dụng một phương pháp bootstrapping. Ai đó có thể đề xuất một tài liệu tham khảo (hoặc ba) có thể hỗ trợ việc sử dụng một trong hai kỹ thuật khác (ngay cả đối với các tình huống cụ thể) không? FWIW, tôi có dữ liệu từ nhiều nguồn khác nhau và các quan sát thất bại ít / không. Tôi cũng có dữ liệu ở cấp hệ thống con và hệ thống.

Có vẻ như một so sánh như thế này sẽ có sẵn, nhưng tôi đã không may mắn tìm kiếm các nghi phạm thông thường. Cảm ơn trước cho bất kỳ con trỏ.


1
Cho rằng bootstrap cổ điển có thể được coi là một phương pháp khả năng tối đa do máy tính thực hiện (tức là một kỹ thuật không bay (trước phẳng)), sẽ tốt hơn nếu bạn viết lại câu hỏi của bạn thành một câu như "khi nào nên sử dụng kỹ thuật thường xuyên so với kỹ thuật bayesian ? " Một số nền tảng về bootstrap: stats.stackexchange.com/questions/18469/iêu
Yevgeny

1
Hmmm..Tôi đoán tôi không đồng ý. Hy vọng rằng 'bootstrap' đặc biệt gợi ý đặc tính của khoảng; tập trung hơn một chút so với chỉ là 'người thường xuyên'. Ít nhất 'bootstrap' sẽ giữ hầu hết những kẻ cuồng tín tôn giáo. Ngoài ra, cảm ơn vì liên kết, nhưng tôi đã quen với nhận xét trước đó của bạn trước khi tôi đăng bài này.
Aengus

1
Hãy để tôi nói lại, bạn có bất kỳ thông tin hữu ích trước, hoặc vấn đề có cấu trúc phân cấp (lồng nhau) không? Nếu vậy, thì một kỹ thuật bayes có lẽ tốt hơn (đặc biệt là nếu số lượng tham số mô hình lớn so với lượng dữ liệu có sẵn, vì vậy ước tính sẽ được hưởng lợi từ "thu hẹp bayes"). Nếu không thì MLE / bootstrap là đủ.
Yevgeny

Tôi đoán một cách tiếp cận khả thi khác là sử dụng các mô hình hiệu ứng hỗn hợp (ví dụ: sử dụng gói R lme4) để mô hình hóa cấu trúc phân cấp mà bạn đã đưa ra. Điều đó cũng sẽ giúp ổn định các ước tính cho các mô hình (phân cấp) với số lượng lớn tham số.
Yevgeny

1
Một phân tích bootstrap rất có thể được xem như là một phân tích Bayes, vì vậy câu hỏi của bạn gần như là "Khi nào nên sử dụng bootstrap so với một mô hình Bayes khác" (Câu hỏi của bạn đã thúc đẩy tôi viết ra cách giải thích này về bootstrap như một mô hình Bayes : sumsar.net/blog/2015/04/ .). Đưa ra câu hỏi, tôi đồng ý với @Yevgeny rằng chúng tôi có thể sẽ cần thêm thông tin liên quan đến vấn đề cụ thể của bạn trước khi chúng tôi có thể đề xuất một mô hình.
Rasmus Bååth

Câu trả lời:


15

Theo suy nghĩ của tôi, mô tả vấn đề của bạn chỉ ra hai vấn đề chính. Đầu tiên:

Tôi có một phân tích quyết định khá phức tạp ...

Giả sử bạn đã có chức năng mất trong tay, bạn cần phải quyết định xem bạn có quan tâm đến rủi ro thường xuyên hay mất sau dự kiến ​​hay không . Bootstrap cho phép bạn xấp xỉ các chức năng của phân phối dữ liệu, vì vậy nó sẽ giúp với cái trước; và các mẫu sau từ MCMC sẽ cho phép bạn đánh giá cái sau. Nhưng...

Tôi cũng có dữ liệu ở cấp hệ thống con và hệ thống

vì vậy những dữ liệu này có cấu trúc phân cấp. Cách tiếp cận Bayes mô hình dữ liệu rất tự nhiên, trong khi bootstrap ban đầu được thiết kế cho dữ liệu được mô hình hóa như iid Trong khi nó được mở rộng thành dữ liệu phân cấp (xem tài liệu tham khảo trong phần giới thiệu của bài viết này ), cách tiếp cận như vậy tương đối kém phát triển (theo bản tóm tắt của bài viết này ).

Tóm lại: nếu đó thực sự là rủi ro thường xuyên mà bạn quan tâm, thì một số nghiên cứu ban đầu trong việc áp dụng bootstrap vào lý thuyết quyết định có thể là cần thiết. Tuy nhiên, nếu giảm thiểu tổn thất dự kiến ​​sau sẽ phù hợp tự nhiên hơn với vấn đề quyết định của bạn, Bayes chắc chắn là con đường để đi.


Cảm ơn, tôi đã không chạy qua một trong hai; bài viết sau có vẻ đặc biệt thú vị.
Aengus

5

Tôi đã đọc rằng bootstrap không tham số có thể được xem là trường hợp đặc biệt của mô hình Bayes với một thông tin (rất) rời rạc trước đó, trong đó các giả định được đưa ra trong mô hình là dữ liệu rời rạc và miền của phân phối mục tiêu của bạn được quan sát hoàn toàn trong mẫu của bạn.

Đây là hai tài liệu tham khảo:

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.