Bằng phẳng, liên hợp và siêu linh mục. Họ là ai?


15

Tôi hiện đang đọc về Phương pháp Bayes trong Tiến hóa phân tử tính toán của Yang. Trong phần 5.2, nó nói về các linh mục, và đặc biệt là Không thông tin / căn hộ / mơ hồ / khuếch tán, liên hợp và siêu linh mục.

Điều này có thể yêu cầu đơn giản hóa, nhưng, ai đó có thể giải thích đơn giản sự khác biệt giữa các loại linh mục này và ảnh hưởng của kết quả phân tích / quyết định mà tôi sẽ đưa ra trong quá trình phân tích Bayes không?

(Tôi không phải là một nhà thống kê và tôi chỉ mới bắt đầu trên con đường tìm hiểu các phân tích Bayes vì ​​vậy càng nhiều về mặt giáo dân thì càng tốt)

Câu trả lời:


15

Nói một cách đơn giản, một căn hộ trước / không thông tin được sử dụng khi người ta có ít / không có kiến ​​thức về dữ liệu và do đó nó có ảnh hưởng ít nhất đến kết quả phân tích của bạn (tức là suy luận sau).

Phân phối liên hợp là những phân phối có phân phối trước và sau giống nhau và ưu tiên được gọi là phân phối trước. Nó được ưa chuộng vì sự tiện lợi của đại số , đặc biệt là khi khả năng có sự phân phối dưới dạng gia đình hàm mũ (Gaussian, Beta, v.v.). Điều này cực kỳ có lợi khi mang các mô phỏng sau sử dụng lấy mẫu Gibbs.

Và cuối cùng hãy tưởng tượng rằng một phân phối trước được đặt trên một tham số trong mô hình của bạn, tuy nhiên bạn muốn thêm một mức độ phức tạp / không chắc chắn khác. Sau đó, bạn sẽ áp đặt phân phối trước cho các tham số đã nói ở trên, do đó có tên siêu chiến binh.

Tôi nghĩ Phân tích dữ liệu Bayes của Gelman là một khởi đầu tuyệt vời cho bất cứ ai quan tâm đến việc học thống kê Bayes :)


1
Thứ hai chứng thực phân tích dữ liệu Bayes.
Sycorax nói phục hồi Monica

14

Ở cấp độ cao nhất, chúng ta có thể nghĩ về tất cả các cách thức của các linh mục khi chỉ định một số lượng thông tin mà nhà nghiên cứu mang theo để phân tích bên ngoài dữ liệu: trước khi xem dữ liệu, giá trị nào của các tham số có nhiều khả năng?

Trong thời kỳ đen tối của phân tích Bayes, khi những người Bayes chiến đấu với những người thường xuyên, có một niềm tin rằng nhà nghiên cứu sẽ muốn giới thiệu càng ít thông tin cho phân tích thông qua trước càng tốt. Vì vậy, có rất nhiều nghiên cứu và lập luận dành cho việc hiểu làm thế nào, chính xác, một ưu tiên có thể là "không thông tin" theo cách này. Hôm nay, Gelman lập luận chống lại sự lựa chọn tự động của các linh mục không thông tin, nói trong Phân tích dữ liệu Bayesrằng mô tả "không phù hợp" phản ánh thái độ của ông đối với ưu tiên, hơn là bất kỳ tính năng toán học "đặc biệt" nào trước đó. (Hơn nữa, có một câu hỏi trong tài liệu ban đầu về quy mô nào trước đó là không phù hợp. Tôi không nghĩ rằng điều này đặc biệt quan trọng đối với câu hỏi của bạn, nhưng để có một ví dụ hay về lập luận này từ quan điểm thường xuyên, hãy xem phần đầu của Gary King, Thống nhất phương pháp chính trị. )

Ưu tiên "phẳng" biểu thị đồng phục trước trong đó tất cả các giá trị trong phạm vi đều có khả năng như nhau. Một lần nữa, có những tranh luận về việc liệu những điều này có thực sự không có thông tin hay không, vì việc xác định rằng tất cả các giá trị đều có khả năng như nhau, theo một cách nào đó, thông tin và có thể nhạy cảm với cách mô hình được tham số hóa. Các linh mục phẳng có một lịch sử lâu dài trong phân tích Bayes, kéo dài trở lại Bayes và Laplace.

Một "mơ hồ" trước rất khuếch tán mặc dù không nhất thiết phải bằng phẳng và nó thể hiện rằng một phạm vi lớn các giá trị là hợp lý, thay vì tập trung khối lượng xác suất xung quanh phạm vi cụ thể. Về cơ bản, đó là một ưu tiên có phương sai cao (bất kể phương sai "cao" có nghĩa là gì trong bối cảnh của bạn).

Các linh mục liên hợp có một tính năng tiện lợi, khi được nhân với khả năng thích hợp, chúng tạo ra một biểu thức dạng đóng. Một ví dụ về điều này là bản beta trước với khả năng nhị thức, hoặc gamma trước khả năng poisson. Có những bảng hữu ích trong số này trên Internet và Wikipedia. Gia đình theo cấp số nhân là vô cùng thuận tiện trong vấn đề này.

Các linh mục liên hợp thường là lựa chọn "mặc định" cho một số vấn đề vì các đặc tính tiện lợi của chúng, nhưng điều này không nhất thiết có nghĩa là chúng là "tốt nhất" trừ khi kiến ​​thức trước của một người có thể được thể hiện thông qua liên hợp trước. Những tiến bộ trong tính toán có nghĩa là tính liên hợp không được đánh giá cao như trước đây (cf Gibbs lấy mẫu so với NUTS), vì vậy chúng ta có thể dễ dàng thực hiện suy luận với các linh mục không liên hợp mà không gặp nhiều rắc rối.

N(μ,σ2)μσ2μσ2


1
Ngoài ra, đôi khi không rõ 'dữ liệu' là gì và 'thông tin trước' là gì, hãy xem câu trả lời của tôi cho stats.stackexchange.com/questions/112451/ ví dụ.
kjetil b halvorsen
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.