Sử dụng giả linh mục đúng cách trong lựa chọn mô hình Bayes


8

Một cách tiếp cận để so sánh mô hình trong khung Bayes sử dụng biến chỉ báo Bernoulli để xác định mô hình nào trong hai mô hình có khả năng là "mô hình thực". Khi áp dụng các công cụ dựa trên MCMC để phù hợp với một mô hình như vậy, người ta thường sử dụng các giả giả để cải thiện việc trộn trong các chuỗi. Xem ở đây để có một điều trị rất dễ tiếp cận về lý do tại sao các linh mục giả là hữu ích.

Trong bài báo chuyên đề của họ về chủ đề này, Carlin & Chib (tr. 475) nói rằng "hình thức [giả trước đó] không liên quan", mà tôi cho rằng nó không ảnh hưởng đến suy luận sau dựa trên mô hình (mặc dù nó có thể ảnh hưởng đến việc trộn MCMC trong quá trình lắp mô hình). Tuy nhiên, sự hiểu biết của tôi là hình thức của DOES giả trước đó. Tôi đã hỏi về điều này trước đây trong câu hỏi này . @ Xi'an nhận xét (bình luận thứ 4): " suy luận về mô hình nào là đúng không phụ thuộc vào các thầy tu giả ".

Gần đây tôi đọc những bình luận từ Martyn Plummer mâu thuẫn với sự hiểu biết của tôi về Carlin & Chib. Martyn nói: " Để phương pháp Carlin-Chib hoạt động, giả trước phải phù hợp với hậu thế khi mô hình là đúng. "

(Tôi KHÔNG nói rằng Plummer mâu thuẫn với Carlin & Chib; chỉ có điều anh ấy mâu thuẫn với sự hiểu biết của tôi về yêu cầu của Carlin & Chib).

Tất cả điều này để lại cho tôi năm câu hỏi:

  1. Chuyện gì đang xảy ra ở đây? Với điều kiện mô hình hội tụ và mang lại kích thước mẫu hiệu quả tốt từ phía sau, liệu suy luận của tôi về biến nào sẽ bao gồm trong mô hình phụ thuộc vào giả trước của tôi?
  2. Nếu không, làm thế nào để chúng ta vuông nó với trực giác của tôinhận xét của Plummer ? Nếu vậy, làm thế nào để chúng ta vuông nó với giấy của Carlin & Chibbình luận của Xi'an (bình luận thứ 4) ?
  3. Nếu sự hiểu biết của tôi về nhận xét của Plummer là chính xác, và các linh mục giả phải tương ứng với hậu thế khi bao gồm biến số ... điều này có nghĩa là nó không thể chấp nhận được đối với các linh mục giả tương ứng chính xác với các linh mục thực sự? Điều này có nghĩa là các linh mục giả không chỉ là một kỹ thuật thuận tiện để cải thiện sự pha trộn trong MCMC !!
  4. Điều gì xảy ra nếu biến chỉ báo bật và tắt một phần của mô hình với một vài tham số (ví dụ: hiệu ứng ngẫu nhiên với trung bình lớn, phương sai và hiệu ứng nhóm n )? Điều nào sau đây được cho phép (theo thứ tự tôi tin tưởng rằng phương pháp này được cho phép) như thế nào? Có cách tiếp cận nào tốt hơn mà tôi không liệt kê?

    Tôi. Sử dụng giả trước đó xấp xỉ phân phối khớp sau đầy đủ của tất cả các tham số.

    ii. Nếu sự pha trộn được chấp nhận là không tàn bạo, thì đừng sử dụng các linh mục giả (ví dụ: sử dụng các linh mục giả tương đương với các linh mục thực sự).

    iii. Sử dụng giả trước dựa trên các phân phối sau đơn biến cho từng tham số, nhưng đừng lo lắng về cách chúng được phân phối chung.

    iv. Theo ngôn ngữ rõ ràng đơn giản của Carlin & Chib, sử dụng bất kỳ giả trước nào mang lại hiệu quả tính toán trong chuỗi MCMC, vì "hình thức [giả trước] không liên quan".

  5. @ Xi'an có ý nghĩa gì trong bình luận đầu tiên về câu hỏi của tôi khi nói rằng " các giáo sĩ giả cần điều chỉnh trong một kiểu lấy mẫu quan trọng. "


Bạn đã kiểm tra câu hỏi tương tự này ? Nó chỉ ra rằng Phân tích dữ liệu Bayes 2ed của Kruschke, đang sử dụng phương pháp của Carlin và Chib [chương 10]. Đây sẽ là một giới thiệu mềm cho phương pháp nếu giấy gốc nghe có vẻ quá cứng.
Tây An

Câu trả lời:


3
  1. Chuyện gì đang xảy ra ở đây?

Đây là một câu hỏi rất chung chung với câu trả lời rõ ràng để nghiên cứu chi tiết Carlin & Chib (1995) . Ý tưởng thiết yếu là xem xét các tham số chung(m,θ1,θ2) Ở đâu m biểu thị chỉ số mô hình (m=1,2) và θ1,θ2 các tham số của cả hai mô hình, theo nghĩa là dữ liệu đến từ mật độ

f(x|m,θ1,θ2)=fm(x|θm)
tức là một trong hai tham số θ3m là không cần thiết một khi chỉ số mô hình m được thiết lập.

Sau khi hoàn thành xong, phải chọn trước (m,θ1,θ2), đó là

π(m,θ1,θ2)=π(m)πm(θm)π~m(θ3m)
nơi tôi biểu thị bởi π(m)πm(θm)các linh mục thực sự trên chỉ số mô hình và về tham số của từng mô hình. Bổ sungπ~m(θ3m) là miễn phí vì sau θ3m bằng với trước:
π(m,θ1,θ2|x)=π(m|x)πm(θm|x)π~m(θ3m)
Dữ liệu không ảnh hưởng đến tham số mà nó không phụ thuộc. Và do đó suy luận vềθm không bị ảnh hưởng bởi sự lựa chọn của π~m(.). Trong thực tế, điều này có nghĩa là thuật toán mô phỏng từ mô hình tăng cường tạo ra
  1. một tần số cho mỗi mô hình xấp xỉ xác suất sau của mô hình này
  2. một chuỗi các tham số θm khi nào m là chỉ số mô hình, được sử dụng để suy luận về tham số này
  3. một chuỗi các tham số θ3m khi nào m là chỉ số mô hình, được bỏ qua.
  1. Làm thế nào để chúng ta vuông nó với trực giác của tôi và nhận xét của Plummer?

Ý nghĩa của Martyn Plummer trong nhận xét của anh ta là giả trước không quan trọng đối với tham số với chỉ số khác m nhưng phải là đúng trước trên tham số với chỉ số hiện tại 3m. Điều này phù hợp 100% với giấy Carlin & Chib (1995) .

  1. điều này có nghĩa là nó không thể chấp nhận được đối với các linh mục giả tương ứng chính xác với các linh mục thực sự?

Linh mục giả có thể được coi là linh mục thực sự, miễn là những điều này là đúng. Nhưng như Carlin & Chib (1995) chỉ ra, sẽ hiệu quả hơn nhiều khi lấy một xấp xỉ của hậu thế thực sự,π3m(θ3m|x), xấp xỉ có thể đạt được bằng cách chạy MCMC sơ bộ cho từng mô hình.

  1. Điều gì xảy ra nếu biến chỉ báo bật và tắt một phần của mô hình với một vài tham số

Độ phân giải của câu hỏi hóc búa này là xem xét các bộ tham số khác nhau cho tất cả các mô hình khác nhau, nghĩa là không có tham số chung giữa hai mô hình bất kỳ. Nếu bạn đang ở trong một vấn đề lựa chọn biến, điều này có nghĩa là sử dụng một tham số khác và ký hiệu khác cho hệ số của biếnX1 khi nào X2 là một phần của hồi quy và khi X2không phải là một phần của hồi quy. Từ thời điểm này, sử dụng bất kỳ giả trước nào bạn muốn trên các tham số thừa.

  1. @ Xi'an nghĩa là gì trong bình luận đầu tiên

Ý tôi là nếu xác suất truy cập vào hai mô hình không phải là xác suất trước đó, thì xác suất sau của một mô hình được ước tính theo tần số mô phỏng phải được sửa.


Tôi tôn trọng chuyên môn của bạn trong vấn đề này và tôi tin rằng câu trả lời này là đúng. Tuy nhiên, tôi cảm thấy khó khăn khi bình luận câu trả lời này với nhận xét đầy đủ của Plummer, trong đó anh ấy gợi ý "Điều chỉnh mô hình 1 sau khi thêm mục nhập m = 1 vào dữ liệu (buộc mô hình 1 là đúng). Theo dõi các giá trị của a1 [1] , b1 [1] và c1 [1]. Đặt giả trước cho a1 [2], b1 [2], c1 [2] sao cho khớp với các khoảnh khắc sau của a1 [1], b1 [1] và c1 [ 1], Thực hiện tương tự cho mô hình 2 nhưng với m = 2 trong dữ liệu. Đặt giả trước cho a2 [1], b2 [1], c2 [1] để khớp với các khoảnh khắc sau của a2 [2], b2 [ 2] và c2 [2] trong mô hình này. "
Jacob Socolar

Đây chỉ là một sự lựa chọn (hợp lệ) của giả trước.
Tây An

Tuyệt quá. Vì vậy, nhược điểm cuối cùng của tôi là bình phương những câu trả lời sau đây. Nếu mô hình 1 có các giả ngẫu nhiên không chồng chéo mạnh mẽ vào khối sau và mô hình 2 có các giả ngẫu nhiên tốt và hai mô hình có xác suất sau tương tự được cung cấp dữ liệu, sẽ dễ dàng nhảy từ 1 đến 2 và khó nhảy từ 2 đến 1. Tôi không thể hiểu làm thế nào điều này không khiến MCMC dành nhiều thời gian hơn trong mô hình 2, dẫn đến suy luận sau không hợp lệ trên m. Nhận xét đầy đủ của Plummer có vẻ như nó sẽ giải quyết vấn đề này (vấn đề sai?).
Jacob Socolar

Một MCMC không hiệu quả không thường xuyên truy cập vào một khu vực cụ thể sẽ bù lại bằng cách ở lại rất lâu trong khu vực đó để trung bình nó có đúng thời gian.
Tây An

Cảm ơn một lần nữa. Câu hỏi cuối cùng: Rõ ràng tôi không hiểu đầy đủ về Carlin & Chib. Bạn có thể xác định những gì tôi đang thiếu? Bởi vì tôi nghĩ rằng chuỗi Markov cho m nên đi bộ ngẫu nhiên trong đó xác suất mỗi bước chuyển sang 2 (cho m = 1) thấp hơn xác suất mỗi bước chuyển sang 1 (cho m = 2)? Khi m = 1, các tham số của mô hình 2 được lấy mẫu từ các giả danh (không tốt) của họ, vì vậy thật khó chấp nhận đề xuất trong đó m = 2. Nhưng khi m = 2, các tham số của mô hình 1 được lấy mẫu từ các giả danh (tốt) của họ, do đó, có thể dễ dàng chấp nhận đề xuất trong đó m = 1.
Jacob Socolar
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.