Tính toán khả năng cận biên từ các mẫu MCMC


24

Đây là một câu hỏi định kỳ (xem bài này , bài nàybài này ), nhưng tôi có một spin khác.

Giả sử tôi có một loạt các mẫu từ bộ lấy mẫu MCMC chung. Đối với mỗi mẫu , tôi biết giá trị của khả năng ghi nhật ký và của nhật ký trước . Nếu nó hữu ích, tôi cũng biết giá trị của khả năng ghi nhật ký trên mỗi điểm dữ liệu, (thông tin này giúp với một số phương thức nhất định, như WAIC và PSIS-LOO).θlogf(x|θ)logf(θ)logf(xi|θ)

Tôi muốn có được ước tính (thô) về khả năng cận biên, chỉ với các mẫu mà tôi có, và có thể một vài đánh giá chức năng khác (nhưng không chạy lại MCMC ad hoc ).

Trước hết, hãy dọn bàn. Chúng ta đều biết rằng công cụ ước tính điều hòa là công cụ ước tính tồi tệ nhất . Tiếp tục nào. Nếu bạn đang thực hiện lấy mẫu Gibbs với các linh mục và hậu thế ở dạng kín, bạn có thể sử dụng phương pháp của Chib ; nhưng tôi không chắc làm thế nào để khái quát bên ngoài những trường hợp đó. Ngoài ra còn có các phương pháp yêu cầu bạn sửa đổi quy trình lấy mẫu (chẳng hạn như thông qua hậu thế nóng nảy ), nhưng tôi không quan tâm đến điều đó ở đây.

Cách tiếp cận tôi nghĩ đến bao gồm xấp xỉ phân phối cơ bản với hình dạng tham số (hoặc không tham số) , và sau đó tìm ra hằng số chuẩn hóa là một vấn đề tối ưu hóa 1-D (nghĩa là giảm thiểu một số lỗi giữa và , được đánh giá trên các mẫu). Trong trường hợp đơn giản nhất, giả sử rằng phần sau gần như đa biến bình thường, tôi có thể điều chỉnh như một đa biến bình thường và nhận được một cái gì đó tương tự như một xấp xỉ Laplace (tôi có thể muốn sử dụng một vài đánh giá chức năng bổ sung để tinh chỉnh vị trí của chế độ). Tuy nhiên, tôi có thể sử dụng nhưg(θ)ZZZg(θ)f(x|θ)f(θ)g(θ)g(θ)một gia đình linh hoạt hơn như một hỗn hợp đa dạng của các phân phối đa biến .t

Tôi đánh giá cao phương pháp này chỉ hoạt động nếu là một xấp xỉ hợp lý với , nhưng bất kỳ lý do hoặc câu chuyện cảnh báo nào về lý do tại sao nó sẽ rất không khôn ngoan làm đi? Bất kỳ đọc mà bạn muốn giới thiệu?Zg(θ)f(x|θ)f(θ)

Cách tiếp cận hoàn toàn không tham số sử dụng một số họ không tham số, chẳng hạn như quy trình Gaussian (GP), để xấp xỉ (hoặc một số biến đổi phi tuyến khác của nó, chẳng hạn là căn bậc hai) và phương trình Bayesian để tích hợp hoàn toàn vào mục tiêu cơ bản (xem tại đâyđây ). Đây có vẻ là một cách tiếp cận thay thế thú vị, nhưng tương tự về tinh thần (cũng vậy, lưu ý rằng GP sẽ khó sử dụng trong trường hợp của tôi).logf(x|θ)+logf(θ)


6
Tôi nghĩ rằng Chib, S. và Jeliazkov, I. 2001 "Khả năng cận biên từ đô thị - sản lượng của Hastings" khái quát đến các đầu ra MCMC bình thường - sẽ rất thích nghe những kinh nghiệm với phương pháp này. Đối với GP - về cơ bản, điều này tập trung vào việc mô phỏng hậu thế, mà bạn cũng có thể xem xét cho các vấn đề khác. Tôi đoán vấn đề là bạn không bao giờ chắc chắn về chất lượng của xấp xỉ. Điều tôi cũng thắc mắc là liệu một mẫu MCMC có lý tưởng cho mô hình GP hay không, liệu bạn có nên đầu tư nhiều hơn vào đuôi hay không.
Florian Hartig

2
(+1) Cảm ơn bạn đã tham khảo, hãy chú ý - Tôi sẽ kiểm tra nó. Tôi đồng ý rằng tất cả các cách tiếp cận dựa trên mô hình có thể có vấn đề (điều tốt với phương trình Bayes là bạn có được ước tính về độ không đảm bảo, mặc dù không chắc nó được hiệu chỉnh như thế nào). Hiện tại, mục tiêu khiêm tốn của tôi là làm một việc gì đó "tốt hơn so với xấp xỉ Laplace".
lacerbi

Câu trả lời:


26

Phần mở rộng của Chib và Jeliazkov (2001) không may bị biến đổi nhanh chóng hoặc rất tốn kém, đó là lý do tại sao nó không được sử dụng nhiều ngoài các trường hợp lấy mẫu Gibbs.

Trong khi có rất nhiều cách và phương pháp hằng số bình thường vấn đề ước lượng (được minh họa bằng các cuộc đàm phán khá đa dạng trong các hội thảo liên tục Ước tính chúng tôi chạy vào tuần trước tại Đại học Warwick, slide sẵn ), một số giải pháp làm khai thác trực tiếp đầu ra MCMC.Z

  1. Như bạn đã đề cập, công cụ ước lượng trung bình hài hòa của Newton và Raftery (1994) hầu như không bao giờ nghèo vì có phương sai vô hạn. Tuy nhiên, có nhiều cách để tránh lời nguyền phương sai vô hạn bằng cách sử dụng thay vào đó là mục tiêu hỗ trợ hữu hạn trong danh tính trung bình hài hòa bằng cách chọn làm chỉ báo của vùng HPD cho hậu thế. Điều này đảm bảo phương sai hữu hạn bằng cách loại bỏ các đuôi trong trung bình hài. (Chi tiết sẽ được tìm thấy trong một bài báo mà tôi đã viết với Darren Wraith và trong một chương về bình thường hóa các hằng số được viết bằng Jean-Michel Marin.) Tóm lại, phương pháp này tái chế đầu ra MCMC alphaθ1,...,θMβ

    α(θ)π(θ)f(x|θ)dπ(θ|x)=1Z
    αθ1,,θMbằng cách xác định (20% nói) giá trị lớn nhất của mục tiêu và tạo như một sự thống nhất trên sự kết hợp của các quả bóng tập trung tại các mô phỏng mật độ lớn nhất (HPD) và với bán kính , có nghĩa là ước tính hằng số chuẩn hóa được đưa ra bởi βπ(θ)f(x|θ)αθi0ρZ dθραM2βM21
    Z^1=1βM2m=1Mdouble sum overβM ball centres θi0and M simulations θmI(0,ρ)(mini||θmθi0||){π(θm)f(x|θm)}1/πd/2ρdΓ(d/2+1)1volume of ball with radius ρβMα(θm)π(θm)f(x|θm)
    nếu là kích thước của (hiệu chỉnh áp dụng cho các quả bóng giao nhau) và nếu đủ nhỏ để các quả bóng không bao giờ giao nhau (nghĩa là chỉ có một chỉ số trên các quả bóng khác với số không). Giải thích cho mẫu số là đây là tổng hai lầndθραM2βM2 điều khoản: với mỗi thuật ngữ trong tích hợp với .
    1βMi=1βM1Mm=1MU(θi0,ρ)(θm)same as with min×1π(θm)f(x|θm)
    Z - 1θmZ1
  2. Một cách tiếp cận khác là biến hằng số chuẩn hóa thành một tham số. Điều này nghe có vẻ như một dị giáo thống kê nhưng bài báo của Guttmann và Hyvärinen (2012) đã thuyết phục tôi về điều ngược lại. Không cần quá nhiều chi tiết, ý tưởng gọn gàng trong đó là biến khả năng ghi nhật ký quan sát vào một khả năng đăng nhập chung là khả năng đăng nhập của quy trình điểm Poisson với chức năng cường độ n Σ i = 1 f ( x i | q ) - n log exp f ( x | q ) d x n Σ i = 1 [ f ( x i | q ) + ν ] - n exp f ( xZ

    i=1nf(xi|θ)nlogexpf(x|θ)dx
    exp {
    i=1n[f(xi|θ)+ν]nexp[f(x|θ)+ν]dx
    exp{f(x|θ)+ν+logn}
    Đây là một mô hình thay thế trong đó khả năng ban đầu không xuất hiện như là một biên của những điều trên. Chỉ có các chế độ trùng khớp, với chế độ có điều kiện trong ν cung cấp hằng số chuẩn hóa. Trong thực tế, khả năng quá trình Poisson ở trên là không có sẵn và Guttmann và Hyvärinen (2012) đưa ra một xấp xỉ bằng phương pháp hồi quy logistic. Để kết nối tốt hơn với câu hỏi của bạn, ước tính của Geyer là MLE, do đó giải pháp cho vấn đề tối đa hóa.
  3. Một cách tiếp cận được kết nối là phương pháp hồi quy logistic của Charlie Geyer . Khái niệm cơ bản là thêm vào mẫu MCMC từ một mẫu khác từ một mục tiêu đã biết, ví dụ: dự đoán tốt nhất của bạn tại , và để chạy hồi quy logistic trên chỉ mục phân phối phía sau dữ liệu (1 cho và 0 cho ). Với các biến hồi quy là giá trị của cả hai mật độ, có chuẩn hóa hay không. Điều này xảy ra được liên kết trực tiếp với lấy mẫu cầu Gelman và Meng (1997), cũng tái chế các mẫu từ các mục tiêu khác nhau. Và các phiên bản mới hơn, như MLE của Meng.π(θ|x)π(θ|x)g(θ)π(θ|x)g(θ)
  4. Một cách tiếp cận khác nhau buộc người ta phải chạy một bộ lấy mẫu MCMC cụ thể là lấy mẫu lồng nhau của Skilling . Mặc dù tôi [và những người khác] có một số bảo lưu về hiệu quả của phương pháp, nhưng nó khá phổ biến trong khoa tĩnh điện và vũ trụ học, với phần mềm có sẵn như multinest .
  5. Một giải pháp [tiềm năng nếu không phải lúc nào cũng có thể] là khai thác đại diện Savage-Dickey của nhân tố Bayes trong trường hợp giả thuyết null được nhúng. Nếu null viết là về một tham số quan tâm và nếu là phần [phiền toái] còn lại của tham số của mô hình, giả sử trước một dạng , hệ số Bayes của so với thay thế ghi là trong đó biểu thị mật độ sau biên của ở giá trị cụ thểH0:θ=θ0ξπ1(θ)π2(ξ)H0 πθ(θ0|x)θθ0H0:θ=θ0m0(x)=Ξf(x|θ0,ξ)π2(ξ)dξ
    B01(x)=πθ(θ0|x)π1(θ0)
    πθ(θ0|x)θθ0. Trong trường hợp mật độ biên dưới null có sẵn trong dạng đóng, người ta có thể rút ra mật độ biên cho mô hình không giới hạn từ yếu tố Bayes. (Đại diện Savage-Dickey này dựa trên các phiên bản cụ thể của ba mật độ khác nhau và do đó đầy nguy hiểm, thậm chí không đề cập đến thách thức tính toán của việc tạo ra hậu thế cận biên.)H0:θ=θ0
    m0(x)=Ξf(x|θ0,ξ)π2(ξ)dξ
    ma(x)=Θ×Ξf(x|θ,ξ)π1(θ)π2(ξ)dθdξ

[Đây là một tập hợp các slide tôi đã viết về việc ước tính các hằng số chuẩn hóa cho một hội thảo NIPS vào tháng 12 năm ngoái.]


2
(+1) Câu trả lời cực kỳ phong phú, cảm ơn bạn. Điều này sẽ hữu ích cho tôi và, tôi cho rằng, nhiều người khác. Tôi sẽ mất một thời gian để xem xét các cách tiếp cận khác nhau, và sau đó tôi có thể quay lại với những câu hỏi cụ thể.
lacerbi

2
Bắt đầu từ điểm (1) ... Tôi đọc các bài viết liên quan. Công cụ ước lượng điều hòa trung bình "đã hiệu chỉnh" có vẻ chính xác là những gì tôi đang tìm kiếm. Thật gọn gàng và dễ dàng để tính toán với đầu ra MCMC. Vậy ... cái gì bắt được? Có vẻ như phương pháp này đang được sử dụng rộng rãi, đánh giá từ một tìm kiếm nhanh trên Google Scholar. Hạn chế của nó là gì? (bên cạnh nhu cầu xác định các khu vực HPD, mà tôi tưởng tượng có thể trở thành một vấn đề đối với các hậu thế rất phức tạp ở chiều cao). Tôi chắc chắn sẽ thử nó - nhưng tôi tự hỏi liệu có điều gì tôi cần phải cảnh giác không.
lacerbi

2
Tôi đã thêm một vài chi tiết: vấn đề trong việc triển khai đồng phục HPD là tìm ra một xấp xỉ nhỏ gọn thích hợp cho vùng HPD. Vỏ lồi của các điểm có giá trị sau cao là (NP?) Khó xác định trong khi các quả bóng tập trung tại các điểm đó có thể giao nhau, điều này tạo ra một vấn đề hằng số chuẩn hóa thứ cấp.
Tây An

2
@ Tây An: rất hữu ích, cảm ơn! Tôi có thể hỏi: trong tất cả các cách tiếp cận được đề cập, hiện tại bạn sẽ được đề xuất gì nếu một phương pháp tiếp cận chung có xu hướng hoạt động tốt (nghĩa là không cần điều chỉnh / kiểm tra từ người dùng)? Tôi sẽ đặc biệt quan tâm đến trường hợp các mô hình có số lượng tham số (<50) thấp, hậu thế không bình thường và mối tương quan mạnh mẽ giữa các tham số.
Florian Hartig

1
@FlorianHartig: thực tế là một phần mềm chung như BUGS không trả về ước tính chung của là loại tiết lộ mức độ của vấn đề. Nhiều giải pháp mà người ta có thể tìm thấy trong các tài liệu chuyên ngành đã không tạo ra một ước tính đồng thuận. Do đó, khuyến nghị của tôi là nên chọn giải pháp hồi quy logistic của Geyer, một phần không nhạy cảm với kích thước. Z
Tây An
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.