Ví dụ về lỗi trong thuật toán MCMC


28

Tôi đang nghiên cứu một phương pháp để tự động kiểm tra các phương pháp Monte Carlo chuỗi Markov và tôi muốn một số ví dụ về các lỗi có thể xảy ra khi xây dựng hoặc thực hiện các thuật toán đó. Điểm thưởng nếu phương pháp không chính xác được sử dụng trong một bài báo được xuất bản.

Tôi đặc biệt quan tâm đến các trường hợp lỗi có nghĩa là chuỗi có phân phối bất biến không chính xác, mặc dù các loại lỗi khác (ví dụ chuỗi không phải là ergodic) cũng sẽ được quan tâm.

Một ví dụ về lỗi như vậy sẽ không thể tạo ra giá trị khi Metropolis-Hastings từ chối một động thái được đề xuất.


7
Một trong những ví dụ yêu thích của tôi là công cụ ước tính trung bình Harmonic vì nó có các đặc tính tiệm cận đẹp nhưng nó không hoạt động trong thực tế. Radford Neal thảo luận về điều này trong blog của mình: "Tin xấu là số điểm cần thiết cho công cụ ước tính này để tiến gần đến câu trả lời đúng thường sẽ lớn hơn số lượng nguyên tử trong vũ trụ quan sát được". Phương pháp này đã được thực hiện rộng rãi trong các ứng dụng.

3
Một lịch sự khác của Giáo sư Neal.
Cyan

5
@Cyan Để Neal được coi trọng, tôi nghĩ rằng anh ta nên tìm một tạp chí chấp nhận bài viết của mình thay vì chỉ gửi nó trên internet. Tôi có thể dễ dàng tin rằng anh ấy đúng và các trọng tài và tác giả không chính xác. Mặc dù rất khó để có được các bài báo được công bố mâu thuẫn với kết quả được công bố và sự từ chối của JASA là không khuyến khích, tôi nghĩ rằng anh ấy nên thử một vài tạp chí khác cho đến khi anh ấy thành công. Bạn cần một trọng tài độc lập và độc lập để thêm uy tín cho phát hiện của bạn.
Michael R. Chernick

4
Một người nên luôn luôn coi trọng giáo sư Neal! ; o) Nghiêm túc mà nói, kết quả như thế này rất khó để được công bố, và thật không may, văn hóa học thuật hiện đại dường như không coi trọng điều đó, vì vậy không thể hiểu được nếu đó không phải là một hoạt động ưu tiên cao đối với anh ta. Câu hỏi thú vị, tôi rất quan tâm đến câu trả lời.
Dikran Marsupial

6
@Michael: Có lẽ. Đã ở tất cả các khía cạnh của các tình huống tương tự, kể cả ở vị trí của Giáo sư Neal, trong nhiều trường hợp, quan sát giai thoại của tôi là sự từ chối giấy mang rất ít nội dung thông tin trong hầu hết các trường hợp, cũng như nhiều sự chấp nhận. Đánh giá ngang hàng là bậc độ lớn ồn ào hơn so với những người chăm sóc phải thừa nhận, và thường xuyên, như thể là trường hợp ở đây, có một phầnquan tâm (ví dụ, không độc lập) bên và lợi ích tại chơi. Điều đó nói rằng, tôi không có ý định nhận xét ban đầu của mình để đưa chúng ta đi xa hơn về chủ đề này. cảm ơn chia sẻ suy nghĩ của bạn về vấn đề này
Đức hồng y

Câu trả lời:


11

1. Ước lượng biên và ước lượng trung bình hài

Các khả năng biên được định nghĩa là hằng số bình thường của phân bố sau

p(x)=Θp(x|θ)p(θ)dθ.

Tầm quan trọng của số lượng này đến từ vai trò của nó trong so sánh mô hình thông qua các yếu tố Bayes .

Một số phương pháp đã được đề xuất để xấp xỉ số lượng này. Raftery et al. (2007) đề xuất công cụ ước tính trung bình hài , nhanh chóng trở nên phổ biến do tính đơn giản của nó. Ý tưởng bao gồm việc sử dụng các mối quan hệ

1p(x)=Θp(θ|x)p(x|θ)dθ.

Do đó, nếu chúng ta có một mẫu từ sau, nói , số lượng này có thể được xấp xỉ bằng(θ1,...,θN)

1p(x)1Nj=1N1p(x|θj).

Phép tính gần đúng này có liên quan đến khái niệm Lấy mẫu Tầm quan trọng .

Theo luật số lượng lớn, như được thảo luận trong blog của Neal , chúng tôi có rằng công cụ ước tính này là phù hợp . Vấn đề là cần thiết cho một xấp xỉ tốt có thể rất lớn. Xem blog của Neal hoặc blog của Robert 1 , 2 , 3 , 4 để biết một số ví dụ.N

Lựa chọn thay thế

Có nhiều lựa chọn thay thế cho xấp xỉ . Chopin và Robert (2008) trình bày một số phương pháp dựa trên lấy mẫu Tầm quan trọng.p(x)

2. Không chạy bộ lấy mẫu MCMC của bạn đủ lâu (đặc biệt với sự hiện diện của đa phương thức)

Mendoza và Gutierrez-Peña (1999) suy ra tham chiếu trước / sau cho tỷ lệ của hai phương tiện thông thường và đưa ra một ví dụ về các suy luận thu được với mô hình này bằng cách sử dụng một bộ dữ liệu thực. Sử dụng phương pháp MCMC, họ có được một mẫu kích thước của sau của tỷ lệ phương tiện φ được hiển thị dưới đây2000φ

nhập mô tả hình ảnh ở đây

φ (0.63,5.29)00

nhập mô tả hình ảnh ở đây

(0,7.25)

3. Một số vấn đề khác như đánh giá sự hội tụ, lựa chọn giá trị khởi đầu, hành vi kém của chuỗi có thể được tìm thấy trong cuộc thảo luận này của Gelman, Carlin và Neal.

4. Lấy mẫu quan trọng

g

I=f(x)dx=f(x)g(x)g(x)dx.

g(x1,...,xN)I

I1Nj=1Nf(xj)g(xj).

gfN

# Integrating a Student's t with 1 d.f. using a normal importance function   
x1 = rnorm(10000000)   # N=10,000,000
mean(dt(x1,df=1)/dnorm(x1))

# Now using a Student's t with 2 d.f. function
x2 = rt(1000,df=2)
mean(dt(x2,df=1)/dt(x2,df=2))

2
Chúng là một số ví dụ tuyệt vời. Đối với bất cứ ai quan tâm, bức thư gửi cho biên tập viên có hình ở đây: onlinel Library.wiley.com/doi/10.1002/bimj.200800256/abab
Simon Byrne

2
Tóm tắt rất hay và rõ ràng !! (+1)
gui11aume

12

Darren Wilkinson trên blog của mình đưa ra một ví dụ chi tiết về một lỗi phổ biến trong việc đi bộ ngẫu nhiên Metropolis-Hastings. Tôi khuyên bạn nên đọc nó đầy đủ, nhưng đây là phiên bản tl; dr.

Nếu phân phối mục tiêu là tích cực (như phân phối Gamma, v.v. ) trong một chiều, thì ngay lập tức từ chối các đề xuất có giá trị âm trên chiều đó. Sai lầm là vứt bỏ các đề xuất như chúng chưa bao giờ xảy ra và chỉ đánh giá tỷ lệ chấp nhận của các thành phố khác. Đây là một sai lầm vì nó sử dụng mật độ đề xuất không đối xứng.

Tác giả đề nghị áp dụng một trong hai bản sửa lỗi.

  1. Đếm các "tiêu cực" là không chấp nhận (và mất một chút hiệu quả).

  2. Sử dụng tỷ lệ MH chính xác trong trường hợp đó, đó là

π(x)π(x)Φ(x)Φ(x),

πΦϕ Φ(x)=0ϕ(yx)dy


1
+1 Ví dụ thú vị. Tôi cũng đã suy nghĩ về các vấn đề khác với MH liên quan đến tỷ lệ chấp nhận. Tôi nghĩ rằng tỷ lệ tối ưu 0,234 đã được sử dụng quá mức.

@Procrastinator bạn biết rất rõ về văn học MCMC. Đây có phải là lĩnh vực chuyên môn của bạn?
gui11aume

Cám ơn bạn đã góp ý. Tôi thích số liệu thống kê của Bayes, sau đó tôi cần mang theo MCMC chéo;).

1

Một trường hợp rất rõ ràng (kết nối với xấp xỉ khả năng cận biên được đề cập trong câu trả lời đầu tiên) trong đó sự hội tụ thực sự là ví dụ về vấn đề chuyển đổi nhãn trong các mô hình hỗn hợp kết hợp với sử dụng công cụ ước tính của Chib (1995) . Như Radford Neal (1999) đã chỉ ra , nếu chuỗi MCMC không hội tụ chính xác, theo nghĩa là nó khám phá một số chế độ phân phối mục tiêu, thì xấp xỉ Monte Carlo của Chib không đạt được giá trị số đúng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.