Lấy mẫu từ một bản phân phối không phù hợp (sử dụng MCMC và các cách khác)


15

Câu hỏi cơ bản của tôi là: làm thế nào bạn lấy mẫu từ một phân phối không phù hợp? Nó thậm chí có ý nghĩa để lấy mẫu từ một phân phối không phù hợp?

Nhận xét của Xi'an ở đây loại địa chỉ câu hỏi, nhưng tôi đang tìm kiếm thêm một số chi tiết về điều này.

Cụ thể hơn đối với MCMC:

Khi nói về MCMC và đọc các bài báo, các tác giả nhấn mạnh đến việc có được các bản phân phối sau thích hợp. Có bài báo Geyer (1992) nổi tiếng mà tác giả quên kiểm tra xem hậu thế của họ có phù hợp không (nếu không là một bài báo xuất sắc).

Nhưng, giả sử chúng ta có khả năng và phân phối trước không đúng trên sao cho kết quả sau cũng không đúng và MCMC được sử dụng để lấy mẫu từ phân phối. Trong trường hợp này, mẫu chỉ ra điều gì? Có bất kỳ thông tin hữu ích trong mẫu này? Tôi biết rằng chuỗi Markov ở đây sau đó là tạm thời hoặc không lặp lại. Có bất kỳ sự thay đổi tích cực nào nếu nó không tái phát ?f(x|θ)θ

Cuối cùng, trong câu trả lời của Neil G ở đây , anh đề cập đến

bạn thường có thể lấy mẫu (sử dụng MCMC) từ phía sau ngay cả khi điều đó không đúng.

Ông đề cập việc lấy mẫu như vậy là phổ biến trong học tập sâu. Nếu điều này là đúng, làm thế nào điều này có ý nghĩa?



@peuhp Chắc chắn là hữu ích. Điều tôi hiểu từ bài báo là nếu các chức năng được đánh giá từ các mẫu có thể tích hợp được, thì việc lấy mẫu từ một hậu thế không phù hợp có ý nghĩa. Là giải thích của tôi chính xác?
Greenparker

3
Đúng. Hãy xem xét một trường hợp tầm thường của một hậu thế không phù hợp, trong đó sự không phù hợp là do đuôi béo và một hàm bằng 0 bên ngoài và có tất cả các đặc tính tốt để tích hợp trên [ 0 ,[0,1][0,1][0,1]

Câu trả lời:


10

Lấy mẫu từ một hậu thế không phù hợp (mật độ) ff(Ω,σ,P)

Nếu bạn có một mô hình với trước không phù hợp dẫn đến hậu thế không phù hợp, trong nhiều trường hợp, bạn vẫn có thể lấy mẫu từ mô hình đó bằng MCMC, ví dụ như Metropolis-Hastings và "mẫu sau" có thể trông hợp lý. Điều này có vẻ hấp dẫn và nghịch lý từ cái nhìn đầu tiên. Tuy nhiên, lý do cho điều này là các phương pháp MCMC bị giới hạn ở các giới hạn số lượng của các máy tính trong thực tế và do đó, tất cả các hỗ trợ đều bị giới hạn (và rời rạc!) Cho một máy tính. Sau đó, dưới những hạn chế đó (giới hạn và sự rời rạc), hậu thế thực sự phù hợp trong hầu hết các trường hợp.

Có một tài liệu tham khảo tuyệt vời của Hobert và Casella đưa ra một ví dụ (có tính chất hơi khác biệt) trong đó bạn có thể xây dựng một bộ lấy mẫu Gibbs cho một hậu thế, các mẫu sau trông hoàn toàn hợp lý, nhưng sau đó không đúng!

http://www.jstor.org/urdy/2291572

Một ví dụ tương tự gần đây đã xuất hiện ở đây . Trên thực tế, Hobert và Casella cảnh báo người đọc rằng các phương pháp MCMC không thể được sử dụng để phát hiện sự không phù hợp của hậu thế và điều này phải được kiểm tra riêng trước khi thực hiện bất kỳ phương pháp MCMC nào. Tóm tắt:

  1. Một số bộ lấy mẫu MCMC, chẳng hạn như Metropolis-Hastings, có thể (nhưng không nên) được sử dụng để lấy mẫu từ một hậu thế không chính xác kể từ khi giới hạn máy tính và phân bổ không gian tham số. Chỉ khi bạn có những mẫu khổng lồ , bạn mới thể quan sát một số điều kỳ lạ. Bạn có thể phát hiện những vấn đề này tốt đến mức nào tùy thuộc vào phân phối "công cụ" được sử dụng trong bộ lấy mẫu của bạn. Điểm thứ hai đòi hỏi một cuộc thảo luận rộng rãi hơn, vì vậy tôi thích để nó ở đây.
  2. (Hobert và Casella). Việc bạn có thể xây dựng một bộ lấy mẫu Gibbs (mô hình có điều kiện) cho một mô hình có trước không phù hợp không có nghĩa là hậu thế (mô hình chung) là phù hợp.
  3. Một cách giải thích xác suất chính thức của các mẫu sau đòi hỏi sự sở hữu của hậu thế. Kết quả hội tụ và bằng chứng chỉ được thiết lập cho các phân phối / biện pháp xác suất thích hợp.

PS (hơi tặc lưỡi): Đừng luôn tin vào những gì mọi người làm trong Machine Learning. Như giáo sư Brian Ripley đã nói: "học máy là số liệu thống kê trừ đi mọi kiểm tra về mô hình và giả định".


(+1) Câu trả lời tuyệt vời và không đồng ý với hầu hết những gì tôi đang nghĩ. Tôi sẽ đọc tài liệu tham khảo Hobert + Casella. Bạn có thể biết điều gì đó tốt hơn có thể xảy ra nếu chuỗi Markov không tái diễn? Ngoài ra, đồng ý với nhận xét PS.
xanh

@Greenparker Chuỗi Markov tái phát Null không có phân phối cố định. Sau đó, chúng vô dụng trong bối cảnh của MCMC (nơi bạn xây dựng chuỗi Markov với phân phối cố định bằng phân phối mục tiêu), Xem ví dụ tại đâyđây .
Rod

5

Đưa ra một cách khác, áp dụng nhiều hơn, từ câu trả lời xuất sắc của Rod ở trên -

+/-10100

1/xtrước - một cái tôi sử dụng để tính toán, không có giới hạn trên và "tính năng bổ sung" của nó có giá trị bằng 0 so với dân số San Francisco ... ", với" tính năng bổ sung "được áp dụng trong một bước tiếp theo để tạo mẫu. Ưu tiên thực sự không phải là bước được sử dụng trong tính toán MCMC (trong ví dụ của tôi.)

Vì vậy, về nguyên tắc tôi sẽ khá ổn khi sử dụng mẫu do MCMC tạo ra từ phân phối không phù hợp trong công việc được áp dụng, nhưng tôi sẽ chú ý nhiều đến việc làm thế nào không đúng và làm thế nào mẫu ngẫu nhiên sẽ bị ảnh hưởng bởi nó . Lý tưởng nhất là mẫu ngẫu nhiên sẽ không bị ảnh hưởng bởi nó, như trong ví dụ về con chó nóng của tôi, trong một thế giới hợp lý, bạn sẽ không bao giờ thực sự tạo ra một số ngẫu nhiên lớn hơn số người ở San Francisco ...

Bạn cũng nên lưu ý rằng thực tế là kết quả của bạn có thể khá nhạy cảm với tính năng của hậu thế khiến nó không phù hợp, ngay cả khi bạn cắt bớt nó ở một số lượng lớn sau đó (hoặc bất kỳ thay đổi nào phù hợp với mô hình của bạn. ) Bạn muốn kết quả của mình mạnh mẽ trước những thay đổi nhỏ làm thay đổi hậu thế của bạn từ không phù hợp thành đúng đắn. Điều này có thể khó đảm bảo hơn, nhưng là một phần của vấn đề lớn hơn trong việc đảm bảo kết quả của bạn mạnh mẽ với các giả định của bạn, đặc biệt là các kết quả được tạo ra để thuận tiện.


+1, chiến thuật thú vị. Bạn cũng có thể cung cấp cắt ngắn như trước thực tế của bạn. Tôi tưởng tượng khi thực hiện mcmc, điều này có thể không banjax quá nhiều tính toán của bạn và sẽ tránh được việc phải thảo luận về việc sử dụng xấp xỉ.
phỏng đoán

@conjectures - chắc chắn, trong trường hợp này! Đây chỉ là một ví dụ đơn giản, có nghĩa là minh họa điểm a) có thể có sự khác biệt giữa trước được sử dụng trong tính toán MCMC và trước đó thực tế, b) sự khác biệt có thể được giải quyết bằng cách xử lý sau mẫu MCMC (để một mức độ hợp lý của "độ phân giải") và c) tính không chính xác của các kết quả so với trước được sử dụng trong tính toán MCMC không có nghĩa là không chính xác về kết quả sau khi xử lý hậu kỳ được thực hiện.
jbowman
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.