Mối quan hệ giữa Bayes và EM


26

Tôi đã đọc ở đâu đó rằng phương pháp Variational Bayes là một khái quát của thuật toán EM. Thật vậy, các phần lặp của các thuật toán rất giống nhau. Để kiểm tra xem thuật toán EM có phải là phiên bản đặc biệt của Biến thể Bay không, tôi đã thử như sau:

  1. X Θ P ( X , Θ | Y ) Q X ( X ) Q Θ ( Θ ) QY là dữ liệu, là tập hợp các biến tiềm ẩn và là tham số. Trong Variational Bayes, chúng ta có thể tạo một xấp xỉ sao cho . Trong đó s đơn giản hơn, phân phối dễ điều khiển.XΘP(X,Θ|Y)QX(X)QΘ(Θ)Q

  2. Vì thuật toán EM tìm thấy ước tính điểm MAP, tôi nghĩ rằng Biến thể Bay có thể hội tụ thành EM nếu tôi sử dụng Hàm Delta sao cho: . là ước tính đầu tiên cho các tham số như thường được thực hiện trong EM.Θ 1QΘ1(Θ)= =δΘ1(Θ)Θ1

  3. Khi được đưa ra, giúp giảm thiểu phân kỳ KL được tìm thấy bởi công thức Công thức trên đơn giản hóa thành , bước này hóa ra tương đương với bước Mong đợi của thuật toán EM!Q 1 X ( X ) Q 1 X ( X ) = exp ( E delta Θ 1 [ ln P ( X , Y , Θ ) ] )QΘ1(Θ)= =δΘ1(Θ)QX1(X) Q 1 X (X)=P(X|Θ1,Y)

    QX1(X)= =điểm kinh nghiệm(EδΘ1[lnP(X,Y,Θ)])điểm kinh nghiệm(EδΘ1[lnP(X,Y,Θ)])dX
    QX1(X)= =P(X|Θ1,Y)

Nhưng tôi không thể lấy được bước Tối đa hóa khi tiếp tục điều này. Trong bước tiếp theo, chúng ta cần tính và theo quy tắc lặp Variational Bayes, đây là:QΘ2(Θ)

QΘ2(Θ)= =điểm kinh nghiệm(EP(X|Θ1,Y)[lnP(X,Y,Θ)])điểm kinh nghiệm(EP(X|Θ1,Y)[lnP(X,Y,Θ)])dΘ

Các thuật toán VB và EM có thực sự được kết nối theo cách này không? Làm thế nào chúng ta có thể lấy EM là một trường hợp đặc biệt của Bay Variational, cách tiếp cận của tôi có đúng không?


Bạn đã đọc thuật toán EM tìm thấy ước tính MAP ở đâu? Mối quan hệ giữa suy luận đa dạng và EM sẽ trở nên rõ ràng khi bạn hiểu quan điểm về EM được trình bày trong bài viết này của Neal & Hinton (1998) . Xem thêm câu trả lời của tôi ở đây .
Lucas

P(X|Θt,Y)ΘtΘt+1= =mộtrgmmộtxΘ<lnP(X,Y,Θ)>P(X|Θt,Y)

1
QΘ2QΘ2Θ2QΘ2(Θ)= =δΘ2(Θ)

Tôi tìm thấy trong trang 21 của bài thuyết trình cs.cmu.edu/~tom/10-702/Zoubin-702.pdf một so sánh về EM và VB đã được hiển thị, tương tự bằng cách sử dụng hàm Dirac. Nhưng làm thế nào VB giảm xuống EM không được đưa ra.
Ufuk Can bicici

Câu trả lời:


20

ΘΘ*

QΘ(Θ)= =δ(Θ-Θ*)
KL(Q||P)= =QX(X)QΘ(Θ)lnQX(X)QΘ(Θ)P(X,Y,Θ)dXdΘ= =QX(X)lnQX(X)QΘ(Θ*)P(X,Y,Θ*)dX
QX(X)Θ*

Tất nhiên, nếu bạn thực sự đánh giá phân kỳ KL, nó sẽ là vô hạn. Nhưng đó không phải là vấn đề nếu bạn coi hàm delta là giới hạn.


EQx[lnP(X,Y,Θ*)]= =EQx[lnP(X,Y|Θ*)]+lnP(Θ*)Θ*P(Θ*)
Yibo Yang
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.