K-có nghĩa là trường hợp giới hạn của thuật toán EM cho các hỗn hợp Gaussian với hiệp phương sai


8

σ2Ilimσ0

Giả sử chúng ta có một tập hợp dữ liệu quan sát của biến ngẫu nhiên . Hàm mục tiêu cho phương tiện M được cho bởi: trong đó là biến chỉ thị nhị phân của một phép gán cứng cho cụm . (nếu điểm dữ liệu được gán cho cụm , thì và cho k). Thuật toán K có nghĩa là tối thiểu hóa thông qua việc lặp lại cho đến khi hội tụ, bao gồm hai bước liên tiếp: (E) tối thiểu hóaX J = N Σ n = 1 K Σ k = 1 r n k | | x n - μ k | | 2 r n k x n k x n k r n k = 1 r n j = 0 j J J{x1,,xN}X

J=n=1Nk=1Krnk||xnμk||2
rnkxnk
xnkrnk=1rnj=0j
J
J đối với với giữ tất cả cố định (M) giảm thiểu đối với với giữ tất cả cố định μ k J { μ k } k r n k{rnk}n,kμk
J{μk}krnk

Nói chung, biểu thị tất cả dữ liệu được quan sát bởi , tất cả các biến tiềm ẩn theo và tập hợp tất cả các tham số mô hình theo , thuật toán EM tối đa hóa phân phối sau thông qua lặp cho đến khi hội tụ, trong hai bước xen kẽ: (E ) tính toán kỳ vọng (M) findZ θ p ( θ | X ) Q ( θ , θ ) : = Σ Z p ( Z | X , θ ) log p ( Z , X | θ ) θ mới = arg max θ Q ( θ , θ )XZθp(θ|X)
Q(θ,θold):=Zp(Z|X,θold)logp(Z,X|θ)
θnew=argmaxθQ(θ,θold)

Bây giờ hãy xem xét phân phối hỗn hợp Gaussian: Giới thiệu biến ngẫu nhiên nhị phân theo , chúng tôi thấy rằng: Vì vậyK z p ( z k = 1 ) = π k p ( X , Z ) = N n = 1 K k = = 1 π z n k k N ( x n |

p(x)=k=1KπkN(x|μk,Σk)
Kzp(zk=1)=πk
p(X,Z)=n=1Nk=1KπkznkN(xn|μk,Σk)znk
γ(zk):=p(zk=1|x)=πkN(x|μk,Σk)j=1KπjN(x|μj,Σj)
logp(X,Z|μ,Σ,π)=n=1Nk=1Kznk(logπk+logN(xn|μk,Σk))
E(znk)=γ(znk)
Q((π,μ,Σ),(π,μ,Σ)old)=n=1Nk=1Kγ(znk)(logπk+logN(xn|μk,Σk))

Nếu bây giờ tất cả các Gaussian trong mô hình hỗn hợp có hiệp phương sai , xem xét giới hạn Tôi có thể dễ dàng hiển thị rằng trong đó là định nghĩa ở trên. Vì vậy, thực sự bước (E) cập nhật như trong thuật toán K-mean.σ2Iσ0γ(znk)rnkrnkrnk

Tuy nhiên, tôi gặp vấn đề với tối đa hóa trong ngữ cảnh này, như đối với . Có đúng không, với một số nhân vô hướng và vô hướng: ?Q((π,μ,Σ),(π,μ,Σ)old)xμ limσ0log(N(x|μ,σ2))=
limσ0Q((π,μ,Σ),(π,μ,Σ)old)=J

Có lẽ tôi đang thiếu một cái gì đó. Có lời khuyên nào không?


2
Chào mừng đến với trang web, @Andrzej. Vui lòng gửi câu hỏi đầy đủ - không ngoại lệ rằng mọi người sẽ tìm kiếm sách của bạn.
StasK

1
Gửi StasK, tôi vừa đăng câu hỏi đầy đủ và hy vọng nó đã rõ ràng.
Andrzej Neugebauer

Câu trả lời:


3

Có đúng là một số nhân vô hướng và vô hướng: ?limσ0Q((π,μ,Σ),(π,μ,Σ)old)=J

Đây không phải là trường hợp vì - như bạn quan sát chính mình - giới hạn phân kỳ.

Tuy nhiên, nếu trước tiên chúng ta biến đổi và sau đó lấy giới hạn, chúng ta sẽ hội tụ đến mục tiêu k-mean. Với và chúng ta cóQΣk=σ2Iπk=1/K

Q=n,kγnk(logπk+logN(xnμk,Σk))=Nlog1K1σ2n,kγnk||xnμk||2ND2log2πσ2.

Nhân với (không ảnh hưởng đến thuật toán EM, vì không được tối ưu hóa nhưng không đổi) và thu thập tất cả các thuật ngữ không đổi trong , chúng tôi thấy rằng Lưu ý rằng tối đa hóa chức năng này đối với cho bất kỳ và cho cùng kết quả là hàm mục tiêu ở trên, nghĩa là, nó là một công thức tương đương của bước M. Nhưng lấy giới hạn bây giờ mang lại .σ2σC

Qn,kγnk||xnμk||2+σ2C.
μγσJ

Bên cạnh đó, một công thức EM thanh lịch hơn một chút là sử dụng hàm mục tiêu Sử dụng hàm mục tiêu này, thuật toán EM sẽ thay thế giữa tối ưu hóa liên quan đến (bước M) và (bước E). Lấy giới hạn, chúng ta thấy rằng cả bước M và bước E đều hội tụ với thuật toán k-mean.FLgamma

F(μ,γ)=n,kγnklogπkN(xnμk,Σk)/γnkn,kn,kγnk||xnμk||2σ2n,kγnklogγnk+σ2C.
Fμγ

Xem thêm một cái nhìn khác về EM .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.