Giả sử chúng ta có một tập hợp dữ liệu quan sát của biến ngẫu nhiên .
Hàm mục tiêu cho phương tiện M được cho bởi:
trong đó là biến chỉ thị nhị phân của một phép gán cứng cho cụm .
(nếu điểm dữ liệu được gán cho cụm , thì và cho k).
Thuật toán K có nghĩa là tối thiểu hóa thông qua việc lặp lại cho đến khi hội tụ, bao gồm hai bước liên tiếp:
(E) tối thiểu hóaX J = N Σ n = 1 K Σ k = 1 r n k | | x n - μ k | | 2 r n k x n k x n k r n k = 1 r n j = 0 j ≠ J J
đối với với giữ tất cả cố định (M) giảm thiểu đối với với giữ tất cả cố định μ k J { μ k } k r n k
Nói chung, biểu thị tất cả dữ liệu được quan sát bởi , tất cả các biến tiềm ẩn theo và tập hợp tất cả các tham số mô hình theo , thuật toán EM tối đa hóa phân phối sau thông qua lặp cho đến khi hội tụ, trong hai bước xen kẽ:
(E ) tính toán kỳ vọng
(M) findZ θ p ( θ | X ) Q ( θ , θ cũ ) : = Σ Z p ( Z | X , θ cũ ) log p ( Z , X | θ ) θ mới = arg max θ Q ( θ , θ cũ )
Bây giờ hãy xem xét phân phối hỗn hợp Gaussian: Giới thiệu biến ngẫu nhiên nhị phân theo , chúng tôi thấy rằng: Vì vậyK z p ( z k = 1 ) = π k p ( X , Z ) = N ∏ n = 1 K ∏ k = = 1 π z n k k N ( x n |
Nếu bây giờ tất cả các Gaussian trong mô hình hỗn hợp có hiệp phương sai , xem xét giới hạn Tôi có thể dễ dàng hiển thị rằng trong đó là định nghĩa ở trên. Vì vậy, thực sự bước (E) cập nhật như trong thuật toán K-mean.
Tuy nhiên, tôi gặp vấn đề với tối đa hóa trong ngữ cảnh này, như đối với .
Có đúng không, với một số nhân vô hướng và vô hướng:
?
Có lẽ tôi đang thiếu một cái gì đó. Có lời khuyên nào không?