Christopher Bishop xác định giá trị mong đợi của hàm khả năng ghi nhật ký dữ liệu hoàn chỉnh (nghĩa là giả sử rằng chúng tôi được cung cấp cả dữ liệu quan sát X cũng như dữ liệu tiềm ẩn Z) như sau:
trong đó được định nghĩa là:
Ý tưởng, như được mô tả, là xem xét Mô hình hỗn hợp Gaussian trong đó các ma trận hiệp phương sai của các thành phần hỗn hợp được đưa ra bởi , trong đó là một tham số phương sai được chia sẻ bởi tất cả các thành phần, như vậy cái đó:
và vì vậy, hiện được định nghĩa là:
Đối số bây giờ là như sau:
nếu chúng ta xem xét giới hạn , chúng ta sẽ thấy rằng trong mẫu số, thuật ngữ mà là nhỏ nhất, sẽ chuyển sang 0 chậm nhất và do đó, các trách nhiệm cho điểm dữ liệu đều chuyển sang 0 trừ thuật ngữ j, trách nhiệm sẽ được thống nhất. Do đó, trong giới hạn này, chúng tôi có được sự gán cứng các điểm dữ liệu cho các cụm, giống như trong thuật toán -means, sao cho
trong đó được định nghĩa là:
Câu hỏi của tôi là làm thế nào để lập luận trên giữ? Cụ thể, nghĩa của một thuật ngữ chuyển sang zero gì? Và làm thế nào để đưa giới hạn trong eqn dẫn đến trách nhiệm nhị phân?