Lấy thuật toán K-nghĩa là giới hạn tối đa hóa kỳ vọng cho các hỗn hợp Gaussian


8

Christopher Bishop xác định giá trị mong đợi của hàm khả năng ghi nhật ký dữ liệu hoàn chỉnh (nghĩa là giả sử rằng chúng tôi được cung cấp cả dữ liệu quan sát X cũng như dữ liệu tiềm ẩn Z) như sau:

(1)EZ[lnp(X,Zμ,Σ,π)]=n=1Nk=1Kγ(znk){lnπk+lnN(xn μk,Σk)}

trong đó γ(znk) được định nghĩa là:

(2)πkN(xn μk,Σk)j=1KπjN(xn μj,Σj)

Ý tưởng, như được mô tả, là xem xét Mô hình hỗn hợp Gaussian trong đó các ma trận hiệp phương sai của các thành phần hỗn hợp được đưa ra bởi , trong đó là một tham số phương sai được chia sẻ bởi tất cả các thành phần, như vậy cái đó:ϵIϵ

(3)p(xμk,Σk)=1(2πϵ)M2exp{12ϵxμk2}

và vì vậy, γ(znk) hiện được định nghĩa là:

(4)πkexp{xnμk2/2ϵ}j=1Kπjexp{xnμj2/2ϵ}

Đối số bây giờ là như sau:

nếu chúng ta xem xét giới hạn , chúng ta sẽ thấy rằng trong mẫu số, thuật ngữ mà là nhỏ nhất, sẽ chuyển sang 0 chậm nhất và do đó, các trách nhiệm cho điểm dữ liệu đều chuyển sang 0 trừ thuật ngữ j, trách nhiệm sẽ được thống nhất. Do đó, trong giới hạn này, chúng tôi có được sự gán cứng các điểm dữ liệu cho các cụm, giống như trong thuật toán -means, sao choϵ0xnμj2γ(znk)xnγ(znk)Kγ(znk)rnk

trong đó được định nghĩa là:rnk

(5)f(n)={1if k=arg minjxnμj20otherwise

Câu hỏi của tôi là làm thế nào để lập luận trên giữ? Cụ thể, nghĩa của một thuật ngữ chuyển sang zero gì? Và làm thế nào để đưa giới hạn trong eqn dẫn đến trách nhiệm nhị phân?most slowlyϵ04


1
Khi về 0, đi về 0 đối với mọi nhưng ở tốc độ khác nhau tùy thuộc vào , nhỏ nhất sau đó thu thập toàn bộ trọng lượng trong giới hạn. ϵexp{xnμk2/2ϵ}=exp{δn/ϵ}nδnδn
Tây An

1
(giải thích thêm) Nếu bạn lấy là nhỏ nhất , bạn có thể viết lại tất cả các thuật ngữ dưới dạng , có nghĩa là tất cả các thuật ngữ đều về 0 ngoại trừ một, một trong đó . δδnexp{(δδn)/ϵ}ϵδδn=0
Tây An

@ Xi'an Bạn có quan tâm để cung cấp thêm chi tiết? Bạn có ý nghĩa gì "nhỏ nhất sau đó thu thập toàn bộ trọng lượng trong giới hạn"? Và thuật ngữ mà = 0 đánh giá như thế nào để thống nhất? Ý tôi là, tử số là 0, phải không? δnδδn
BitRiver

Câu trả lời:


8

Hãy để chúng tôi viết Sau đó Nếu chúng tôi dùng chúng tôi có trong đó ngoại trừ trong đó

xnμk2=δk.
πkexp{xnμk2/2ϵ}j=1Kπjexp{xnμj2/2ϵ}=πkexp{δk/2ϵ}j=1Kπjexp{δj/2ϵ}
δ=minnδn,
πkexp{δk/2ϵ}j=1Kπjexp{δj/2ϵ}=πkexp{(δδk)/2ϵ}j=1Kπjexp{(δδj)/2ϵ}
δδk<0k=kδδk=0 . Vì vậy, với tất cả , kể từ, đối với , trong khi kk
limϵ0πkexp{(δδk)/2ϵ}j=1Kπjexp{(δδj)/2ϵ}=limϵ0πkexp{(δδk)/2ϵ}πk+jkπjexp{(δδj)/2ϵ}=0
a>0
limϵ0exp{a/ϵ}=0
limϵ0πkexp{(δδk)/2ϵ}j=1Kπjexp{(δδj)/2ϵ}=limϵ0πk×1πk+jkπjexp{(δδj)/2ϵ}=1
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.