(Câu trả lời này sử dụng liên kết thứ hai mà bạn đã đưa ra.)
Nhớ lại định nghĩa về khả năng:
nơi trong trường hợp của chúng tôi là ước lượng cho xác suất mà đồng tiền A và B lần lượt đứng đầu đất, là kết quả của các thí nghiệm của chúng tôi, mỗi bao gồm 10 lần lật và
là đồng tiền được sử dụng trong mỗi thử nghiệm.
L[θ|X]=Pr[X|θ]=∑ZPr[X,Z|θ]
θ=(θA,θB)X=(X1,…,X5)XiZ=(Z1,…,Z5)
Chúng tôi muốn tìm công cụ ước tính khả năng tối đa . Thuật toán tối đa hóa kỳ vọng (EM) là một phương pháp như vậy để tìm (ít nhất là cục bộ) . Nó hoạt động bằng cách tìm kỳ vọng có điều kiện, sau đó được sử dụng để tối đa hóa . Ý tưởng là bằng cách liên tục tìm nhiều khả năng (tức là có thể xảy ra nhiều hơn)
trong mỗi lần lặp, chúng tôi sẽ liên tục tăng do đó, làm tăng hàm likelihood. Có ba điều cần phải được thực hiện trước khi tiếp tục thiết kế một thuật toán dựa trên EM.θ^θ^θθPr[X,Z|θ]
- Xây dựng mô hình
- Tính toán kỳ vọng có điều kiện theo mô hình (E-Step)
- Tối đa hóa khả năng của chúng tôi bằng cách cập nhật ước tính hiện tại của chúng tôi về (M-Step)θ
Xây dựng mô hình
Trước khi chúng ta tiến xa hơn với EM, chúng ta cần tìm hiểu chính xác chúng ta đang tính toán cái gì. Trong bước E, chúng tôi đang tính toán chính xác giá trị mong đợi cho . Vậy giá trị này là gì? Quan sát rằng
Lý do là chúng tôi có 5 thử nghiệm và chúng tôi không biết loại tiền nào được sử dụng trong mỗi loại. Sự bất bình đẳng là dologPr[X,Z|θ]
logPr[X,Z|θ]=∑i=15log∑C∈{A,B}Pr[Xi,Zi=C|θ]=∑i=15log∑C∈{A,B}Pr[Zi=C|Xi,θ]⋅Pr[Xi,Zi=C|θ]Pr[Zi=C|Xi,θ]≥∑i=15∑C∈{A,B}Pr[Zi=C|Xi,θ]⋅logPr[Xi,Zi=C|θ]Pr[Zi=C|Xi,θ].
logđược lõm và áp dụng bất bình đẳng của Jensen. Lý do chúng ta cần ràng buộc thấp hơn là chúng ta không thể tính trực tiếp arg max với phương trình ban đầu. Tuy nhiên chúng ta có thể tính toán nó cho giới hạn dưới cuối cùng.
Bây giờ gì? Đó là xác suất mà chúng ta thấy đồng xu cho thử nghiệm và . Sử dụng xác suất có điều kiện mà chúng tôi có,Pr[Zi=C|Xi,θ]CXiθ
Pr[Zi=C|Xi,θ]=Pr[Xi,Zi=C|θ]Pr[Xi|θ].
Mặc dù chúng tôi đã đạt được một số tiến bộ, chúng tôi vẫn chưa hoàn thành với mô hình. Xác suất mà một đồng tiền đã cho lật chuỗi bao nhiêu? Để
Bây giờ rõ ràng là chỉ xác suất dưới cả hai khả năng của hoặc . Vì chúng tôi có,
Xihi=#heads in Xi
Pr[Xi,Zi=C|θ]=12⋅θhiC(1−θC)10−hi, for C∈{A,B}.
Pr[Xi|θ]Zi=AZi=BPr[Zi=A]=Pr[Zi=B]=1/2Pr[Xi|θ]=1/2⋅(Pr[Xi|Zi=A,θ]+Pr[Xi|Zi=B,θ]).
Bước điện tử
Được rồi ... điều đó không vui lắm nhưng chúng ta có thể bắt đầu thực hiện một số công việc EM ngay bây giờ. Thuật toán EM bắt đầu bằng cách thực hiện một số dự đoán ngẫu nhiên cho . Trong ví dụ này, chúng ta có . Chúng tôi tính toán
Giá trị này phù hợp với những gì trong bài báo. Bây giờ chúng ta có thể tính số lượng đầu dự kiến trong từ đồng xu ,
Làm điều tương tự cho đồng xu chúng ta nhận được,
θθ0=(0.6,0.5)
Pr[Z1=A|X1,θ]=1/2⋅(0.65⋅0.45)1/2⋅((0.65⋅0.45)+(0.55⋅0.55))≈0.45.
X1=(H,T,T,T,H,H,T,H,T,H)AE[#heads by coin A|X1,θ]=h1⋅Pr[Z1=A|X1,θ]=5⋅0.45≈2.2.
BE[#heads by coin B|X1,θ]=h1⋅Pr[Z1=B|X1,θ]=5⋅0.55≈2.8.
Chúng ta có thể tính toán tương tự cho số lượng đuôi bằng cách thay thế trong . Điều này tiếp tục cho tất cả các giá trị khác của và . Nhờ tính tuyến tính của kỳ vọng, chúng ta có thể tìm ra
h110−h1Xihi 1≤i≤5E[#heads by coin A|X,θ]=∑i=15E[#heads by coin A|Xi,θ]
M-Bước
Với các giá trị dự kiến của chúng tôi, giờ đến bước M nơi chúng tôi muốn tối đa hóa
với các giá trị mong đợi của chúng tôi. Điều này được thực hiện bằng cách chuẩn hóa đơn giản!
Tương tự như vậy đối với . Quá trình này bắt đầu lại với E-Step và và tiếp tục cho đến khi các giá trị cho hội tụ (hoặc đến một số ngưỡng cho phép). Trong ví dụ này, chúng ta có 10 lần lặp và . Trong mỗi lần lặp, giá trị của
tăng lên, do ước tính tốt hơn vềθ
θ1A=E[#heads over X by coin A|X,θ]E[#heads and tails over X by coin A|X,θ]=21.321.3+9.6≈0.71.
Bθ1θθ^=θ10=(0.8,0.52)Pr[X,Z|θ]θ .
Bây giờ trong trường hợp này mô hình khá đơn giản. Mọi thứ có thể trở nên phức tạp hơn khá nhanh, tuy nhiên thuật toán EM sẽ luôn hội tụ và sẽ luôn tạo ra một công cụ ước tính khả năng tối đa . Nó có thể là một công cụ ước tính cục bộ , nhưng để giải quyết vấn đề này, chúng ta có thể khởi động lại quá trình EM với một khởi tạo khác. Chúng tôi có thể làm điều này một số lần không đổi và giữ lại kết quả tốt nhất (nghĩa là những người có khả năng cuối cùng cao nhất).θ^