Áp dụng tối đa hóa kỳ vọng vào các ví dụ tung đồng xu


18

Gần đây tôi đã tự nghiên cứu Tối đa hóa Kỳ vọng và đã tự mình lấy một số ví dụ đơn giản trong quy trình:

Từ đây : Có ba đồng xu , và với , và xác suất tương ứng để hạ cánh trên Đầu khi được ném. Toss . Nếu kết quả là Head, quăng ba lần, khác quăng ba lần. Dữ liệu quan sát được tạo bởi và giống như sau: HHH, TTT, HHH, TTT, HHH. Dữ liệu ẩn là kết quả của . Ước tính , và .c 1 c 2 p 0 p 1 p 2 c 0 c 1 c 2 c 1 c 2 c 0 p 0 p 1 p 2c0c1c2p0p1p2c0c1c2c1c2c0p0p1p2

Và từ đây : Có hai đồng xu và với và là xác suất tương ứng để hạ cánh trên Đầu khi được ném. Mỗi vòng, chọn một đồng xu ngẫu nhiên và ném nó mười lần; ghi lại kết quả. Dữ liệu quan sát được là kết quả tung được cung cấp bởi hai đồng tiền này. Tuy nhiên, chúng tôi không biết đồng tiền nào đã được chọn cho một vòng cụ thể. Ước tính và .c B p A p B p A p BcAcBpApBpApB

Trong khi tôi có thể có được các tính toán, tôi không thể liên hệ các cách chúng được giải quyết với lý thuyết EM ban đầu. Cụ thể, trong Bước M của cả hai ví dụ, tôi không thấy cách họ tối đa hóa bất cứ điều gì. Có vẻ như họ đang tính toán lại các tham số và bằng cách nào đó, các tham số mới tốt hơn các tham số cũ. Hơn nữa, hai Bước E thậm chí trông không giống nhau, chưa kể E-Step của lý thuyết ban đầu.

Vậy chính xác thì những ví dụ này hoạt động như thế nào?


Trong ví dụ đầu tiên, chúng ta nhận được bao nhiêu trường hợp của cùng một thí nghiệm? Trong ví dụ thứ hai, luật "chọn một đồng tiền ngẫu nhiên" là gì? Chúng ta quan sát được bao nhiêu vòng?
Raphael

Các tệp PDF tôi liên kết đã từng bước giải quyết hai ví dụ này. Tuy nhiên, tôi không thực sự hiểu thuật toán EM được sử dụng.
IcySnow

@IcySnow, bạn có hiểu khái niệm kỳ vọng và kỳ vọng có điều kiện của một biến ngẫu nhiên không?
Nicholas Mancuso

Tôi hiểu kỳ vọng cơ bản của một biến ngẫu nhiên và xác suất có điều kiện. Tuy nhiên, tôi không quen với kỳ vọng có điều kiện, đạo hàm và thống kê đầy đủ của nó.
IcySnow

Câu trả lời:


12

(Câu trả lời này sử dụng liên kết thứ hai mà bạn đã đưa ra.)

Nhớ lại định nghĩa về khả năng: nơi trong trường hợp của chúng tôi là ước lượng cho xác suất mà đồng tiền A và B lần lượt đứng đầu đất, là kết quả của các thí nghiệm của chúng tôi, mỗi bao gồm 10 lần lật và là đồng tiền được sử dụng trong mỗi thử nghiệm.

L[θ|X]=Pr[X|θ]=ZPr[X,Z|θ]
θ=(θA,θB)X=(X1,,X5)XiZ=(Z1,,Z5)

Chúng tôi muốn tìm công cụ ước tính khả năng tối đa . Thuật toán tối đa hóa kỳ vọng (EM) là một phương pháp như vậy để tìm (ít nhất là cục bộ) . Nó hoạt động bằng cách tìm kỳ vọng có điều kiện, sau đó được sử dụng để tối đa hóa . Ý tưởng là bằng cách liên tục tìm nhiều khả năng (tức là có thể xảy ra nhiều hơn) trong mỗi lần lặp, chúng tôi sẽ liên tục tăng do đó, làm tăng hàm likelihood. Có ba điều cần phải được thực hiện trước khi tiếp tục thiết kế một thuật toán dựa trên EM.θ^θ^θθPr[X,Z|θ]

  1. Xây dựng mô hình
  2. Tính toán kỳ vọng có điều kiện theo mô hình (E-Step)
  3. Tối đa hóa khả năng của chúng tôi bằng cách cập nhật ước tính hiện tại của chúng tôi về (M-Step)θ

Xây dựng mô hình

Trước khi chúng ta tiến xa hơn với EM, chúng ta cần tìm hiểu chính xác chúng ta đang tính toán cái gì. Trong bước E, chúng tôi đang tính toán chính xác giá trị mong đợi cho . Vậy giá trị này là gì? Quan sát rằng Lý do là chúng tôi có 5 thử nghiệm và chúng tôi không biết loại tiền nào được sử dụng trong mỗi loại. Sự bất bình đẳng là dologPr[X,Z|θ]

logPr[X,Z|θ]=i=15logC{A,B}Pr[Xi,Zi=C|θ]=i=15logC{A,B}Pr[Zi=C|Xi,θ]Pr[Xi,Zi=C|θ]Pr[Zi=C|Xi,θ]i=15C{A,B}Pr[Zi=C|Xi,θ]logPr[Xi,Zi=C|θ]Pr[Zi=C|Xi,θ].
logđược lõm và áp dụng bất bình đẳng của Jensen. Lý do chúng ta cần ràng buộc thấp hơn là chúng ta không thể tính trực tiếp arg max với phương trình ban đầu. Tuy nhiên chúng ta có thể tính toán nó cho giới hạn dưới cuối cùng.

Bây giờ gì? Đó là xác suất mà chúng ta thấy đồng xu cho thử nghiệm và . Sử dụng xác suất có điều kiện mà chúng tôi có,Pr[Zi=C|Xi,θ]CXiθ

Pr[Zi=C|Xi,θ]=Pr[Xi,Zi=C|θ]Pr[Xi|θ].

Mặc dù chúng tôi đã đạt được một số tiến bộ, chúng tôi vẫn chưa hoàn thành với mô hình. Xác suất mà một đồng tiền đã cho lật chuỗi bao nhiêu? Để Bây giờ rõ ràng là chỉ xác suất dưới cả hai khả năng của hoặc . Vì chúng tôi có, Xihi=#heads in Xi

Pr[Xi,Zi=C|θ]=12θChi(1θC)10hi,  for  C{A,B}.
Pr[Xi|θ]Zi=AZi=BPr[Zi=A]=Pr[Zi=B]=1/2
Pr[Xi|θ]=1/2(Pr[Xi|Zi=A,θ]+Pr[Xi|Zi=B,θ]).

Bước điện tử

Được rồi ... điều đó không vui lắm nhưng chúng ta có thể bắt đầu thực hiện một số công việc EM ngay bây giờ. Thuật toán EM bắt đầu bằng cách thực hiện một số dự đoán ngẫu nhiên cho . Trong ví dụ này, chúng ta có . Chúng tôi tính toán Giá trị này phù hợp với những gì trong bài báo. Bây giờ chúng ta có thể tính số lượng đầu dự kiến ​​trong từ đồng xu , Làm điều tương tự cho đồng xu chúng ta nhận được, θθ0=(0.6,0.5)

Pr[Z1=A|X1,θ]=1/2(0.650.45)1/2((0.650.45)+(0.550.55))0.45.
X1=(H,T,T,T,H,H,T,H,T,H)A
E[#heads by coin A|X1,θ]=h1Pr[Z1=A|X1,θ]=50.452.2.
B
E[#heads by coin B|X1,θ]=h1Pr[Z1=B|X1,θ]=50.552.8.
Chúng ta có thể tính toán tương tự cho số lượng đuôi bằng cách thay thế trong . Điều này tiếp tục cho tất cả các giá trị khác của và . Nhờ tính tuyến tính của kỳ vọng, chúng ta có thể tìm ra h110h1Xihi 1i5
E[#heads by coin A|X,θ]=i=15E[#heads by coin A|Xi,θ]

M-Bước

Với các giá trị dự kiến ​​của chúng tôi, giờ đến bước M nơi chúng tôi muốn tối đa hóa với các giá trị mong đợi của chúng tôi. Điều này được thực hiện bằng cách chuẩn hóa đơn giản! Tương tự như vậy đối với . Quá trình này bắt đầu lại với E-Step và và tiếp tục cho đến khi các giá trị cho hội tụ (hoặc đến một số ngưỡng cho phép). Trong ví dụ này, chúng ta có 10 lần lặp và . Trong mỗi lần lặp, giá trị của tăng lên, do ước tính tốt hơn vềθ

θA1=E[#heads over X by coin A|X,θ]E[#heads and tails over X by coin A|X,θ]=21.321.3+9.60.71.
Bθ1θθ^=θ10=(0.8,0.52)Pr[X,Z|θ]θ .

Bây giờ trong trường hợp này mô hình khá đơn giản. Mọi thứ có thể trở nên phức tạp hơn khá nhanh, tuy nhiên thuật toán EM sẽ luôn hội tụ và sẽ luôn tạo ra một công cụ ước tính khả năng tối đa . Nó có thể là một công cụ ước tính cục bộ , nhưng để giải quyết vấn đề này, chúng ta có thể khởi động lại quá trình EM với một khởi tạo khác. Chúng tôi có thể làm điều này một số lần không đổi và giữ lại kết quả tốt nhất (nghĩa là những người có khả năng cuối cùng cao nhất).θ^


Nếu bất kỳ phần nào không rõ ràng, tôi cũng có thể cố gắng mở rộng chúng.
Nicholas Mancuso

Nó trở nên rõ ràng hơn bây giờ. Điều tôi không thực sự nhận được là tại sao số lượng người đứng đầu dự kiến ​​cho đồng tiền A được tính như sau: E [#heads by coin A | X1, θ] = h1⋅Pr [Z1 = A | X1, θ] = 5⋅0,45 ≈2.2? Vấn đề được đề cập trong bản PDF đầu tiên phức tạp hơn. Nếu bạn không phiền, bạn có thể làm một số tính toán minh họa cho nó không? Rất cám ơn câu trả lời của bạn.
IcySnow

@IcySnow, theo như kỳ vọng calc đi: Heads . Lý do là bạn có thể nghĩ đến việc có một biến ngẫu nhiên chỉ báo khác nếu A được sử dụng. Tính toán kỳ vọng vào các biến chỉ báo là đơn giản xác suất của sự kiện đó. E[# heads by coin A|X1,θ]=# heads in X1Pr[Z1=A|X1,θ]=5Pr[Z1=A|X1,θ]
Nicholas Mancuso

Xin lỗi vì trả lời chậm. Nhờ có bạn, giờ đây tôi có thể thực sự hiểu logic đằng sau hai ví dụ về đồng xu, sau khi xem qua câu trả lời của bạn nhiều lần. Có một điều cuối cùng tôi muốn hỏi về câu hỏi này: Ví dụ bắt đầu từ trang 8 trong slide này cs.northwestern.edu/~ddowney/cifts/395_Winter2010/em.ppt cho thấy rằng trong M-Step, trước tiên chúng ta phải tính toán đạo hàm của hàm khả năng đăng nhập và sử dụng nó để tối đa hóa kỳ vọng. Tại sao không phải là một cái gì đó như thế trong các bước tung ví dụ? Bởi vì những bước M này không giống như chúng đang tối đa hóa mọi thứ
IcySnow

Tôi bối rối bởi phương trình hiển thị đầu tiên sau khi "Xây dựng mô hình". Bạn có thể giải thích nơi đó đến từ đâu? Có vẻ với tôi như , vì vậy số tiền bên trong là 1 cho mỗi , vì vậy toàn bộ phía bên tay phải trở thành số không. Tôi chắc chắn rằng tôi đang thiếu một cái gì đó - bạn có thể đánh vần lý do về cách bạn có được phương trình đó không? Pr[Zi=A|Xi,θ]+Pr[Zi=B|Xi,θ]=1i
DW
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.