Câu hỏi về cách sử dụng EM để ước tính các tham số của mô hình này


8

Tôi đang cố gắng hiểu EM và cố gắng suy ra các tham số của mô hình này bằng kỹ thuật này nhưng gặp khó khăn trong việc hiểu làm thế nào để bắt đầu:

Vì vậy, tôi có một mô hình hồi quy tuyến tính có trọng số như sau khi tôi có các quan sát và các quan sát tương ứng . Mô hình mối quan hệ giữa và là mô hình hồi quy tuyến tính có trọng số và các giả định phân phối như sau:X=(xi,x2....xn)Y=(y1,y2....yn)XY

yiN(βTxi,σ2wi)
βN(0,Σβ)
wiG(a,b)

Ở đây là các tham số hồi quy và mô hình cho phép các phương sai không bằng nhau bằng cách có các biến trả lời để có các trọng số riêng cho phương sai. Mục tiêu của tôi là tìm mối quan hệ tuyến tính rất có thể được đưa ra bởi các tham số .ββ

Vì vậy, bây giờ tôi có thể viết log-posterior như sau:

logP(Y,β,w|X)=i=1n(logP(yi|xi,β,wi)+logP(wi))+logP(β)

Bây giờ, tôi đã cố gắng hiểu EM và không chắc rằng sự hiểu biết của tôi vẫn chưa hoàn chỉnh nhưng vì tôi hiểu nó, để bắt đầu ước tính các tham số, tôi bắt đầu bằng cách kỳ vọng phân phối log-posterior đối với các tham số tiềm ẩn / ẩn mà trong trường hợp của tôi là và . Vì vậy, giá trị mong đợi này sẽ là:logP(Y,β,w|X)βw

P(β,w|X)logP(Y,β,w|X)dwdβ

Tuy nhiên, tôi không biết làm thế nào để tiến hành từ đây để tính toán kỳ vọng này. Sẽ đánh giá rất cao bất kỳ đề xuất về những gì bước tiếp theo nên được. Tôi không tìm kiếm ai đó để lấy cho tôi tất cả những điều cần thiết mà chỉ là một cú huých đúng hướng về những gì tôi nên tìm cách giải quyết trong các bước tiếp theo.


Bạn có chắc chắn EM như trong Kỳ vọng - Tối đa hóa áp dụng cho vấn đề của bạn không?
Tây An

Tôi nghĩ vậy. Tôi đang cố gắng để hiểu một bài báo và họ sử dụng EM để giải bài toán hồi quy tuyến tính có trọng số này.
Luca

Các biến tiềm ẩn không thể là và 's. Nếu bạn quan tâm đến , các biến tiềm ẩn có lẽ là của . Trong trường hợp đó, bạn phải tìm thấy hàm hoàn thành dự kiến của bước E và tối ưu hóa nó trong trong bước M. βwiβwiQ(β|β0)β
Tây An

Cám ơn bạn đã góp ý. Nếu tôi có thể thử và làm rõ, bài báo có đề cập rằng chúng tôi quan tâm đến việc tối đa hóa khả năng nhật ký chưa hoàn thành nhưng chúng tôi làm việc với khả năng dữ liệu hoàn chỉnh được đưa ra bởi: , mà đối với tôi trông giống như phân phối sau trong thiết lập này. Vì vậy, tôi giả sử đang được coi là một ẩn số trong thiết lập này. logp(Y|X)logP(y,w,β|X)β
Luca

2
Bao nhiêu bạn đã biết về thuật toán EM? Những cuốn sách hoặc giấy bạn đã nghiên cứu về nó? Bắt đầu từ đầu trên một diễn đàn như thế này nghe có vẻ là một ý tưởng tồi.
Tây An

Câu trả lời:


3

Trước tiên, hãy để tôi nhớ lại những điều cơ bản của thuật toán EM. Khi tìm kiếm ước tính khả năng tối đa về khả năng của biểu mẫu thuật toán tiến hành bằng cách tối đa hóa khả năng đăng nhập tối đa (M) dự kiến ​​(E) kết quả trong việc tối đa hóa (trong ) tại lặp chức năng Do đó, thuật toán phải bắt đầu bằng cách xác định biến tiềm ẩn và phân phối có điều kiện của nó.

f(x,z|β)dz,
βt
Q(β|βi)=logf(x,z|β)f(z|x,βt)dz
z

Trong trường hợp của bạn, có vẻ như biến tiềm ẩn là được tạo bởi trong khi tham số quan tâm là . Nếu bạn xử lý cả và dưới dạng các biến tiềm ẩn thì sẽ không còn tham số nào để tối ưu hóa. Tuy nhiên, điều này cũng có nghĩa là trước không được sử dụng.ϖwiββϖβ

Nếu chúng ta nhìn chính xác hơn vào trường hợp của , phân phối có điều kiện của nó được đưa ra bởi có nghĩa là một phân phối.wi

f(wi|xi,yi,β)wiexp{wi(yiβTxi)2/2σ2}×wia1exp{bwi}
G(a+1/2,b+(yiβTxi)2/2σ2)

Khả năng đăng nhập đã hoàn thành là phần phụ thuộc trên đơn giản hóa là và hàm tỷ lệ thuận với Tối đa hóa hàm này trong lên tới hồi quy tuyến tính có trọng số, với trọng số

i12{log(wi)wi(yiβTxi)2/σ2}
β
iwi(yiβTxi)2/2σ2
Q(β|βt)
E[iwi(yiβTxi)2|X,Y,βt]=iE[wi|X,Y,βt](yiβTxi)2=ia+1/2b+(yiβtTxi)2/2σ2(yiβTxi)2
β
a+1/2b+(yiβtTxi)2/2σ2

Cảm ơn vì điều này và tôi sẽ trải qua điều này một cách nghiêm ngặt. Tuy nhiên, công việc này tôi đang xem không coi là một biến ẩn. Họ đề cập đến việc họ kỳ vọng với hình thức gần đúng của sau gần đúng với . Vì vậy, bit này làm tôi thực sự bối rối ...βQ(β,w)Q(w)Q(β)
Luca

1
Nếu bạn coi cả và là các biến tiềm ẩn, thì không còn tham số nào nữa ...βw
Xi'an

1
Có lẽ những gì họ có mái vòm là ước tính MAP thay vì ước tính ML. Nếu tôi thử và định dạng lại điều này như ước tính MAP, tôi có đoán là bản phân phối đó sẽ phát huy tác dụng không? β
Luca

1
Một điều rất nhanh ... Tôi không chắc liệu bạn có thấy điều này không nhưng khi bạn có phương trình cho khả năng đăng nhập hoàn chỉnh, thì thuật ngữ đầu tiên không phải là ? Ngoài ra, tôi đoán thuật ngữ bạn hiển thị là khả năng đăng nhập tỷ lệ thuận với hằng số. Tôi luôn bối rối với điều này khi mọi thứ được cuộn lại thành hằng số. log(wi)
Luca

1
chỉnh sửa được thực hiện: Tôi đặt trước toàn bộ biểu thức. 1/2
Tây An
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.