Làm thế nào để chứng minh bất đẳng thức Gaussian Mixture này? (Lắp / quá mức)


8

Hãy f [x] là một hỗn hợp pdf Gaussian với n về trọng lượng đồng đều, phương tiện , và chênh lệch tương ứng { σ 1 , . . . , Σ n } :{μ1,...,μn}{σ1,...,σn}

f(x)1ni=1n12πσi2e(xμi)22σi2

Dường như trực quan rằng tính thích log của mẫu được lấy mẫu tại các trung tâm Gaussian sẽ lớn hơn (hoặc bằng) giá trị log-likelihood trung bình:

1nj=1nln(f(μj))f(x)ln(f(x))dx

Đây rõ ràng là đúng đối với chênh lệch nhỏ (mỗi là trên đỉnh của một Gaussian hẹp) và chênh lệch rất lớn (tất cả các μ i 's là trên đỉnh một rộng Gaussian với nhau), và nó được đúng đối với tất cả các bộ μ i ' s và σ i là tôi đã tạo và tối ưu hóa, nhưng tôi không thể tìm cách để chứng minh rằng nó là luôn luôn đúng. Cứu giúp?μiμiμiσi


Có lẽ bạn đang thiếu một kỳ vọng vào các lhs?
lacerbi

@lacerbi Không, tôi thì không. Không có thứ gì bị mất cả. Trên LHS, các được đánh giá tại chỉ mục x i 'sf(x)xi
Jerry Guern

Vâng, xin lỗi - tôi đã quá buồn ngủ và tôi đã đọc sai định nghĩa.
lacerbi

Câu trả lời:


2

Đây là nhiều hơn một bình luận mở rộng, vì vậy hãy xem nó như vậy. Xác định: (Tôi đang sử dụng các ký hiệu tiêu chuẩn cho các bản phân phối Gaussian).

f(x)1ni=1nN(x|xi,σi2)

Bạn muốn chứng minh rằng: {1

1ni=1nlogf(xi)f(x)logf(x)dx0
{1ni=1nlogf(xi)}+H[f]0.

Do Bất đẳng thức Jensen (xem ví dụ Huber et al, On Entropy xấp xỉ cho Gaussian Hỗn hợp ngẫu nhiên Vectors, 2008. ), vớigi(x)1

H[f]1ni=1nlogf(x)N(x|xi,σi2)dx=1ni=1nloggi(xi)
, mà xuất phát từ chập của hai mật độ Gauss. Vì vậy, chúng tôi nhận được: {1gi(x)1nj=1nN(x|xj,σi2+σj2) Thật thú vị,givẫn là hỗn hợp của Gaussian với thành phần có nghĩa là bằng với các thành phần trongf, nhưng mỗi thành phần củagicó phương sai lớn hơn hoàn toàn so với thành phần tương ứng của nó trongf. Bạn có thể làm bất cứ điều gì với điều này?
{1ni=1nlogf(xi)}+H[f]1ni=1nlogf(xi)gi(xi).
gifgif

Cảm ơn bạn. Có vẻ như tôi vừa chứng minh rằng RHS cuối cùng là> = 0, cũng có vẻ trực quan nhưng khó để chứng minh, nhưng đây thực sự là một bước đi đúng hướng. Tôi đã thấy tờ giấy đó trước đây.
Jerry Guern

Thật hấp dẫn khi nghĩ rằng RHS cuối cùng luôn tích cực, nhưng tôi thực sự không thể chứng minh điều đó.
Jerry Guern

0

Tôi nghĩ rằng tôi đã nhận nó. Nó chỉ thực hiện các bước cơ bản, mặc dù bạn cần kết hợp chúng ngay.

fii12πσi2e(xμi)22σi2

g(x)=xlog(x)f(x)log(f(x))1ni=1nfi(x)log(fi(x))

f(x)log(f(x))dx1ni=1nfi(x)log(fi(x))dx

iffi

log(f(μi))log(fi(μi))
1ni=1nlog(f(μi))1ni=1nlog(fi(μi))
1ni=1nlog(fi(μi))1ni=1nfi(x)log(fi(x))
log(fi(μi))=fi(x)log(fi(μi))dxfi(x)log(fi(x))dx
in

Tôi bối rối. Bạn đã xác định ag (x) nhưng không bao giờ sử dụng nó và tôi không biết f_i của bạn có nghĩa là gì.
Jerry Guern

figg(1ni=1nfi(x))1ni=1ng(fi(x))

f>=fi1/nfi

1
1ni=1nlog(f(μi))1ni=1nlog(fi(μi))

1
Vâng, tôi nhận ra nó ngày hôm qua. Có vẻ như sự bất bình đẳng này khá khó khăn, dù sao tôi cũng sẽ để lại câu trả lời của mình bằng một chỉnh sửa.
sjm.majewski
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.