Khoảng cách Trái đất (EMD) giữa hai Gaussian


26

Có một công thức hình thức đóng cho (hoặc một số loại ràng buộc trên) EMD giữa x1N(μ1,Σ1)x2N(μ2,Σ2) ?


2
Theo en.wikipedia.org/wiki/Earth_mover%27s_distance EMD giống như khoảng cách Mallows hoặc Wasserstein, vì vậy bạn có thể thử googlin đó.
kjetil b halvorsen

2
Bạn có thể thấy bài viết này hữu ích: vldb.org/pvldb/vol5/p205_brianeruttenberg_vldb2012.pdf
jojer

Câu trả lời:


27

khoảng cách các mover trái đất có thể được viết như , nơi infimum được thực hiện trên tất cả các bản phân phối chung của XY với marginals X \ sim P , Y \ sim Q . Đây còn được gọi là khoảng cách Wasserstein đầu tiên , đó là W_p = \ inf \ left (\ E \ lVert X - Y \ rVert ^ p \ right) ^ {1 / p} với cùng mức tối thiểu.EMD(P,Q)=infEXYXYXPYQWp=inf(EXYp)1/p

Đặt XP=N(μx,Σx) , YQ=N(μy,Σy) .

Giới hạn dưới: Do bất đẳng thức của Jensen, vì các chỉ tiêu là lồi,

EXYE(XY)=μxμy,
vì vậy EMD luôn luôn ít nhất là khoảng cách giữa các phương tiện (đối với bất kỳ phân phối nào).

Giới hạn trên dựa trên W2 : Một lần nữa bởi bất đẳng thức của Jensen, (EXY)2EXY2 . Do đó, W1W2 . Nhưng Dowson và Landau (1982) thiết lập rằng

W2(P,Q)2=μxμy2+tr(Σx+Σy2(ΣxΣy)1/2),
đưa ra giới hạn trên cho EMD=W1 .

Giới hạn trên chặt chẽ hơn: Hãy xem xét khớp nối Đây là bản đồ được dẫn xuất bởi Knott và Smith (1984) , Về ánh xạ tối ưu của các bản phân phối , Tạp chí Lý thuyết và Ứng dụng Tối ưu hóa, 43 (1) Trang 39-49 là ánh xạ tối ưu cho ; xem thêm bài blog này . Lưu ý rằng và

XN(μx,Σx)Y=μy+Σx12(Σx12ΣyΣx12)12Σx12A(Xμx).
W2A=AT
EY=μy+A(EXμx)=μyVarY=AΣxAT=Σx12(Σx12ΣyΣx12)12Σx12ΣxΣx12(Σx12ΣyΣx12)12Σx12=Σx12(Σx12ΣyΣx12)Σx12=Σy,
để khớp nối hợp lệ.

Khoảng cách là , trong đó bây giờ là bình thường với XYD

D=XY=XμyA(Xμx)=(IA)Xμy+Aμx,
ED=μxμyVarD=(IA)Σx(IA)T=Σx+AΣxAAΣxΣxA=Σx+ΣyΣx12(Σx12ΣyΣx12)12Σx12Σx12(Σx12ΣyΣx12)12Σx12.

Do đó, giới hạn trên của là . Thật không may, một hình thức đóng cho kỳ vọng này là khó chịu đáng ngạc nhiên để viết ra cho các quy tắc đa biến nói chung: xem câu hỏi này , cũng như câu hỏi này .W1(P,Q)ED

Nếu phương sai của kết thúc là hình cầu (ví dụ: , , thì phương sai của trở thành ) câu hỏi đưa ra câu trả lời dưới dạng đa thức Laguerre tổng quát.DΣx=σx2IΣy=σy2ID(σxσy)2I

Nói chung, chúng tôi có một giới hạn trên đơn giản cho dựa trên sự bất bình đẳng của Jensen, xuất phát, ví dụ trong câu hỏi đầu tiên: ED

(ED)2ED2=μxμy2+tr(Σx+ΣyAΣxΣxA)=μxμy2+tr(Σx)+tr(Σy)2tr(Σx12(Σx12ΣyΣx12)12Σx12)=μxμy2+tr(Σx)+tr(Σy)2tr((Σx12ΣyΣx12)12)=W2(P,Q)2.
Sự bình đẳng ở cuối là vì các ma trận và tương tự , vì vậy chúng có cùng giá trị riêng, và do đó căn bậc hai của chúng có cùng dấu vết.ΣxΣyΣx12ΣyΣx12=Σx12(ΣxΣy)Σx12

Sự bất bình đẳng này rất nghiêm ngặt miễn là không suy biến, đó là hầu hết các trường hợp khi .DΣxΣy

Một phỏng đoán : Có thể điều này gần hơn giới hạn trên, , là chặt chẽ. Sau đó, một lần nữa, tôi đã có một giới hạn trên khác nhau ở đây trong một thời gian dài mà tôi phỏng đoán là chặt chẽ mà thực tế lại lỏng lẻo hơn so với , vì vậy có lẽ bạn không nên tin vào phỏng đoán này quá nhiều. :)EDW2

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.