L2Khoảng cách , như được đề xuất trong một nhận xét của người dùng39665. Đây là:
Lưu ý rằng, như đã thấy trong phần 8.1.8 của sách nấu ăn ma trận :
để điều này có thể được đánh giá dễ dàng trong thời gian .L2(P,Q)2=∫(p(x)−q(x))2dx=∫(∑iαipi(x)−∑jβjqj(x))2dx=∑i,i′αiαi′∫pi(x)pi′(x)dx+∑j,j′βjβj′∫qj(x)qj′(x)dx−2∑i,jαiβj∫pi(x)qj(x)dx.
∫N(x;μ,Σ)N(x;μ′,Σ′)dx=N(μ;μ′,Σ+Σ′)
O(mn)
Sự khác biệt trung bình tối đa (MMD) với hạt nhân RBF Gaussian. Đây là một khoảng cách tuyệt vời, chưa được biết đến nhiều trong cộng đồng thống kê, cần một chút toán học để xác định.
Để
xác định không gian Hilbert là không gian tái tạo hạt nhân Hilbert tương ứng với : .k(x,y):=exp(−12σ2∥x−y∥2),
Hkk(x,y)=⟨φ(x),φ(y)⟩H
Xác định hạt nhân bản đồ trung bình là
K(P,Q)=EX∼P,Y∼Qk(X,Y)=⟨EX∼Pφ(X),EY∼Qφ(Y)⟩.
MMD sau đó là
MMD(P,Q)=∥EX∼P[φ(X)]−EY∼Q[φ(Y)]∥=K(P,P)+K(Q,Q)−2K(P,Q)−−−−−−−−−−−−−−−−−−−−−−−−−√=supf:∥f∥H≤1EX∼Pf(X)−EY∼Qf(Y).
Đối với hỗn hợp và của chúng tôi , lưu ý rằng
và tương tự cho và .PQK(P,Q)=∑i,jαiβjK(Pi,Qj)
K(P,P)K(Q,Q)
Hóa ra, sử dụng các thủ thuật tương tự như đối với , rằng là
L2K(N(μ,Σ),N(μ′,Σ′))(2πσ2)d/2N(μ;μ′,Σ+Σ′+σ2I).
Khi , rõ ràng điều này hội tụ đến bội số của khoảng cách . Tuy nhiên, thông thường bạn muốn sử dụng một , theo thang đo của biến thể dữ liệu.σ→0L2σ
Các dạng đóng cũng có sẵn cho các hạt nhân đa thức trong MMD; xemk
Muandet, Fukumizu, Dinuzzo và Schölkopf (2012). Học hỏi từ các bản phân phối thông qua các máy đo hỗ trợ. Trong những tiến bộ trong hệ thống xử lý thông tin thần kinh ( phiên bản chính thức ). arXiv: 1202.6504 .
Đối với nhiều thuộc tính tốt đẹp của khoảng cách này, xem
Sriperumbudur, Gretton, Fukumizu, Schölkopf và Lanckriet (2010). Hilbert nhúng không gian và số liệu về các biện pháp xác suất. Tạp chí nghiên cứu máy học, 11, 1517 Từ1561 . arXiv: 0907.5309 .