Làm thế nào để bạn so sánh hai quá trình Gaussian?


14

Phân kỳ Kullback-Leibler là một số liệu để so sánh hai hàm mật độ xác suất, nhưng số liệu nào được sử dụng để so sánh hai GP của XY ?


d(X,Y)=E[supt|X(t)Y(t)|]
Zen

@Zen: Nếu bạn có thời gian, tôi muốn biết thêm về số liệu khoảng cách này.
Neil G

Xin chào, Neil. Tôi không biết nhiều về nó. Xin vui lòng, xem câu trả lời của tôi dưới đây.
Zen

Câu trả lời:


8

Lưu ý rằng sự phân bố các quá trình Gaussian XR là phần mở rộng của Gaussian đa biến cho có thể vô hạn X. Do đó, bạn có thể sử dụng phân kỳ KL giữa các phân phối xác suất GP bằng cách tích hợp trên RX :

DKL(P|Q)=RXlogdPdQdP.

Bạn có thể sử dụng các phương thức MC để tính gần đúng số lượng này trên rời rạc bằng cách lặp lại các quy trình lấy mẫu theo phân phối GP của chúng. Tôi không biết tốc độ hội tụ có đủ tốt không ...X

Lưu ý rằng nếu là hữu hạn với | X | = N , sau đó bạn rơi trở lại vào phân kỳ KL thông thường cho phân phối chuẩn đa biến: D K L ( G P ( μ 1 , K 1 ) , G P ( μ 2 , K 2 ) ) = 1X|X|=n

DKL(GP(μ1,K1),GP(μ2,K2))=12(tr(K21K1)+(μ2μ1)K21(μ2μ1)n+log|K2||K1|)

Làm thế nào tôi có thể tính hai phương tiện (mu1 và mu2) bạn đã đề cập. Hoặc tôi nên lấy chúng bằng 0 như bình thường cho quá trình gaussian?
Marat Zakirov

4

Hãy nhớ rằng nếu là một Quá trình Gaussian với hàm trung bình m và hàm hiệp phương sai K , thì, với mọi t 1 , giật , t kT , vectơ ngẫu nhiên ( X ( t 1 ) , Lít , X ( t k ) ) có phân phối chuẩn nhiều biến số với vectơ trung bình ( m ( t 1 ) , Vượt , mX:T×ΩRmKt1,,tkT(X(t1),,X(tk)) và hiệp phương sai ma trận Σ(m(t1),,m(tk)) , nơi chúng tôi đã sử dụng tên viết tắt phổ biến X ( t ) = X ( t ,Σ=(σij)=(K(ti,tj)) .X(t)=X(t,)

Mỗi nhận thức X(,ω)TT=[0,1]XYX(,ω)Y(,ω)supt[0,1]|X(t,ω)Y(t,ω)|XY

d(X,Y)=E[supt[0,1]|X(t)Y(t)|].()
I don't know if there is an analytical expression for this distance, but I believe you can compute a Monte Carlo approximation as follows. Fix some fine grid 0t1<<tk1, and draw samples (xi1,,xik) and (yi1,,yik) from the normal random vectors (X(t1),,X(tk)) and (Y(t1),,Y(tk)), respectively, for i=1,,N. Approximate d(X,Y) by
1Ni=1Nmax1jk|xijyij|.

How do you sample from each vector? If you only sample the means in each of the GPs you do not take into account the variances. Otherwise you will have to devise a sampling technique that is consistent.
pushkar

This is an excellent resource: gaussianprocess.org/gpml/chapters
Zen

You may also read all the answers to this question: stats.stackexchange.com/questions/30652/…
Zen

Pay attention that this is not a distance since d(X,X)0. As the KL compares two distributions and not two realisations, Zen's distance between two GPs should be defined as d(G1,G2)=EXG1,YG2[supt|X(t)Y(t)|], and we have that EXG,YGsupt|X(t)Y(t)|>0 for non degenerated Gaussian process G.
Emile

@Emile: how is it that d(X,X)0 using definition ()?
Zen
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.