Làm thế nào để chứng minh rằng hàm cơ sở xuyên tâm là một hạt nhân?


35

Làm thế nào để chứng minh rằng hàm cơ sở xuyên tâm là một hạt nhân? Theo tôi hiểu, để chứng minh điều này, chúng tôi phải chứng minh một trong những điều sau đây:k(x,y)=exp(||xy||2)2σ2)

  1. Đối với bất kỳ tập hợp vectơ matrix = là semidefinite dương.x1,x2,...,xnK(x1,x2,...,xn)(k(xi,xj))n×n

  2. Một ánh xạ có thể được trình bày như = .Φk(x,y)Φ(x),Φ(y)

Có ai giúp đỡ không?


1
Chỉ cần liên kết rõ ràng hơn: bản đồ tính năng cũng được thảo luận trong câu hỏi này , đặc biệt là câu trả lời của Marc Claesen dựa trên loạt Taylor và của tôi , thảo luận về cả RKHS và phiên bản chung của nhúng do Douglas đưa ra dưới đây. L2
Dougal

Câu trả lời:


26

Zen đã sử dụng phương pháp 1. Đây là phương pháp 2: Ánh đến phân bố Gauss đối xứng hình cầu có tâm ở trong không gian Hilbert . Độ lệch chuẩn và một yếu tố không đổi phải được điều chỉnh để điều này hoạt động chính xác. Ví dụ: trong một chiều,xxL2

exp[(xz)2/(2σ2)]2πσexp[(yz)2/(2σ2)2πσdz=exp[(xy)2/(4σ2)]2πσ.

Vì vậy, hãy sử dụng độ lệch chuẩn của và chia tỷ lệ phân phối Gaussian để lấy . Sự thay đổi kích thước cuối cùng này xảy ra bởi vì định mức của phân phối bình thường không phải là 1 nói chung.σ/2k(x,y)=Φ(x),Φ(y)L21


2
@Zen, Douglas Zare: cảm ơn bạn vì câu trả lời tuyệt vời của bạn. Làm thế nào tôi có thể chọn câu trả lời chính thức bây giờ?
Leo

23

Tôi sẽ sử dụng phương pháp 1. Kiểm tra câu trả lời của Douglas Zare để tìm bằng chứng sử dụng phương pháp 2.

Tôi sẽ chứng minh trường hợp khi là số thực, vì vậy . Trường hợp chung theo sau những sửa đổi thích hợp từ cùng một lập luận và đáng để thực hiện.k ( x , y ) = exp ( - ( x - y ) 2 / 2 σ 2 )x,yk(x,y)=exp((xy)2/2σ2)

Không mất tính tổng quát, giả sử rằng .σ2=1

Viết , trong đó là hàm đặc trưng của biến ngẫu nhiên có phân phối .h ( t ) = exp ( - t 2k(x,y)=h(xy)ZN(0,1)

h(t)=exp(t22)=E[eitZ]
ZN(0,1)

Đối với các số thực và , chúng ta có trong đó đòi hỏi là hàm semidefinite dương, hay còn gọi là kernel.a 1 , Bắn , a n n j , k = 1 a jx1,,xna1,,ank

j,k=1najakh(xjxk)=j,k=1najakE[ei(xjxk)Z]=E[j,k=1najeixjZakeixkZ]=E[|j=1najeixjZ|2]0,
k

Để hiểu kết quả này trong tính tổng quát cao hơn, hãy xem Định lý của Bochner: http://en.wikipedia.org/wiki/Positive-definite_feft


2
Đây là một khởi đầu tốt, đúng hướng, với hai cảnh báo: (a) không bằng với kỳ vọng được hiển thị (kiểm tra dấu trong số mũ) và (b) điều này xuất hiện để hạn chế sự chú ý đến trường hợp trong đó và là vô hướng và không phải vectơ. Trong khi đó, tôi đã ủng hộ, vì giải trình rất hay và sạch sẽ và tôi chắc chắn bạn sẽ nhanh chóng cắm những khoảng trống nhỏ này. :-)x yh(t)xy
Đức hồng y

1
Tks! Tôi đang vội ở đây. :-)
Zen

1
Xin lỗi, tôi thực sự không thấy cách bạn quản lý những sửa đổi thích hợp ở đây. Nếu bạn xây dựng định mức trước khi chuyển sang biểu mẫu , thì bạn đã có sản phẩm và bạn không thể trao đổi sản phẩm và tổng hợp. Và tôi chỉ đơn giản là không thấy cách phát triển định mức sau khi chuyển sang dạng h để có được biểu thức đẹp. Bạn có thể dẫn tôi một chút ở đó không? :)h
Alburkerk

23

Tôi sẽ thêm một phương thức thứ ba, chỉ để đa dạng: xây dựng kernel từ một chuỗi các bước chung được biết để tạo hạt nhân pd. Đặt biểu thị miền của các hạt nhân bên dưới và các bản đồ tính năng. φXφ

  • Tỷ lệ: Nếu là hạt nhân pd, thì cho bất kỳ hằng số .gamma k gamma > 0κγκγ>0

    Bằng chứng: nếu là bản đồ tính năng cho , là bản đồ tính năng hợp lệ cho .k φκgammakγφγκ

  • Tổng: Nếu và là hạt nhân pd, thì .κ 2 κ 1 + κ 2κ1κ2κ1+κ2

    Bằng chứng: nối các tính năng maps và , để có .φ 2 x [ φ 1 ( x ) φ 2 ( x ) ]φ1φ2x[φ1(x)φ2(x)]

  • Giới hạn: Nếu là hạt nhân pd và tồn tại với mọi , thì là pd.κ ( x , y ) : = lim n κ n ( x , y ) x , y κκ1,κ2,κ(x,y):=limnκn(x,y)x,yκ

    Chứng minh: Với mỗi và mọi chúng ta có . Lấy giới hạn là cung cấp cùng một thuộc tính cho .{ ( x i , c i ) } m i = 1X × R Σ m i = 1 c i κ n ( x i , x j ) c j0 n κm,n1{(xi,ci)}i=1mX×Ri=1mciκn(xi,xj)cj0nκ

  • Sản phẩm: Nếu và là hạt nhân pd, thì .κ 2 g ( x , y ) = κ 1 ( x , y )κ1κ2g(x,y)=κ1(x,y)κ2(x,y)

    Bằng chứng: Nó xuất hiện ngay sau định lý sản phẩm Schur , nhưng Schölkopf và Smola (2002) đưa ra bằng chứng cơ bản, tốt đẹp sau đây. Đặt độc lập. Như vậy Ma trận hiệp phương sai phải là psd, vì vậy việc xem xét ma trận hiệp phương sai của chứng minh điều đó. C o v ( V i W i , V j W j ) = C o v ( V i , V j )

    (V1,,Vm)N(0,[κ1(xi,xj)]ij)(W1,,Wm)N(0,[κ2(xi,xj)]ij)
    Cov(ViWi,VjWj)=Cov(Vi,Vj)Cov(Wi,Wj)=κ1(xi,xj)κ2(xi,xj).
    (V1W1,,VnWn)
  • Quyền hạn: Nếu là hạt nhân pd, thì với mọi số nguyên dương .κκn(x,y):=κ(x,y)nn

    Bằng chứng: ngay lập tức từ tài sản "sản phẩm".

  • Số mũ: Nếu là hạt nhân pd, thì .κeκ(x,y):=exp(κ(x,y))

    Chứng minh: Chúng tôi có ; sử dụng các thuộc tính "quyền hạn", "tỷ lệ", "tổng" và "giới hạn".eκ(x,y)=limNn=0N1n!κ(x,y)n

  • Hàm: Nếu là hạt nhân pd và , cũng vậy.κf:XRg(x,y):=f(x)κ(x,y)f(y)

    Chứng minh: Sử dụng bản đồ đặc trưng .xf(x)φ(x)

Bây giờ, lưu ý rằng Bắt đầu với kernel tuyến tính , áp dụng "tỷ lệ" với , áp dụng "số mũ" và áp dụng "hàm" với .

k(x,y)=exp(12σ2xy2)=exp(12σ2x2)exp(1σ2xTy)exp(12σ2y2).
κ(x,y)=xTy1σ2xexp(12σ2x2)
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.