Bản đồ tính năng cho nhân Gaussian


24

Trong SVM, hạt nhân Gaussian được định nghĩa là: trong đó . Tôi không biết phương trình tường minh của \ phi . Tôi muốn biết điều đó.

K(x,y)=exp(xy222σ2)=ϕ(x)Tϕ(y)
x,yRnϕ

Tôi cũng muốn biết liệu

iciϕ(xi)=ϕ(icixi)
nơi ciR . Bây giờ, tôi nghĩ rằng nó không bằng nhau, bởi vì sử dụng kernel xử lý tình huống mà trình phân loại tuyến tính không hoạt động. Tôi biết ϕ dự án x đến một không gian vô tận. Vì vậy, nếu nó vẫn duy trì tuyến tính, bất kể nó có bao nhiêu kích thước, svm vẫn không thể phân loại tốt.

Tại sao hạt nhân này ngụ ý một sự chuyển đổi? Hay bạn đang đề cập đến không gian tính năng liên quan?
Placidia

Có, không gian tính năng là gì ϕ() sao cho φT(x)φ(x')= =exp(-12σ2x-x'2)
dùng27886

Câu trả lời:


20

Bạn có thể có được phương trình rõ ràng của φ cho hạt nhân Gaussian thông qua việc mở rộng chuỗi Tailor của ex . Để đơn giản hóa công chứng, giả sử xR1 :

φ(x)= =e-x2/2σ2[1,11!σ2x,12!σ4x2,13!σ6x3,Giáo dục]T

Điều này cũng được thảo luận chi tiết hơn trong các slide này bởi Chih-Jen Lin của NTU (cụ thể là slide 11). Lưu ý rằng trong các trang chiếu được sử dụng làm tham số kernel.γ= =12σ2

Phương trình trong OP chỉ giữ cho hạt nhân tuyến tính.


2
Xin chào, nhưng phương trình này ở trên chỉ phù hợp với một chiều.
Vivian

Vì vậy, ở đây, không gian Hilbert kernel tái tạo là một không gian con của , đúng không? 2
The_Anomaly

Có phải cũng có một đại diện rõ ràng của hạt nhân Laplacian?
Felix Crazzolara

13

Đối với bất kỳ hạt nhân psd hợp lệ nào , tồn tại một bản đồ đặc trưng sao cho . Không gian và nhúng trên thực tế không cần phải là duy nhất, nhưng có một cặp duy nhất quan trọng được gọi là không gian Hilbert nhân bản (RKHS). φ : XH k ( x , y ) = φ ( x ) , φ ( y ) Hk:X×XRφ:XHk(x,y)= =φ(x),φ(y)H φ ( H , φ )Hφ(H,φ)

RKHS được thảo luận bởi: Steinwart, Hush và Scigs, Mô tả rõ ràng về các hạt nhân tái tạo hạt nhân Hilbert của hạt nhân Gaussian RBF , Giao dịch của IEEE về lý thuyết thông tin 2006 ( doi , pdf citeseer miễn phí ).

Nó hơi phức tạp, nhưng nó hiểu rõ điều này: định nghĩa là e n ( z ) : = en:CC

en(z): =(2σ2)nn!zne-σ2z2.

Đặt là một chuỗi trong tất cả các tuples của các số nguyên không âm; if , có lẽ , , , v.v. Biểu thị thành phần thứ của thứ tuple bởi . d d = 3 n ( 0 ) = ( 0 , 0 , 0 ) n ( 1 ) = ( 0 , 0 , 1 ) n ( 2 ) = ( 0 , 1 , 1 ) j i n i jn:N0N0ddd= =3n(0)= =(0,0,0)n(1)= =(0,0,1)n(2)= =(0,1,1)jtôintôij

Khi đó, thành phần thứ của là . Vì vậy, ánh xạ các vectơ trong thành các vectơ phức chiều vô hạn.φ ( x ) d j = 1 e n i jtôiφ(x)φ R dΠj= =1dentôij(xj)φRd

Điều hấp dẫn ở đây là chúng ta phải xác định thêm các định mức cho các vectơ phức vô hạn này theo một cách đặc biệt; xem giấy để biết chi tiết


Steinwart và cộng sự. cũng đưa ra một cách đơn giản hơn (theo suy nghĩ của tôi) nhúng vào , không gian Hilbert của các hàm có thể tích hợp vuông từ : Lưu ý rằng là chính nó một chức năng từ để . Đó là về cơ bản là mật độ của một chiều Gaussian với trung bình và hiệp phương sai ; chỉ có hằng số chuẩn hóa là khác nhau. Vì vậy, khi chúng ta lấy R dL2(Rd)Φ σ ( x ) = ( 2 σ ) dRdRΦσ(x)RdRdx1

Φσ(x)= =(2σ)d2πd4e-2σ2x-22.
Φσ(x)RdRdxΦ(x),Φ(y)L2=[Φ(x)](t)14σ2tôi
Φ(x),Φ(y)L2= =[Φ(x)](t)[Φ(y)](t)dt,
chúng tôi đang lấy sản phẩm của các hàm mật độ Gaussian , bản thân nó là một hằng số nhất định nhân với các hàm mật độ Gaussian. Khi bạn thực hiện tích phân đó bằng , thì hằng số rơi ra cuối cùng chính xác là .tk(x,y)

Đây không phải là nhúng duy nhất hoạt động.

Một cách khác dựa trên biến đổi Fourier, bài báo nổi tiếng của Rahimi và Recht ( Tính năng ngẫu nhiên cho các máy hạt nhân quy mô lớn , NIPS 2007) có hiệu quả rất lớn.

Bạn cũng có thể làm điều đó bằng cách sử dụng chuỗi Taylor: hiệu quả là phiên bản vô hạn của Cotter, Keshet và Srebro, xấp xỉ rõ ràng của hạt nhân Gaussian , arXiv: 1109.4603 .


1
Douglas Zare đã đưa ra một phiên bản 1d của việc nhúng "đơn giản hơn" trong một chủ đề thú vị ở đây .
Dougal

Tại đây, bạn tìm thấy một lời giải thích 'trực quan' hơn rằng có thể ánh xạ lên một khoảng không gian bằng với kích thước của mẫu đào tạo, ngay cả đối với một mẫu đào tạo vô hạn: stats.stackexchange.com/questions/80398/,Φ

6

Dường như với tôi rằng phương trình thứ hai của bạn sẽ chỉ đúng nếu là ánh xạ tuyến tính (và do đó là hạt nhân tuyến tính). Vì hạt nhân Gaussian là phi tuyến tính, nên đẳng thức sẽ không giữ (ngoại trừ có lẽ trong giới hạn khi đi về 0).φKσ


Cảm ơn bạn vì câu trả lời. Khi , kích thước của các dự án nhân Gaussian sẽ tăng lên. Và theo cảm hứng của bạn, bây giờ tôi nghĩ nó không bằng. Bởi vì, sử dụng kernel chỉ xử lý tình huống phân loại tuyến tính không hoạt động. σ0
Vivian
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.