Kernel là một cách tính toán sản phẩm chấm của hai vectơ và trong một số không gian tính năng (có thể rất cao), đó là lý do tại sao các hàm kernel đôi khi được gọi là "sản phẩm chấm tổng quát".yxy
Giả sử chúng ta có ánh xạ mang các vectơ của chúng ta trong đến một không gian đặc trưng . Khi đó, sản phẩm chấm của và trong không gian này là . Nhân là một hàm tương ứng với sản phẩm chấm này, tức là .R n R m x y φ( x ) T φ( y )kk( x , y )=φ( x ) T φ( y )φ:Rn→RmRnRmxyφ(x)Tφ(y)kk(x,y)=φ(x)Tφ(y)
Tại sao điều này hữu ích? Các hạt nhân đưa ra một cách để tính toán các sản phẩm chấm trong một số không gian tính năng mà không cần biết không gian này là gì và là gì .φ
Ví dụ: hãy xem xét một hạt nhân đa thức đơn giản với . Điều này dường như không tương ứng với bất kỳ chức năng ánh xạ nào , đây chỉ là một hàm trả về một số thực. Giả sử rằng và , hãy mở rộng biểu thức này:x , y ∈ R 2 φ x = ( x 1 , x 2 ) y = ( y 1 , y 2 )k(x,y)=(1+xTy)2x,y∈R2φx=(x1,x2)y=(y1,y2)
k(x,y)=(1+xTy)2=(1+x1y1+x2y2)2==1+x21y21+x22y22+2x1y1+2x2y2+2x1x2y1y2
Lưu ý rằng đây không có gì khác ngoài một sản phẩm chấm giữa hai vectơ và và . Vì vậy, hạt nhân tính toán một sản phẩm chấm trong Không gian 6 chiều mà không ghé thăm rõ ràng không gian này.(1,y 2 1 ,y 2 2 , √(1,x21,x22,2–√x1,2–√x2,2–√x1x2)φ(x)=φ(x1,x2)=(1,x 2 1 ,x 2 2 , √(1,y21,y22,2–√y1,2–√y2,2–√y1y2)k(x,y)=(1+ x Ty)2=φ(x)Tφ(y)φ(x)=φ(x1,x2)=(1,x21,x22,2–√x1,2–√x2,2–√x1x2)k(x,y)=(1+xTy)2=φ(x)Tφ(y)
Một ví dụ khác là nhân Gaussian . Nếu chúng tôi Taylor mở rộng chức năng này, chúng tôi sẽ thấy rằng nó tương ứng với một tên miền mã vô hạn của .k(x,y)=exp(−γ∥x−y∥2)φ
Cuối cùng, tôi muốn giới thiệu một khóa học trực tuyến "Học từ dữ liệu" của Giáo sư Yaser Abu-Mostafa như một giới thiệu tốt về các phương pháp dựa trên nhân. Cụ thể, các bài giảng "Hỗ trợ máy Vector" , "Phương pháp hạt nhân" và "Hàm cơ sở xuyên tâm" là về hạt nhân.