Đặt thể hiện không gian đầu vào của bạn, tức là không gian nơi các điểm dữ liệu của bạn cư trú. Hãy xem xét một hàm sao cho nó lấy một điểm từ không gian đầu vào của bạn và ánh xạ nó tới một điểm trong . Bây giờ, hãy để chúng tôi nói rằng chúng tôi đã ánh xạ tất cả các điểm dữ liệu của bạn từ sang không gian mới này . Bây giờ, nếu bạn cố gắng giải quyết các Svm tuyến tính bình thường trong không gian mới này thay vì , bạn sẽ nhận thấy rằng tất cả các hoạt động trước đó chỉ đơn giản trông giống nhau, ngoại trừ tất cả các điểm được biểu diễn như Φ : X → F X F X F F X x i Φ ( x i ) x T y ⟨ Φ ( x ) , Φ ( y ) ⟩ F w *XΦ : X→ FXFXFFXxTôiΦ ( xTôi)và thay vì sử dụng (sản phẩm chấm) là sản phẩm bên trong tự nhiên cho không gian Euclide, chúng tôi thay thế bằng đại diện cho sản phẩm bên trong tự nhiên trong không gian mới . Vì vậy, cuối cùng, của bạn sẽ trông như thế nào,xTy⟨Φ(x),Φ(y)⟩Fw∗
w∗=∑i∈SVhiyiΦ(xi)
và do đó,
⟨w∗,Φ(x)⟩=∑i∈SVhiyi⟨Φ(xi),Φ(x)⟩
Tương tự,
b∗=1|SV|∑i∈SV(yi−∑j=1N(hjyj⟨Φ(xj),Φ(xi)⟩))
và quy tắc phân loại của bạn trông giống như: .cx=sign(⟨w,Φ(x)⟩+b)
Cho đến nay rất tốt, không có gì mới, vì chúng tôi chỉ đơn giản áp dụng SVM tuyến tính bình thường cho một không gian khác. Tuy nhiên, phần ma thuật là đây -
Hãy để chúng tôi nói rằng tồn tại một hàm sao cho . Sau đó, chúng ta có thể thay thế tất cả các sản phẩm chấm ở trên bằng . Như vậy được gọi là hàm kernel. k ( x i , x j ) = ⟨ Φ ( x i ) , Φ ( x j ) ⟩ k ( x i , x j ) kk:X×X→Rk(xi,xj)=⟨Φ(xi),Φ(xj)⟩k(xi,xj)k
Do đó, và trông giống như,
b * ⟨ w * , Φ ( x ) ⟩ = Σ i ∈ S V h i y i k ( x i , x ) b * = 1w∗b∗
⟨w∗,Φ(x)⟩=∑i∈SVhiyik(xi,x)
b∗=1|SV|∑i∈SV(yi−∑j=1N(hjyjk(xj,xi)))
Đối với chức năng hạt nhân nào là sự thay thế hợp lệ ở trên? Chà, đó là một câu hỏi hơi liên quan và bạn có thể muốn đọc tài liệu đọc thích hợp để hiểu những hàm ý đó. Tuy nhiên, tôi sẽ chỉ nói thêm rằng những điều trên đúng với RBF Kernel.
Để trả lời câu hỏi của bạn, "Có phải tình huống sao cho tất cả các vectơ hỗ trợ là cần thiết cho việc phân loại?" Đúng. Như bạn có thể nhận thấy ở trên, chúng tôi tính toán sản phẩm bên trong của với thay vì tính toán một cách rõ ràng. Điều này đòi hỏi chúng tôi phải giữ lại tất cả các vectơ hỗ trợ để phân loại.x wwxw
Lưu ý: Các trong phần cuối cùng ở đây là giải pháp cho kép của SVM trong không gian chứ không phải . Điều đó có nghĩa là chúng ta cần biết rõ về chức năng? May mắn là không. Nếu bạn nhìn vào mục tiêu kép, nó chỉ bao gồm sản phẩm bên trong và vì chúng ta có cho phép chúng ta tính trực tiếp sản phẩm bên trong, chúng ta không cần phải biết rõ . Mục tiêu kép trông giống như,
F X Φ k Φ max Σ i h i - Σ i , j y i y j h i h j k ( x i , x j )hiFXΦkΦ
max∑ihi−∑i,jyiyjhihjk(xi,xj)subject to : ∑iyihi=0,hi≥0