Phân loại SVM phi tuyến tính với hạt nhân RBF


8

Tôi đang triển khai trình phân loại SVM phi tuyến tính với kernel RBF. Tôi được biết rằng sự khác biệt duy nhất so với một SVM bình thường là tôi chỉ cần thay thế sản phẩm chấm bằng hàm kernel: Tôi biết một SVM tuyến tính bình thường hoạt động như thế nào, sau khi giải bài toán tối ưu hóa bậc hai (tác vụ kép), tôi tính toán siêu phẳng chia tối ưu là và phần bù của siêu phẳng , trong đó là danh sách các vectơ đào tạo của tôi, là nhãn tương ứng của chúng ( ),

K(xi,xj)=exp(||xixj||22σ2)
w=iSVhiyixi
b=1|SV|iSV(yij=1N(hjyjxjTxi))
xyyi{1,1}h là các hệ số Lagrangian và là một tập các vectơ hỗ trợ. Sau đó, tôi có thể sử dụng và một mình để dễ dàng phân loại: .SVwbcx=sign(wTx+b)

Tuy nhiên, tôi không nghĩ rằng tôi có thể làm điều đó với hạt nhân RBF. Tôi tìm thấy một số tài liệu cho thấy . Điều đó sẽ làm cho nó dễ dàng. Tuy nhiên, tôi không nghĩ rằng một phân tách như vậy tồn tại cho hạt nhân này và nó không được đề cập ở bất cứ đâu. Là tình huống để tất cả các vectơ hỗ trợ là cần thiết để phân loại? Nếu vậy, làm thế nào để tôi phân loại trong trường hợp đó?K(x,y)=ϕ(x)ϕ(y)


Không phải là một câu trả lời hoàn chỉnh nhưng tôi đã có những slide ở uni: patterns.enm.bris.ac.uk/files/lecture10-2010.pdf
Tristan

Câu trả lời:


19

Đặt thể hiện không gian đầu vào của bạn, tức là không gian nơi các điểm dữ liệu của bạn cư trú. Hãy xem xét một hàm sao cho nó lấy một điểm từ không gian đầu vào của bạn và ánh xạ nó tới một điểm trong . Bây giờ, hãy để chúng tôi nói rằng chúng tôi đã ánh xạ tất cả các điểm dữ liệu của bạn từ sang không gian mới này . Bây giờ, nếu bạn cố gắng giải quyết các Svm tuyến tính bình thường trong không gian mới này thay vì , bạn sẽ nhận thấy rằng tất cả các hoạt động trước đó chỉ đơn giản trông giống nhau, ngoại trừ tất cả các điểm được biểu diễn như Φ : XF X F X F F X x i Φ ( x i ) x T y Φ ( x ) , Φ ( y ) F w *XΦ:XFXFXFFXxiΦ(xi)và thay vì sử dụng (sản phẩm chấm) là sản phẩm bên trong tự nhiên cho không gian Euclide, chúng tôi thay thế bằng đại diện cho sản phẩm bên trong tự nhiên trong không gian mới . Vì vậy, cuối cùng, của bạn sẽ trông như thế nào,xTyΦ(x),Φ(y)Fw

w=iSVhiyiΦ(xi)

và do đó,

w,Φ(x)=iSVhiyiΦ(xi),Φ(x)

Tương tự,

b=1|SV|iSV(yij=1N(hjyjΦ(xj),Φ(xi)))

và quy tắc phân loại của bạn trông giống như: .cx=sign(w,Φ(x)+b)

Cho đến nay rất tốt, không có gì mới, vì chúng tôi chỉ đơn giản áp dụng SVM tuyến tính bình thường cho một không gian khác. Tuy nhiên, phần ma thuật là đây -

Hãy để chúng tôi nói rằng tồn tại một hàm sao cho . Sau đó, chúng ta có thể thay thế tất cả các sản phẩm chấm ở trên bằng . Như vậy được gọi là hàm kernel. k ( x i , x j ) = Φ ( x i ) , Φ ( x j ) k ( x i , x j ) kk:X×XRk(xi,xj)=Φ(xi),Φ(xj)k(xi,xj)k

Do đó, và trông giống như, b *w * , Φ ( x ) = Σ i S V h i y i k ( x i , x ) b * = 1wb

w,Φ(x)=iSVhiyik(xi,x)
b=1|SV|iSV(yij=1N(hjyjk(xj,xi)))

Đối với chức năng hạt nhân nào là sự thay thế hợp lệ ở trên? Chà, đó là một câu hỏi hơi liên quan và bạn có thể muốn đọc tài liệu đọc thích hợp để hiểu những hàm ý đó. Tuy nhiên, tôi sẽ chỉ nói thêm rằng những điều trên đúng với RBF Kernel.

Để trả lời câu hỏi của bạn, "Có phải tình huống sao cho tất cả các vectơ hỗ trợ là cần thiết cho việc phân loại?" Đúng. Như bạn có thể nhận thấy ở trên, chúng tôi tính toán sản phẩm bên trong của với thay vì tính toán một cách rõ ràng. Điều này đòi hỏi chúng tôi phải giữ lại tất cả các vectơ hỗ trợ để phân loại.x wwxw

Lưu ý: Các trong phần cuối cùng ở đây là giải pháp cho kép của SVM trong không gian chứ không phải . Điều đó có nghĩa là chúng ta cần biết rõ về chức năng? May mắn là không. Nếu bạn nhìn vào mục tiêu kép, nó chỉ bao gồm sản phẩm bên trong và vì chúng ta có cho phép chúng ta tính trực tiếp sản phẩm bên trong, chúng ta không cần phải biết rõ . Mục tiêu kép trông giống như, F X Φ k Φ max Σ i h i - Σ i , j y i y j h i h j k ( x i , x j )hiFXΦkΦ

maxihii,jyiyjhihjk(xi,xj)subject to : iyihi=0,hi0

@ JanHadáček Chào mừng bạn! Thật tốt khi biết rằng câu trả lời của tôi là dễ hiểu, tôi đã lo lắng rằng nó có thể quá cô đọng :-)
TenaliRaman

Lời giải thích rất hay
anh chàng người London
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.