Đây là một lý do tại sao công thức kép hấp dẫn từ quan điểm tối ưu hóa số. Bạn có thể tìm thấy các chi tiết trong bài báo sau :
Hsieh, C.-J., Chang, K.-W., Lin, C.-J., Keerthi, SS, và Sundararajan, S., Hội nghị quốc tế lần thứ 25 về Học máy, Helsinki, 2008.
Công thức kép liên quan đến một ràng buộc đẳng thức affine duy nhất và n ràng buộc ràng buộc.
1. Ràng buộc đẳng thức affine có thể được "loại bỏ" khỏi công thức kép.
Điều này có thể được thực hiện bằng cách chỉ cần xem dữ liệu của bạn trong R ^ (d + 1) thông qua việc nhúng R ^ d trong R ^ (d + 1) từ việc thêm tọa độ "1" duy nhất vào mỗi điểm dữ liệu, tức là R ^ d ----> R ^ (d + 1): (a1, ..., quảng cáo) | ---> (a1, ..., quảng cáo, 1).
Làm điều này cho tất cả các điểm trong tập huấn luyện sẽ tái diễn vấn đề phân tách tuyến tính trong R ^ (d + 1) và loại bỏ thuật ngữ không đổi w0 khỏi trình phân loại của bạn, từ đó loại bỏ ràng buộc đẳng thức affine khỏi đối ngẫu.
2. Đến điểm 1, kép có thể dễ dàng được đưa ra như một vấn đề tối ưu hóa bậc hai lồi mà các ràng buộc của nó chỉ là các ràng buộc ràng buộc.
3. Vấn đề kép bây giờ có thể được giải quyết một cách hiệu quả, tức là thông qua thuật toán gốc tọa độ kép mang lại giải pháp tối ưu hóa epsilon trong O (log (1 / epsilon)).
Điều này được thực hiện bằng cách lưu ý rằng việc sửa tất cả các bảng chữ cái trừ một cách mang lại giải pháp dạng đóng. Sau đó, bạn có thể quay vòng qua tất cả các chữ cái một (ví dụ: chọn ngẫu nhiên một chữ cái, sửa tất cả các chữ cái khác, tính toán giải pháp biểu mẫu đóng). Do đó, người ta có thể chỉ ra rằng bạn sẽ có được một giải pháp gần như tối ưu "khá nhanh" (xem Định lý 1 trong bài báo đã nói ở trên).
Có nhiều lý do khác khiến vấn đề kép hấp dẫn từ quan điểm tối ưu hóa, một số lý do khai thác thực tế là nó chỉ có một ràng buộc bình đẳng affine (các ràng buộc còn lại là tất cả các ràng buộc ràng buộc) trong khi các vấn đề khác khai thác quan sát tại giải pháp của vấn đề kép "thường là hầu hết các chữ cái" là 0 (các chữ cái khác không tương ứng với các vectơ hỗ trợ).
Bạn có thể có được một cái nhìn tổng quan tốt về các cân nhắc tối ưu hóa số cho các SVM từ bài thuyết trình của Stephen Wright tại Hội thảo học tập tính toán (2009).
PS: Tôi mới ở đây. Xin lỗi vì không giỏi sử dụng ký hiệu toán học trên trang web này.