shabbychef đã đưa ra một lời giải thích rất rõ ràng từ quan điểm của sự phức tạp của mô hình. Tôi sẽ cố gắng hiểu vấn đề này từ một quan điểm khác trong trường hợp nó có thể giúp đỡ bất cứ ai.
Về cơ bản chúng tôi muốn tối đa hóa lợi nhuận trong SVC. Đây là giống nhau ở SVR trong khi chúng tôi muốn tối đa hóa lỗi dự đoán trong một độ chính xác định nghĩa cho sự tổng quát tốt hơn. Ở đây nếu chúng ta giảm thiểu lỗi dự đoán thay vì tối đa hóa, kết quả dự đoán trên dữ liệu không xác định có nhiều khả năng bị quá mức. Chúng ta hãy suy nghĩ về "tối đa hóa lỗi dự đoán" trong trường hợp một chiều.e
Trong trường hợp một chiều, mục tiêu của chúng tôi là để tối đa hóa khoảng cách từ tất cả các điểm đến đường xu hướng y = ω x + b trong e . Lưu ý rằng chúng tôi đặt giới hạn độ chính xác là e để chúng tôi có thể tối đa hóa khoảng cách, không giảm thiểu . Sau đó chúng ta hãy xem phương trình rất đơn giản của khoảng cách từ một điểm đến một đường thẳng.(xi,yi)y=ωx+bee
|ωxi−yi+b|ω2+1−−−−−√
Ngay bây giờ tử số được giới hạn ở . Để phát huy tối đa khoảng cách, những gì chúng tôi cố gắng làm là để giảm thiểu ω .eω
Bất cứ ai cũng có thể dễ dàng mở rộng trường hợp một chiều sang trường hợp N chiều vì phương trình khoảng cách sẽ luôn là khoảng cách Euclide .
Ngoài ra, chúng tôi có thể có đánh giá về vấn đề tối ưu hóa trong SVR để so sánh [1].
min12||ω||2
s.t.{yi−<ω,xi>−b≤e<ω,xi>+b−yi≥e
Cảm ơn.
[1] Smola, A. và B. Schölkopf. Một hướng dẫn về hồi quy vector hỗ trợ. Thống kê và tính toán, Tập. 14, số 3, ngày 8 tháng 8 năm 2004, trang 199