Tôi nghĩ rằng nó có thể được làm rõ hơn thông qua một ví dụ. Giả sử bạn có hai vectơ đầu vào: X1 và X2. và giả sử X1 có phạm vi (0,1 đến 0,8) và X2 có phạm vi (3000 đến 50000). Bây giờ trình phân loại SVM của bạn sẽ là một ranh giới tuyến tính nằm trong mặt phẳng X1-X2. Yêu cầu của tôi là độ dốc của ranh giới quyết định tuyến tính không nên phụ thuộc vào phạm vi của X1 và X2, mà thay vào đó là sự phân bố các điểm.
Bây giờ hãy đưa ra dự đoán về điểm (0,1, 4000) và (0,8, 4000). Hầu như không có bất kỳ sự khác biệt nào về giá trị của hàm, do đó làm cho SVM kém chính xác hơn vì nó sẽ có độ nhạy ít hơn đối với các điểm theo hướng X1.