Các vấn đề phân loại văn bản có xu hướng khá cao (nhiều tính năng) và các vấn đề về chiều cao có khả năng phân tách tuyến tính (vì bạn có thể tách bất kỳ điểm d + 1 nào trong không gian d chiều bằng phân loại tuyến tính, bất kể các điểm đó như thế nào được dán nhãn). Vì vậy, các phân loại tuyến tính, cho dù hồi quy sườn hoặc SVM với hạt nhân tuyến tính, có khả năng làm tốt. Trong cả hai trường hợp, tham số sườn hoặc C cho SVM (như tdc đề cập +1) kiểm soát độ phức tạp của trình phân loại và giúp tránh sự phù hợp quá mức bằng cách tách các mẫu của mỗi lớp bằng lề lớn (nghĩa là bề mặt quyết định đi xuống giữa khoảng cách giữa hai tập hợp các điểm). Tuy nhiên, để có được hiệu năng tốt, các tham số sườn / chính quy cần phải được điều chỉnh chính xác (tôi sử dụng xác thực chéo bỏ qua một lần vì nó rẻ).
Tuy nhiên, lý do mà hồi quy sườn hoạt động tốt là các phương pháp phi tuyến tính quá mạnh và khó tránh khỏi sự phù hợp quá mức. Có thể có một bộ phân loại phi tuyến tính cho hiệu suất tổng quát hóa tốt hơn mô hình tuyến tính tốt nhất, nhưng quá khó để ước tính các tham số đó bằng cách sử dụng mẫu dữ liệu đào tạo hữu hạn mà chúng ta có. Trong thực tế, mô hình càng đơn giản, chúng ta càng ít gặp vấn đề trong việc ước tính các tham số, do đó ít có xu hướng phù hợp hơn, do đó chúng ta có kết quả tốt hơn trong thực tế.
Một vấn đề khác là lựa chọn tính năng, hồi quy sườn tránh sự phù hợp quá mức bằng cách thường xuyên các trọng số để giữ cho chúng nhỏ, và lựa chọn mô hình là đơn giản vì bạn chỉ phải chọn giá trị của một tham số hồi quy duy nhất. Nếu bạn cố gắng tránh phù hợp quá mức bằng cách chọn bộ tính năng tối ưu, thì việc lựa chọn mô hình sẽ trở nên khó khăn vì có một mức độ tự do (sắp xếp) cho từng tính năng, điều này có thể phù hợp với tiêu chí lựa chọn tính năng và bạn kết thúc với một tập hợp các tính năng tối ưu cho mẫu dữ liệu cụ thể này, nhưng mang lại hiệu suất khái quát kém. Vì vậy, không thực hiện lựa chọn tính năng và sử dụng chính quy hóa thường có thể mang lại hiệu suất dự đoán tốt hơn.
Tôi thường sử dụng Bagging (tạo thành một ủy ban mô hình được đào tạo trên các mẫu bootstraped từ tập huấn luyện) với các mô hình hồi quy sườn, thường mang lại sự cải thiện về hiệu suất và vì tất cả các mô hình đều tuyến tính, bạn có thể kết hợp chúng để tạo thành một mô hình tuyến tính duy nhất , do đó không có hiệu suất hit trong hoạt động.