Tôi hiện đang sử dụng Scikit tìm hiểu với đoạn mã sau:
clf = svm.SVC(C=1.0, tol=1e-10, cache_size=600, kernel='rbf', gamma=0.0,
class_weight='auto')
và sau đó thực hiện phù hợp và dự đoán cho một tập hợp dữ liệu với 7 nhãn khác nhau. Tôi có một đầu ra kỳ lạ. Bất kể kỹ thuật xác thực chéo nào tôi sử dụng nhãn dự đoán trên bộ xác thực luôn luôn là nhãn 7.
Tôi thử một số tham số khác, bao gồm cả mặc định đầy đủ ( svm.SVC()
) nhưng miễn là phương thức kernel tôi sử dụng rbf
thay vì poly
hoặc linear
nó không hoạt động, trong khi nó hoạt động thực sự tốt poly
và linear
.
Ngoài ra, tôi đã thử dự đoán về dữ liệu xe lửa thay vì dữ liệu xác nhận và nó hoàn toàn phù hợp.
Có ai nhìn thấy loại vấn đề này trước đây và biết những gì đang xảy ra ở đây?
Tôi không bao giờ nhìn vào phân phối lớp của tôi một cách chi tiết nhưng tôi biết nó nên có khoảng 30% trong số họ là 7, 14% là 4.
Tôi thậm chí đã thử thực hiện thủ công 1-vs-rest và nó vẫn không hữu ích.