Vì vậy, tôi là người mới trong lĩnh vực ML và tôi cố gắng thực hiện một số phân loại. Mục tiêu của tôi là dự đoán kết quả của một sự kiện thể thao. Tôi đã thu thập một số dữ liệu lịch sử và bây giờ cố gắng đào tạo một bộ phân loại. Tôi đã nhận được khoảng 1200 mẫu, trong đó 0,2 mẫu tôi đã tách ra cho mục đích thử nghiệm, những mẫu khác tôi đưa vào tìm kiếm dạng lưới (bao gồm xác thực chéo) với các phân loại khác nhau. Tôi đã thử SVM với các hạt nhân tuyến tính, rbf và đa thức và Rừng ngẫu nhiên cho đến thời điểm hiện tại. Thật không may, tôi không thể có được độ chính xác lớn hơn đáng kể 0,5 (giống như lựa chọn ngẫu nhiên của lớp). Có nghĩa là tôi không thể dự đoán kết quả của một sự kiện phức tạp như vậy? Hoặc tôi có thể nhận được ít nhất 0,7-0,8 độ chính xác? Nếu nó khả thi, thì tôi nên xem xét điều gì tiếp theo?
- Lấy thêm dữ liệu? (Tôi có thể phóng to dữ liệu lên đến 5 lần)
- Hãy thử phân loại khác nhau? (Hồi quy logistic, kNN, v.v.)
- Đánh giá lại bộ tính năng của tôi? Có công cụ ML nào để phân tích, tính năng nào hợp lý và không có công cụ nào không? Có lẽ, tôi nên giảm bộ tính năng của mình (hiện tại tôi có 12 tính năng)?