Có bất kỳ giấy tờ / sách / ý tưởng nào về mối quan hệ giữa số lượng tính năng và số lượng quan sát cần có để đào tạo một bộ phân loại "mạnh mẽ" không?
Ví dụ: giả sử tôi có 1000 tính năng và 10 quan sát từ hai lớp dưới dạng tập huấn luyện và 10 quan sát khác dưới dạng tập kiểm thử. Tôi huấn luyện một số phân loại X và nó mang lại cho tôi độ nhạy 90% và độ đặc hiệu 90% trên bộ thử nghiệm. Hãy nói rằng tôi hài lòng với độ chính xác này và dựa vào đó tôi có thể nói nó là một bộ phân loại tốt. Mặt khác, tôi đã xấp xỉ một hàm gồm 1000 biến chỉ sử dụng 10 điểm, có vẻ như không ... rất mạnh?