Có kết quả nào cho thấy các mô hình (giả sử SVM, Neural-Net, kNN, v.v.) sẽ gặp khó khăn trong việc tìm hiểu các trường hợp / hiện tượng đuôi "hiếm" không?
Có kết quả nào cho thấy các mô hình (giả sử SVM, Neural-Net, kNN, v.v.) sẽ gặp khó khăn trong việc tìm hiểu các trường hợp / hiện tượng đuôi "hiếm" không?
Câu trả lời:
Trong mô hình học tập PAC cổ điển (nghĩa là phân loại), các trường hợp hiếm gặp không phải là vấn đề. Điều này là do các điểm kiểm tra của người học được cho là đến từ cùng một phân phối với dữ liệu đào tạo. Do đó, nếu một vùng không gian thưa thớt đến mức được thể hiện kém trong mẫu huấn luyện, xác suất xuất hiện của nó trong giai đoạn thử nghiệm là thấp.
Bạn sẽ cần một mô hình học tập khác, trong đó xem xét rõ ràng các lỗi loại I và loại II, hoặc có lẽ một số điểm thu hồi chính xác kết hợp. Ở đây một lần nữa, tôi không nghĩ có bất kỳ kết quả nào chỉ ra rằng một loại thuật toán cụ thể đặc biệt phù hợp với nhiệm vụ này, nhưng tôi có thể sai.
Ví dụ gần nhất tôi có thể nghĩ đến là sự nhạy cảm với các ngoại lệ --- AdaBoost được biết là có tài sản này, ví dụ.