Khó khăn trong việc học tập các trường hợp hiếm hoi


8

Có kết quả nào cho thấy các mô hình (giả sử SVM, Neural-Net, kNN, v.v.) sẽ gặp khó khăn trong việc tìm hiểu các trường hợp / hiện tượng đuôi "hiếm" không?


Tôi nghĩ rằng bạn đã chấp nhận một câu trả lời quá nhanh - đó là một câu trả lời tốt, nhưng cũng có thể có nhiều khả năng hơn.
usul

@usul cảm ơn đã bình luận. Bạn có bất cứ đề nghị thêm? Sẽ rất vui khi nghe những suy nghĩ bổ sung.
Daniel

Câu trả lời:


10

Trong mô hình học tập PAC cổ điển (nghĩa là phân loại), các trường hợp hiếm gặp không phải là vấn đề. Điều này là do các điểm kiểm tra của người học được cho là đến từ cùng một phân phối với dữ liệu đào tạo. Do đó, nếu một vùng không gian thưa thớt đến mức được thể hiện kém trong mẫu huấn luyện, xác suất xuất hiện của nó trong giai đoạn thử nghiệm là thấp.

Bạn sẽ cần một mô hình học tập khác, trong đó xem xét rõ ràng các lỗi loại I và loại II, hoặc có lẽ một số điểm thu hồi chính xác kết hợp. Ở đây một lần nữa, tôi không nghĩ có bất kỳ kết quả nào chỉ ra rằng một loại thuật toán cụ thể đặc biệt phù hợp với nhiệm vụ này, nhưng tôi có thể sai.

Ví dụ gần nhất tôi có thể nghĩ đến là sự nhạy cảm với các ngoại lệ --- AdaBoost được biết là có tài sản này, ví dụ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.