Phân loại Naive Bayes là một lựa chọn phổ biến cho các vấn đề phân loại. Có nhiều lý do cho việc này, bao gồm:
- "Zeitgeist" - nhận thức rộng rãi sau thành công của các bộ lọc thư rác khoảng mười năm trước
- Dễ viết
- Mô hình phân loại nhanh để xây dựng
- Mô hình có thể được sửa đổi với dữ liệu đào tạo mới mà không phải xây dựng lại mô hình
Tuy nhiên, chúng là 'ngây thơ' - tức là chúng cho rằng các tính năng là độc lập - điều này trái ngược với các phân loại khác như phân loại Entropy tối đa (chậm tính toán).
Giả định độc lập thường không thể được giả định và trong nhiều trường hợp (hầu hết?), Bao gồm cả ví dụ về bộ lọc thư rác, điều đó đơn giản là sai.
Vậy tại sao Trình phân loại Naive Bayes vẫn hoạt động rất tốt trong các ứng dụng như vậy, ngay cả khi các tính năng không độc lập với nhau?