Naive Bayes Nên tạo dự đoán cho các tính năng bị thiếu (tìm hiểu scikit)


7

Thấy rằng Naive Bayes sử dụng xác suất để đưa ra dự đoán và coi các tính năng là độc lập có điều kiện với nhau, nên có nghĩa là mô hình vẫn có thể đưa ra dự đoán khi có một số tính năng bị thiếu trong dữ liệu thử nghiệm.

Tôi biết rằng đó là thông lệ phổ biến để buộc tội dữ liệu bị thiếu, nhưng tại sao làm điều này khi Naïve Bayes có thể đưa ra một dự đoán cho rằng có một số tính năng bị thiếu?

Điều này có thể được thực hiện trong sci-kit tìm hiểu? Tôi đã thử một bộ thử nghiệm với ít tính năng hơn và nhận được ValueError vì các hình dạng không được căn chỉnh.

Vì vậy, về mặt lý thuyết điều này là có thể, nhưng nó có thể trong scikit learn?

Câu trả lời:


4

Câu hỏi của bạn là hợp lý. Cách tính xác suất sau được tính trong phân loại Naive Bayes cổ điển (trong sklearn) giống như tổng các xác suất có điều kiện của tất cả các tính năng trong bộ dữ liệu. Mặc dù các tính năng được coi là độc lập có điều kiện, để tìm hiểu xác suất phân loại, tất cả các tính năng luôn được sử dụng trong thiết lập này. Khi mô hình đã được học, bạn vẫn còn tất cả các tính năng đó để tính toán hậu nghiệm cho một quan sát mới. Sự độc lập có điều kiện chỉ là một giả định được thực hiện để làm cho các số liệu thống kê và toán học tuân theo các quy tắc và công việc.

Nhưng sửa đổi một chút cách tính toán sau, bạn có thể sử dụng phương pháp Bayes để đưa ra dự đoán ngay cả khi không có các tính năng nhất định. Sử dụng phương pháp Bayes để đưa ra dự đoán trong trường hợp không có một số tính năng nhất định vẫn là một công việc đang diễn ra. Bạn có thể muốn xem bài báo này trong đó phương pháp Bayes được áp dụng cho thiên văn học để phân loại với các giá trị còn thiếu.

Naive Bayes có thể dễ dàng thực hiện trong python vì đây là một phép tính đơn giản. Skveearn Naive Bayes không hỗ trợ dự đoán với các giá trị bị thiếu và có thể khó thực hiện theo những gì bạn đang nghĩ. Có lẽ viết đoạn mã của riêng bạn sẽ tốt hơn :)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.