Công cụ dự đoán Naive Bayes đưa ra dự đoán của mình bằng công thức này:
Trong đó là một yếu tố bình thường hóa. Điều này đòi hỏi phải ước tính các tham số từ dữ liệu. Nếu chúng ta làm điều này với -smoothing, thì chúng ta có được ước tínhP ( X i = x i | Y = y ) k
trong đó có giá trị có thể cho . Tôi ổn với điều này. Tuy nhiên, trước đây, chúng tôi cóX i
trong đó có ví dụ trong tập dữ liệu. Tại sao chúng ta cũng không làm mịn trước? Hay đúng hơn, chúng ta làm mịn trước? Nếu vậy, chúng ta chọn tham số làm mịn nào? Có vẻ hơi ngớ ngẩn khi chọn , vì chúng tôi đang thực hiện một phép tính khác. Có một sự đồng thuận? Hay nó không quá quan trọng?