Đối với một nhiệm vụ về phân tích tình cảm, giả sử chúng ta có một số lớp được đại diện bởi và các tính năng .
Chúng ta có thể biểu diễn xác suất có điều kiện của mỗi lớp là: trong đó đại diện cho mỗi tính năng và là lớp chúng ta có. Sau đó, theo kinh nghiệm, chúng ta có thể biểu diễn Các thầy tu của chúng ta cho mỗi lớp sau đó được đưa ra bởi: trong đó:
là tổng số tính năng trong tất cả các lớp.
đại diện cho số lượng tính năng của trong lớp .
là tổng số tính năng cho lớp và
là tổng số tính năng cho tất cả các lớp.
Sự hiểu biết của tôi về những điều trên có đúng không? Vì vậy, với các xác suất cho mỗi từ, tôi giả định rằng các từ này là độc lập, vì vậy tôi chỉ cần nhân mỗi từ trong một tài liệu cho một lớp nhất định, tức là để tính đó là số lượng từ trong tài liệu. Điều này có đúng không?
Để thực sự tính toán xác suất có điều kiện bằng số, nó có đủ để làm như sau không:
Phần cuối cùng của phương trình có vẻ hơi đáng ngờ đối với tôi vì nó có vẻ quá đơn giản để tính toán cho một xác suất khá phức tạp.