Giả sử bạn đang dự đoán chủ đề của một tài liệu được đưa ra từ đó.
Một mô hình khái quát mô tả khả năng mỗi chủ đề là như thế nào và khả năng các từ được đưa ra cho chủ đề đó. Đây là cách nó nói rằng các tài liệu thực sự được "tạo ra" bởi thế giới - một chủ đề phát sinh theo một số phân phối, các từ phát sinh vì chủ đề, bạn có một tài liệu. Phân loại tài liệu của các từ W vào chủ đề T là vấn đề tối đa hóa khả năng chung: P (T, W) = P (W | T) P (T)
Một mô hình phân biệt đối xử hoạt động bằng cách chỉ mô tả khả năng một chủ đề được đưa ra các từ. Nó không nói gì về khả năng các từ hoặc chủ đề là của chính họ. Nhiệm vụ là mô hình hóa P (T | W) trực tiếp và tìm T tối đa hóa điều này. Những cách tiếp cận này không quan tâm trực tiếp đến P (T) hoặc P (W).