Tại sao không ai sử dụng trình phân loại Naive Bayes đa cực Bayes?


15

Vì vậy, trong mô hình văn bản (không được giám sát), Phân bổ Dirichlet tiềm ẩn (LDA) là một phiên bản Bayes của Phân tích ngữ nghĩa tiềm ẩn xác suất (PLSA). Về cơ bản, LDA = PLSA + Dirichlet trước các tham số của nó. Tôi hiểu rằng LDA hiện là thuật toán tham chiếu và được triển khai trong các gói khác nhau, trong khi PLSA không nên được sử dụng nữa.

Nhưng trong phân loại văn bản (có giám sát), chúng ta có thể thực hiện chính xác điều tương tự đối với trình phân loại Naive Bayes đa cực và đặt Dirichlet trước các tham số. Nhưng tôi không nghĩ rằng tôi đã từng thấy ai làm điều đó và phiên bản "ước tính điểm" của Naive Bayes đa quốc gia dường như là phiên bản được triển khai trong hầu hết các gói. Có bất kỳ lý do cho điều đó?

Câu trả lời:


7

Đây là một bài báo hay đề cập đến một số thiếu sót 'có hệ thống' của bộ phân loại Naive Bayes (MNB) đa cấp. Ý tưởng là bạn có thể tăng hiệu suất của MNB thông qua một số điều chỉnh. Và họ có đề cập đến việc sử dụng (đồng phục) linh mục Dirichlet.

Nhìn chung nếu bạn quan tâm đến MNB và bạn chưa đọc bài viết này, tôi thực sự khuyên bạn nên làm như vậy.

Tôi cũng tìm thấy một luận án thạc sĩ đi kèm bởi cùng một người / người nhưng chưa đọc nó. Bạn có thể kiểm tra nó


Liên kết thứ hai đã chết - có lẽ là dspace.mit.edu/handle/1721.1/7074 là phiên bản cập nhật
beldaz

5

Tôi nghi ngờ hầu hết các triển khai NB cho phép ước tính các xác suất có điều kiện với hiệu chỉnh Laplace , đưa ra giải pháp MAP cho trình phân loại NB Bayes (với một Dirichlet cụ thể trước đó). Như @Zhubarb (+1) chỉ ra, các phương pháp điều trị Bayes của các phân loại NB đã được bắt nguồn và thực hiện (luận án / bài báo của Rennie rất đáng đọc). Tuy nhiên, giả định độc lập của NB hầu như luôn luôn sai, trong trường hợp đó làm cho mô hình phụ thuộc mạnh mẽ hơn vào giả định đó (thông qua một điều trị Bayes đầy đủ) có thể không phải là một việc nên làm.


0

Tôi không tin những gì bạn mô tả là đúng. Các mô hình xác suất cho LDA và MNB là khác nhau.

Một điểm khác biệt chính giữa hai là trong mô hình thế hệ cho LDA, khi một từ được rút ra, đầu tiên một chủ đề cho từ đó được chọn, và sau đó một từ trong phân phối chủ đề đó được chọn. Iow mỗi từ trong một tài liệu có thể được rút ra từ một chủ đề khác nhau.

Trong mô hình thế hệ cho MNB, tài liệu được gán một lớp và tất cả các từ trong tài liệu đó được rút ra từ phân phối (giống) cho lớp đó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.