Sự khác biệt giữa Bayes ngây thơ & Bayes ngây thơ đa sắc


29

Tôi đã xử lý phân loại Naive Bayes trước đây. Gần đây tôi đã đọc về Naive Bayes Multinomial .

Ngoài ra Xác suất Posterior = (Ưu tiên * Khả năng) / (Bằng chứng) .

Sự khác biệt chính duy nhất (trong khi lập trình các phân loại này) tôi tìm thấy giữa Naive Bayes & Naive Bayes Multinomial là đó

Naive Bayes đa cấp tính toán khả năng được tính của một từ / mã thông báo (biến ngẫu nhiên) và Naive Bayes tính toán khả năng theo sau:

nhập mô tả hình ảnh ở đây

Sửa lỗi cho tôi nếu tôi sai!


1
Bạn sẽ tìm thấy rất nhiều thông tin trong pdf sau: cs229.stanford.edu/notes/cs229-notes2.pdf
B_Miner

Christopher D. Manning, Mitchhakar Raghavan và Hinrich Schütze. " Giới thiệu về truy xuất thông tin. " 2009, chương 13 về phân loại văn bản và Naive Bayes cũng tốt.
Franck Dernoncourt

Câu trả lời:


43

f1fn

p(f1,...,fn|c)= =Πtôi= =1np(ftôi|c)

Điều này có nghĩa là khi tôi muốn sử dụng mô hình Naive Bayes để phân loại một ví dụ mới, xác suất sau sẽ đơn giản hơn nhiều để làm việc với:

p(c|f1,...,fn)αp(c)p(f1|c)...p(fn|c)

Tất nhiên những giả định về sự độc lập này hiếm khi đúng, điều này có thể giải thích tại sao một số người gọi mô hình là mô hình "Idiot Bayes", nhưng trong thực tế, các mô hình Naive Bayes đã thực hiện tốt một cách đáng ngạc nhiên, ngay cả trong các nhiệm vụ phức tạp, rõ ràng là mạnh mẽ giả định độc lập là sai.

p(ftôi|c)p(ftôi|c)

Bản phân phối bạn đã sử dụng với trình phân loại Naive Bayes của bạn là pdf Guassian, vì vậy tôi đoán bạn có thể gọi nó là trình phân loại Guassian Naive Bayes.

Tóm lại, trình phân loại Naive Bayes là một thuật ngữ chung để chỉ sự độc lập có điều kiện của từng tính năng trong mô hình, trong khi trình phân loại Multinomial Naive Bayes là một ví dụ cụ thể của trình phân loại Naive Bayes sử dụng phân phối đa phương thức cho từng tính năng.

Tài liệu tham khảo:

Stuart J. Russell và Peter Norvig. 2003. Trí tuệ nhân tạo: Cách tiếp cận hiện đại (2 ed.). Giáo dục Pearson.Xem p. 499 để tham khảo "Bay ngốc" cũng như định nghĩa chung về mô hình Naive Bayes và các giả định độc lập của nó


Các liên kết bị hỏng
ssoler

@ jlund3, Cảm ơn lời giải thích tốt đẹp. Làm thế nào để chúng tôi kết hợp thông tin của phân phối trong phân loại của chúng tôi? Ý tôi là làm thế nào mà fomula p (c | f1, ..., fn) p (c) p (f1 | c) ... p (fn | c) thay đổi dựa trên việc đó có phải là phân phối của Guassian so với đa phương thức
David

Cảm ơn đã giải thích ngắn gọn nhưng tôi giới thiệu cuốn sách (Stuart J. Russell và Peter Norvig. 2003. Trí tuệ nhân tạo: Cách tiếp cận hiện đại (2 ed.)) Đã tham khảo ở trên để có thêm kiến ​​thức về NB và Kỹ thuật trí tuệ nhân tạo nữa ..
Mirani

số lượng phân phối đa cực là không độc lập. xem câu hỏi của tôi ở đây: datascience.stackexchange.com/questions/32016/iêu
Hanan Shteingart

10

P(xtôi|cj)1tôin1jk(tôi,j)P(xtôi|cj1)P(xtôi|cj2)

Naive Bayes đa cực đơn giản giả định phân phối đa cực cho tất cả các cặp, dường như là một giả định hợp lý trong một số trường hợp, tức là đối với số lượng từ trong tài liệu.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.