Tôi muốn biết nếu mọi người có một số hướng dẫn tốt (nhanh và đơn giản) về mô hình chủ đề và LDA, dạy trực giác cách đặt một số tham số, ý nghĩa của chúng và nếu có thể, với một số ví dụ thực tế.
Tôi muốn biết nếu mọi người có một số hướng dẫn tốt (nhanh và đơn giản) về mô hình chủ đề và LDA, dạy trực giác cách đặt một số tham số, ý nghĩa của chúng và nếu có thể, với một số ví dụ thực tế.
Câu trả lời:
Nếu bạn đang làm việc trong R, hướng dẫn sử dụng LDA của Carson Sievert để mô hình hóa các chủ đề trong đánh giá phim là một điểm khởi đầu tuyệt vời:
http://cpsievert.github.io/LDAvis/reviews/reviews.html
Hướng dẫn này sử dụng LDAvis, một hình ảnh tương tác của các phân phối chủ đề và từ có thể thực sự hỗ trợ trực giác.
Ngoài ra, mặc dù không ngắn, các bài giảng của David M. Blei's về các mô hình chủ đề là một nguồn tài nguyên tuyệt vời để hiểu ý nghĩa đằng sau các tham số: http://videolectures.net/mlss09uk_blei_tm/
Tôi đánh giá cao hướng dẫn này: Bắt đầu với Mô hình chủ đề và MALLET
Dưới đây là một số liên kết bổ sung để giúp bạn bắt đầu ...
Tài liệu giới thiệu tốt (bao gồm các liên kết đến tài liệu nghiên cứu): http://www.cs.princeton.edu/~blei/topicmodeling.html
Phần mềm:
Thậm chí nhiều hơn ở đây trên blog Dự đoán thiên vị: Mô hình chủ đề Danh sách đọc
Nếu bạn đang tìm kiếm một cái gì đó đơn giản để bắt đầu và dễ thực hiện, tôi sẽ khuyên bạn nên điều này.
Dự án CLARIN-D đã thu thập được một số gợi ý hay cho các hướng dẫn về mô hình hóa chủ đề và LDA trên trang web Bộ sưu tập tài liệu học tập (TeLeMaCo) do trung tâm CLARIN của trường Đại học tổ chức .
Tôi khuyên bạn nên thử hướng dẫn Gensim của Machine Learning Plu . Nó sẽ cung cấp cho bạn một cái nhìn tổng quan, về NLP và LDA, bao gồm: cách xử lý trước dữ liệu của bạn, làm kỹ thuật tính năng và áp dụng LDA.