Triển khai: Gói topicmodels cung cấp giao diện cho mã GSL C và C ++ cho các mô hình chủ đề của Blei et al. và Phan et al. Đối với trước đó, nó sử dụng Biến thể EM, cho Lấy mẫu Gibbs sau. Xem http://www.jstatsoft.org/v40/i13/apers . Gói hoạt động tốt với các tiện ích từ gói tm.
Gói lda sử dụng Bộ lấy mẫu Gibbs bị sập cho một số mô hình tương tự như mô hình từ thư viện GSL. Tuy nhiên, nó đã được thực hiện bởi chính các tác giả gói, không phải bởi Blei et al. Do đó, việc triển khai này khác với kỹ thuật ước tính được đề xuất trong các bài báo gốc giới thiệu các biến thể mô hình này, trong đó thuật toán VEM thường được áp dụng. Mặt khác, gói cung cấp nhiều chức năng hơn các gói khác. Gói cung cấp chức năng khai thác văn bản quá.
Khả năng mở rộng: Về khả năng mở rộng, mã topicmodel theo bản chất của nó có thể được mở rộng để giao diện với mã mô hình chủ đề khác được viết bằng C và C ++. Gói lda dường như dựa nhiều hơn vào việc triển khai cụ thể được cung cấp bởi các tác giả, nhưng ở đó, bộ lấy mẫu Gibbs có thể cho phép chỉ định mô hình chủ đề của riêng bạn. Đối với các vấn đề về khả năng mở rộng đáng chú ý, cái trước được cấp phép theo GPL-2 và LGPL sau, do đó, nó có thể phụ thuộc vào những gì bạn cần mở rộng cho nó (GPL-2 chặt chẽ hơn về khía cạnh nguồn mở, tức là bạn không thể sử dụng nó trong phần mềm độc quyền).
Hiệu suất: Tôi không thể giúp bạn ở đây, tôi chỉ sử dụng mô hình chủ đề cho đến nay.
Kết luận:
Cá nhân tôi sử dụng topicmodels
, vì nó được ghi chép tốt (xem bài viết của JSS ở trên) và tôi tin tưởng các tác giả (Grün cũng đã hiểu flexmix và Hornik là thành viên cốt lõi của R).