Các gói khai thác văn bản cho R là gì và có các chương trình khai thác văn bản nguồn mở khác không?


12

Bạn có thể giới thiệu gói khai thác văn bản trong R có thể được sử dụng đối với khối lượng dữ liệu lớn không?
Thứ hai, có GUI nào cho bất kỳ gói khai thác văn bản nào trong R không?
Thứ ba, có một chương trình khai thác văn bản nguồn mở nào dễ sử dụng và trực quan không?


@mbq: tốt, "có gói khai thác văn bản nguồn mở với GUI không?" có lẽ sẽ bao gồm cả ba câu hỏi khá hay, đây là một câu hỏi ...
naught 101

Câu trả lời:




4

Đây là hai dự án tích hợp hơn nữa:

  • Bộ công cụ ngôn ngữ tự nhiên Python (cài đặt dễ dàng, tài liệu tốt)
  • Java MALLET (không có kinh nghiệm với nó, nhưng có vẻ đầy hứa hẹn; được bao gồm trong liên kết được cung cấp bởi @Nick)

Cả hai đều là phần mềm nguồn mở.



1

GATE rất toàn diện. Nó cũng cho phép bạn làm việc với các ngôn ngữ khác nhau và có trình soạn thảo bản thể luận.


0

Andrew McCallum (UMass) có một vài dự án phần mềm liên quan đến NLP có sẵn trên trang web của mình . Đây là tất cả trong Java (tôi nghĩ) với mã nguồn có sẵn.


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.