Tôi đang viết một chương trình cần RẤT NHIỀU từ tiếng Anh. Tôi đang cố gắng tìm một tập tin từ điển có rất nhiều từ. Có ai biết một nguồn tốt? Tôi đã thử nhiều nguồn nhưng dường như họ không có.
Tôi đang viết một chương trình cần RẤT NHIỀU từ tiếng Anh. Tôi đang cố gắng tìm một tập tin từ điển có rất nhiều từ. Có ai biết một nguồn tốt? Tôi đã thử nhiều nguồn nhưng dường như họ không có.
Câu trả lời:
Còn /usr/share/dict/words
trên bất kỳ hệ thống Unix nào? Chúng ta đang nói về bao nhiêu từ? Giống như OED-Không rút gọn?
cat /usr/share/dict/words > words.txt
tất cả mọi thứ !
sudo apt-get install wbritish
Đối với tệp .txt từ điển tiếng Anh, bạn có thể sử dụng Từ điển tùy chỉnh .
Bạn cũng có thể tạo danh sách aspell hoặc danh sách từ với các cài đặt riêng.
Ngoài ra, bạn có thể xem http://wordlist.sourceforge.net/
Chỉ các từ tiếng Anh: http://www.math.sjsu.edu/~foster/dipedia.txt
Ngoài ra hãy xem:
95 (insane)
3 (seldom used)
Strip
cho khoảng 675K từ.
http://www.math.sjsu.edu/~foster/dipedia.txt
350.000 từ
Rất muộn, nhưng có thể hữu ích cho những người khác.
Ngoài ra còn có WordNet . Định dạng tập tin dữ liệu của nó là tài liệu tốt.
Tôi đã sử dụng nó để xây dựng thư viện từ điển có thể nhúng cho các nhà phát triển iOS ( www.lexicontext.com ) và trong một trong các ứng dụng của tôi.
@ Người tìm kiếm trong tương lai: bạn có thể sử dụng aspell để kiểm tra từ điển, nó có các ràng buộc trong ruby và python. Nó sẽ làm cho công việc của bạn đơn giản hơn nhiều.