Tôi cần đọc tệp văn bản cho một từ và trả lại nghĩa của nó. Bất kỳ định dạng tập tin khác cũng sẽ làm việc.
Tôi cần đọc tệp văn bản cho một từ và trả lại nghĩa của nó. Bất kỳ định dạng tập tin khác cũng sẽ làm việc.
Câu trả lời:
Các Dự án Gutenberg host không tóm tắt tiếng Anh Từ điển Webster cộng với nhiều tác phẩm văn học miền công cộng khác. Trên thực tế, có vẻ như họ đã có một số phiên bản từ điển được lưu trữ có bản quyền từ các năm khác nhau. Cái tôi liên kết có bản quyền năm 2009. Bạn có thể muốn chọc quanh trang web và điều tra các phiên bản khác nhau của từ điển Webster.
user1247808 có một liên kết tốt với: wget -c
http://www.androidtech.com/doads/wordnet20-from-prolog-all-3.zip
Nếu điều đó không đủ từ cho bạn:
http ://dumps.wik mega.org/enwiktionary/latest/enwiktionary-latest-all-title-in-ns0.gz (url được cập nhật từ đề xuất của Michael Kropat)
Mặc dù tên tệp đó thay đổi, bạn sẽ muốn tìm bản mới nhất ... hóa ra đó chỉ là một tệp văn bản lớn (rất lớn).
sed -i 's/TYPE=/ENGINE=/g' wordnet20-from-prolog-all-3.sql
để thay thế cú pháp không dùng nữa trước khi chạy nó với phiên bản 5.0+ của MySQL
Tôi không biết nếu quá muộn, nhưng tôi nghĩ nó sẽ giúp được người khác.
Tôi cũng muốn như vậy ... cuối cùng cũng tìm thấy nó.
Có thể nó không hoàn hảo, nhưng với tôi nó đầy đủ (đối với ứng dụng từ điển nhỏ của tôi).
http://www.androidtech.com/doads/wordnet20-from-prolog-all-3.zip
Đây không phải là tệp kết xuất, mà là tệp tập lệnh MYSQL .sql
Các từ nằm trong bảng WN_SYNSET và bảng chú giải / nghĩa trong bảng WN_GLOSS
Here are some files related to natural language and chatterbot projects that we are making available to the public
sed -i 's/TYPE=MyISAM/ENGINE=MyISAM/g' filename.sql
để làm cho nó hoạt động trong MySQL mới nhất
Kiểm tra xem các tài nguyên miễn phí này có phù hợp với nhu cầu của bạn không -