Tập tin văn bản từ điển [đóng]


222

Tôi đang viết một chương trình cần RẤT NHIỀU từ tiếng Anh. Tôi đang cố gắng tìm một tập tin từ điển có rất nhiều từ. Có ai biết một nguồn tốt? Tôi đã thử nhiều nguồn nhưng dường như họ không có.


3
@DWright Tôi đã không xóa nó, tôi đã đóng nó vì nó không thuộc chủ đề cho những kỳ vọng hiện tại của Stack Overflow. Đó là rõ ràng yêu cầu đề xuất, liên kết không phải là chủ đề.
Taryn

Đúng như vậy, tôi đã quên rằng On Hold đi đến Đóng, không bị xóa.
DWright

Vì vậy, @bluefeet, xin lỗi vì nhận xét 'phản đối' của tôi đã bị thông tin sai, hành động của bạn là chính xác và không khấu trừ giá trị.
DWright

15
Tại sao xin lỗi? Rõ ràng nó có giá trị cho cộng đồng SO. "Kỳ vọng hiện tại" của SO rõ ràng bị mất dấu.
Andrew

Câu trả lời:


224

Còn /usr/share/dict/wordstrên bất kỳ hệ thống Unix nào? Chúng ta đang nói về bao nhiêu từ? Giống như OED-Không rút gọn?


20
cảm ơn ! Hơn 200000 từ, được đánh giá cao! cat /usr/share/dict/words > words.txttất cả mọi thứ !
jokoon

7
Nếu bạn thiếu tệp này, bạn có thể cài đặt nó trên Debian / Ubuntu bằng cách gõsudo apt-get install wbritish
không kích

17
Có ai đó tình cờ biết một nơi mà điều này có thể được tải xuống cho các hệ thống không phải là Unix không?
Tom

2
@Tom Yeah, www.FreeBSD.org (cài đặt FreeBSD ở đâu đó và bùng nổ, bạn có nó). Mặt khác, tôi nghĩ rằng danh sách này là tương tự: raw.githubusercontent.com/eneko/data-reposeective/master/data/ .
Greg Schmit

2
Trong trường hợp bạn không biết: Cột này sẽ làm việc trên hệ điều hành MacOS quá :)
lewis

44

Đối với tệp .txt từ điển tiếng Anh, bạn có thể sử dụng Từ điển tùy chỉnh .

Bạn cũng có thể tạo danh sách aspell hoặc danh sách từ với các cài đặt riêng.

Ngoài ra, bạn có thể xem http://wordlist.sourceforge.net/

Chỉ các từ tiếng Anh: http://www.math.sjsu.edu/~foster/dipedia.txt


Mặc dù liên kết này có thể trả lời câu hỏi, tốt hơn là bao gồm các phần thiết yếu của câu trả lời ở đây và cung cấp liên kết để tham khảo. Câu trả lời chỉ liên kết có thể trở nên không hợp lệ nếu trang được liên kết thay đổi.
DeanOC

21
@DeanOC: Tôi nghĩ khá đơn giản rằng "các phần thiết yếu" của từ điển sẽ là toàn bộ từ điển. Điều đó không thực tế để dán ở đây. Nó cũng khá đơn giản về cách sử dụng: lấy từ đó ra. Vì vậy, trên thực tế, đây không phải là liên kết. Đó là một câu trả lời đề xuất hợp pháp cho một câu hỏi nên (và bây giờ là) đóng lại.
Nathan Tuggy

@NathanTuggy Câu trả lời này xuất hiện trong hàng đợi LQP và tôi tin rằng nó phù hợp với định nghĩa của câu trả lời chỉ liên kết. Là người dùng <3K rep, phiếu bầu của tôi để xóa không làm gì khác hơn là giúp mang lại sự chú ý của ai đó có thể.
DeanOC

1
@DeanOC: Tôi biết nó xuất hiện trong LQP. Tôi nhấn Trông OK, vì những lý do được đưa ra: về cơ bản, "chỉ liên kết" tinh tế hơn nhiều so với "có một liên kết nhưng không có mã hoặc trích dẫn? TRỞ LẠI VỚI CHÁY". Lưu ý rằng đủ các lựa chọn Đề xuất xóa bởi thậm chí 2k người dùng sẽ xóa bài đăng. (Cá nhân tôi chịu trách nhiệm cho một số bài viết ngoài lề.)
Nathan Tuggy

@NathanTuggy Bạn tự nhiên bỏ phiếu khi bạn thấy phù hợp. Tôi đã bỏ phiếu để xóa vì tôi thấy không có giá trị trong câu trả lời này nếu liên kết trở nên cũ.
DeanOC


35

http://www.math.sjsu.edu/~foster/dipedia.txt

350.000 từ

Rất muộn, nhưng có thể hữu ích cho những người khác.


24
Nhìn vào một vài từ đầu tiên, nhiều từ không phải là tiếng Anh thông thường.
tripleee 26/12/13

8
điều này không có ích gì vì nó thiếu nhiều từ đơn giản như tội lỗi, trong ...
FernandoZ

7
Vâng, và có những từ như "wwwwwww". Không phải là một từ.
Jared Forsyth

1
Coi chừng, liên kết này làm sập Firefox của tôi vì nó cố tải toàn bộ tập tin ahahahaha
Andrew

@Andrew không gặp sự cố trong Chrome 50.
Bogdan M.

11

Ngoài ra còn có WordNet . Định dạng tập tin dữ liệu của nó là tài liệu tốt.
Tôi đã sử dụng nó để xây dựng thư viện từ điển có thể nhúng cho các nhà phát triển iOS ( www.lexicontext.com ) và trong một trong các ứng dụng của tôi.


2
Giải độc đắc. Trong trường hợp bất cứ ai đang tìm kiếm các từ được ánh xạ tới các phần của bài phát biểu, chỉ cần tải xuống gói WordNet chính.
Andrew

10

@ Người tìm kiếm trong tương lai: bạn có thể sử dụng aspell để kiểm tra từ điển, nó có các ràng buộc trong ruby ​​và python. Nó sẽ làm cho công việc của bạn đơn giản hơn nhiều.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.