Đối với các nhà ngôn ngữ học và nhiều nhà khoa học khác, phân tích tần suất của các từ xuất hiện trong một văn bản là một công cụ tuyệt vời. Một số trình soạn thảo văn bản thương mại và một số trang web cung cấp công cụ này.
Phân tích tần số từ, sắp xếp các từ theo thứ tự giảm dần theo tần số của chúng. Ví dụ trong văn bản này
Emacs Stack Exchange is a question and answer site for those using, extending, or developing the emacs text editor. It's built and run by you as part of the Stack Exchange network of Q&A sites. With your help, we're working together to build a library of detailed answers to every question about emacs.
chúng ta có:
56 words
9: punctuation marks
3: ,
3: .
3: a
3: emacs
3: of
2: '
2: and
2: exchange
2: question
2: stack
2: the
2: to
1: &
1: about
1: answer
1: answers
1: as
1: build
1: built
1: by
1: detailed
1: developing
1: editor
1: every
1: extending
1: for
1: help
1: is
1: it
1: library
1: network
1: or
1: part
1: q
1: re
1: run
1: s
1: site
1: sites
1: text
1: those
1: together
1: using
1: we
1: with
1: working
1: you
1: your
Tôi tự hỏi nếu đã tồn tại một gói có thể được sử dụng để cung cấp số liệu thống kê như vậy.
Tái bút: Tôi đã hỏi những câu hỏi khác nhau trong cùng một esprit và một câu trả lời xuất sắc đã được cung cấp (tôi muốn nâng cao nó hơn nếu tôi có thể).