Các diction
gói chứa một công cụ gọi là style
:
Style
phân tích các đặc điểm bề mặt của phong cách viết của một tài liệu. Nó in các lớp dễ đọc khác nhau, độ dài của từ, câu và đoạn văn. Nó có thể định vị thêm câu với các đặc điểm nhất định.
Ví dụ: nếu tôi đánh giá nội dung câu hỏi của bạn (được lưu trong tệp flux_question
) để in các câu có chỉ số dễ đọc (ARI) trên 10:
$ style -r 10 flux_question
flux_question:1: Is there a command line program that takes a file containing English text, analyzes the text, and outputs its readability scores?
flux_question:2: For example, if one feeds the program a text, the program should output the Flesch-Kincaid grade level, McLaughlin's SMOG grading, etc.
readability grades:
Kincaid: 10.2
ARI: 10.8
Coleman-Liau: 12.5
Flesch Index: 51.1/100
Fog Index: 12.0
Lix: 48.6 = school year 9
SMOG-Grading: 11.2
sentence info:
333 characters
65 words, average length 5.12 characters = 1.65 syllables
4 sentences, average length 16.2 words
25% (1) short sentences (at most 11 words)
0% (0) long sentences (at least 26 words)
1 paragraphs, average length 4.0 sentences
25% (1) questions
25% (1) passive sentences
longest sent 21 wds at sent 2; shortest sent 8 wds at sent 4
word usage:
verb types:
to be (1) auxiliary (2)
types as % of total:
conjunctions 5% (3) pronouns 9% (6) prepositions 2% (1)
nominalizations 0% (0)
sentence beginnings:
pronoun (1) interrogative pronoun (0) article (0)
subordinating conjunction (0) conjunction (0) preposition (0)
Để lọc đầu ra, bạn có thể sử dụng ví dụ tail -n8
để chỉ lấy điểm hoặc grep 'Flesch\|SMOG'
chỉ in Chỉ số Flesch và Phân loại SMOG:
$ style style_test | grep 'Flesch\|SMOG'
Flesch Index: 51.7/100
SMOG-Grading: 11.2
đọc thêm