Công cụ đo lường khả năng đọc của văn bản tiếng Anh


13

Có một chương trình dòng lệnh nào lấy một tệp chứa văn bản tiếng Anh, phân tích văn bản và đưa ra điểm số dễ đọc của nó không?

Ví dụ: nếu một người cung cấp cho chương trình một văn bản, chương trình sẽ xuất ra cấp độ Flesch-Kincaid, phân loại SMOG của McLaughlin, v.v.

Tôi tin rằng một chương trình như vậy tồn tại trong kho chính thức, nhưng tôi không thể nhớ tên của nó. Cũng có khả năng tôi đang đánh giá sai.

Câu trả lời:


11

Các diction Cài đặt từ điểngói chứa một công cụ gọi là style:

Style phân tích các đặc điểm bề mặt của phong cách viết của một tài liệu. Nó in các lớp dễ đọc khác nhau, độ dài của từ, câu và đoạn văn. Nó có thể định vị thêm câu với các đặc điểm nhất định.

Ví dụ: nếu tôi đánh giá nội dung câu hỏi của bạn (được lưu trong tệp flux_question) để in các câu có chỉ số dễ đọc (ARI) trên 10:

$ style -r 10 flux_question
flux_question:1: Is there a command line program that takes a file containing English text, analyzes the text, and outputs its readability scores?
flux_question:2: For example, if one feeds the program a text, the program should output the Flesch-Kincaid grade level, McLaughlin's SMOG grading, etc.
readability grades:
        Kincaid: 10.2
        ARI: 10.8
        Coleman-Liau: 12.5
        Flesch Index: 51.1/100
        Fog Index: 12.0
        Lix: 48.6 = school year 9
        SMOG-Grading: 11.2
sentence info:
        333 characters
        65 words, average length 5.12 characters = 1.65 syllables
        4 sentences, average length 16.2 words
        25% (1) short sentences (at most 11 words)
        0% (0) long sentences (at least 26 words)
        1 paragraphs, average length 4.0 sentences
        25% (1) questions
        25% (1) passive sentences
        longest sent 21 wds at sent 2; shortest sent 8 wds at sent 4
word usage:
        verb types:
        to be (1) auxiliary (2) 
        types as % of total:
        conjunctions 5% (3) pronouns 9% (6) prepositions 2% (1)
        nominalizations 0% (0)
sentence beginnings:
        pronoun (1) interrogative pronoun (0) article (0)
        subordinating conjunction (0) conjunction (0) preposition (0)

Để lọc đầu ra, bạn có thể sử dụng ví dụ tail -n8để chỉ lấy điểm hoặc grep 'Flesch\|SMOG'chỉ in Chỉ số Flesch và Phân loại SMOG:

$ style style_test | grep 'Flesch\|SMOG'
        Flesch Index: 51.7/100
        SMOG-Grading: 11.2

đọc thêm

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.