Làm thế nào để chuyển từ điển aspell sang danh sách từ đơn giản?


25

Tôi muốn lấy danh sách tất cả các từ trong từ điển aspell. Tôi đã tải xuống từ điển aspell và aspell đánh bóng, sau đó giải nén nó bằng cách sử dụng:

preunzip pl.cwl

Tôi đã nhận pl.wl:

...
hippie
hippies
hippiesowski/bXxYc
hippika/MNn
hippis/NOqsT
hippisiara/MnN
hippiska/mMN
hippisowski/bXxYc
...

nhưng chúng xuất hiện với sufix như /bXxYchay /MNn. Những hậu tố được định nghĩa trong pl_affix.dat, trông giống như

...
SFX n Y 5
SFX n   a         0         [^ij]a
SFX n   ja        yj        [^aeijoóuy]ja
SFX n   a         0         [aeijoóuy]ja
SFX n   ia        ij        [^drt]ia
SFX n   ia        yj        [drt]ia
...

Nó được kết nối với sự suy giảm và chia động từ. Làm cách nào tôi có thể thêm vào danh sách đầu tiên tất cả các biểu mẫu (với tất cả các hậu tố tương ứng như được định nghĩa trong .dattệp)?

BTW: Tôi cần danh sách này để kiểm tra chính tả jazzy.

Câu trả lời:


28

Hãy thử xem:

aspell -d pl dump master | aspell -l pl expand > my.dict

Chỉnh sửa để phù hợp với sửa chữa trong bình luận.


Gần như, tôi đã có được những gì tôi muốn, nhưng với hậu tố tiếng Anh ... Ví dụ: "hippiesowski hippiesowskiens hippiesowskily"
rafalmag

1
Lệnh đúng là: aspell -d pl dump master | aspell -l pl mở rộng> my.dict Bây giờ tôi đã nhận được: "hippiesowski niehippiesowski hippiesowskimi ..."
rafalmag

Làm thế nào để tôi trích xuất tất cả các thuộc tính của những từ này là tốt?
Nordlöw

Làm cách nào để chuyển đổi một tệp .rws cụ thể / thành tệp văn bản?
Nadav B
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.