Công cụ dòng lệnh để tìm kiếm tệp docx


9

Có một công cụ dòng lệnh để tìm kiếm văn bản một tệp docx không? Tôi đã thử grep, nhưng nó không hoạt động với docx mặc dù nó hoạt động tốt với các tệp txt và xml. Trước tiên tôi có thể chuyển đổi docx thành txt, nhưng tôi thích một công cụ hoạt động trực tiếp trên các tệp docx. Tôi cần công cụ để làm việc theo Cygwin.

Chỉnh sửa OP: Sau đó tôi phát hiện ra rằng cách dễ nhất để đạt được grep thực sự là chuyển đổi các docx đó thành txt sau đó grep qua chúng.



Tôi đã thoát khỏi phần DOS, vì đó không có chủ đề ở đây
Michael Mrozek

Câu trả lời:


3

Tôi biết một số công cụ lập chỉ mục hỗ trợ các tài liệu Word. Các công cụ như vậy cho phép bạn lập chỉ mục các tài liệu, sau đó tìm kiếm các từ trong chỉ mục một cách hiệu quả. Họ không cho phép tìm kiếm toàn văn.


1

DOCx được nén và nó không phải là một định dạng văn bản. Vì vậy, những gì bạn cần là một công cụ chuyển đổi đầu tiên. Sau đó, bạn có thể sử dụng findlệnh trên (các) tệp đã chuyển đổi.


Hoặc bạn có thể sử dụng một công cụ tìm kiếm có thể đọc bên trong các tệp nén. Trong câu cuối cùng của bạn, tôi cho rằng bạn có nghĩa là grep?
Gilles 'SO- ngừng trở nên xấu xa'

@Gilles - nhìn vào tiêu đề ban đầu của câu hỏi trước khi Michael chỉnh sửa nó. Đây dường như là một câu hỏi về DOS (và tôi đã đánh dấu nó ngoài chủ đề).
Nils

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.