Làm thế nào để tìm kiếm trong các tệp PDF bằng cách sử dụng các biểu thức thông thường?


15

Thông thường tôi sử dụng Notepad ++ để tìm kiếm trong (các) tệp bằng các biểu thức thông thường. Hôm nay tôi tự hỏi nếu có một chương trình PDF nào làm tương tự cho các tệp PDF. Tất nhiên tôi có thể chuyển đổi PDF thành văn bản và sử dụng Notepad ++ nhưng có cách nào dễ dàng hơn mà không cần chuyển đổi không?


1
Bạn đang sử dụng hệ điều hành nào?
Scott McClenning

Xem trước Windows Developer và Windows 7
Michael S.

Câu trả lời:


9

Một vài lựa chọn:


1
@akira Còn Linux thì sao?
Nikhil

4
  1. Agent Ransack là miễn phí (lite) và hỗ trợ PDF khi xác nhận phát hành của nó.
  2. PowerGREP là một sản phẩm thương mại.

Như bạn đã nói, sự thay thế rõ ràng là chuyển đổi các tệp PDF thành văn bản. Một cách để lập trình viên thiết lập để xử lý hàng loạt là sử dụng gói PDFMiner của Python. Agent Ransack sử dụng "pdftotext" từ dự án Xpdf (và bạn cũng có thể).


sidenote: Agent Ransack là phiên bản rút gọn của FileLocator
akira

Cảm ơn! Tôi nhìn kỹ hơn. Ghi chú phát hành của nhà cung cấp xác nhận rằng File Locator Lite hay Agent Ransack không hỗ trợ PDF. Chỉnh sửa câu trả lời của tôi.
minopret

Đặc vụ Ransack thực hiện công việc. Bạn cũng có thể muốn dùng thử DNGrep.
Michael S.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.