Câu trả lời:
Bạn đã không đề cập đến hương vị của UNIX nhưng tôi nghĩ rằng có nhiều textutil trên nhiều.
http://www.unix.com/man-page/ ALL / 1 / TUTUTIL /
-convert fmt Convert the specified files to the indicated format and
write each one back to the file system.
fmt is one of: txt, html, rtf, rtfd, doc, docx, wordml,
odt, or webarchive
Có nhiều cái khác nhau, đây là những cái tôi đã thử nghiệm thành công (tất cả nguồn mở và miễn phí):
Có "unrtf", nhưng trong khi dữ liệu gói Ubuntu tuyên bố rằng nó có thể tạo đầu ra văn bản, trang chủ GNU unrtf không đề cập đến định dạng đó. Nhưng có lẽ bạn có thể thử điều đó.
Nhìn lướt qua một tệp RTF cho thấy rằng đánh dấu RTF là bất cứ thứ gì giữa {braces}
và bất cứ thứ gì giữa dấu gạch chéo ngược và khoảng trắng \markup
. Vì vậy, có thể strings
và một tập lệnh sed / awk / perl ngắn để xóa đánh dấu sẽ giúp bạn gần với văn bản thuần túy.