Tôi cần chuyển đổi tệp PowerPoint PPTX thành HTML bằng dòng lệnh. Tệp HTML phải giữ văn bản dưới dạng văn bản (không phải hình ảnh) trong khi chuyển đổi tất cả Hình dạng, Nghệ thuật thông minh và Đồ thị thành hình ảnh (hoặc nếu không phải là hình ảnh, thì SVG).
Tôi đang cố gắng thực hiện điều này bằng cách sử dụng LibreScript Impress 4.4.3.2.
Nếu tôi mở Ấn tượng và Xuất tệp PPTX sang HTML, tất cả các trang chiếu sẽ được chuyển đổi thành hình ảnh bao gồm cả văn bản. Nếu tôi xuất sang PDF, nó thực sự bảo tồn văn bản và chuyển đổi tất cả các hình dạng tốt, nhưng than ôi ... tôi muốn HTML không phải là PDF.
Sử dụng dòng lệnh (trên Windows 8), tôi đã thử tất cả các bộ lọc HTML mà tôi tìm thấy trên: liên kết văn bản
Hầu hết trong số họ chỉ đơn giản là không làm việc. Gần nhất tôi có thể tìm thấy:
soffice.exe - không đầu - chuyển đổi sang html --outdir d: \ temp d: \ temp \ thuyết trình.pptx đã chuyển đổi văn bản tốt, nhưng vì một số lý do, tất cả các hình dạng và đồ thị bị thiếu trong tệp HTML đã chuyển đổi.
Làm thế nào tôi có thể giải quyết vấn đề của tôi? Có lẽ một số công cụ / thư viện miễn phí khác có thể làm điều đó?