Làm cách nào để chuyển đổi tệp HTML có hình ảnh được tham chiếu trên dòng lệnh thành webarchive?


2

Trong macOS, tôi muốn chuyển đổi các tệp HTML có hình ảnh được tham chiếu trên dòng lệnh / lập trình thành webarchives .

Cho một tập tin mẫu sample.html chứa:

<html><body>
<h1>File with resource</h1>
<p>This file shows text and references an image.</p>
<img src="sample.jpg" />
</body></html>

và một hình ảnh sample.jpg trong cùng một thư mục, tôi có thể xem tệp html trong bất kỳ trình duyệt nào và nó được kết xuất bằng hình ảnh. Để chuyển đổi sang webarchive tôi đã thử:

textutil -convert webarchive sample.html

nhưng kết quả sample.webarchive không, khi được mở trong Safari, kết xuất hình ảnh - mặc dù vậy chứa đựng nó (xem bình luận).

Làm cách nào để chuyển đổi chính xác từ dòng lệnh, sao cho kết quả chứa tái hiện hình ảnh? Sau tất cả, đó là những gì webarchives dành cho!


Nó có hoạt động không nếu bạn mở sample.html trong Safari, tạo webarchive từ đó, sau đó di chuyển cả hai tệp đi và mở kho lưu trữ trong Safari?
nohillside

@patrix Câu hỏi hay! Tôi đã thử nó và - như mong đợi - Safari có thể làm điều đó: Khi Safari lưu kho lưu trữ, nó được lưu theo cách mà khi mở và hiển thị, hình ảnh sẽ hiển thị. - Kỳ lạ là kích thước tệp của kho lưu trữ Safari và kho lưu trữ văn bản rất giống nhau, vì vậy tôi đoán lưu trữ văn bản làm chứa hình ảnh, nó chỉ không được tham chiếu đúng cách để kết xuất ...
halloleo

Vâng, nó thực sự (bạn có thể kiểm tra với plutil -p WEBARCHIVE ). Tôi đã không nhìn vào sự khác biệt mặc dù.
nohillside

@patrix Thú vị! Thx cho con trỏ tới plutil (Tôi biết rằng webarchives sử dụng plist định dạng, nhưng không nghĩ đến việc phân tích chúng với plutil. Sẽ điều tra chi tiết hơn.
halloleo

Câu trả lời:


1

Sử dụng công cụ webarchiver (mà bạn có thể cài đặt qua brew install webarchiver ):

webarchiver -url sample.html -output sample.webarchive

Webarchive được tạo ra chứa hình ảnh và Safari hiển thị hình ảnh khi nó hiển thị webarchive.


-2

Tôi nghĩ rằng dòng lệnh không nhận thấy bất kỳ hình ảnh được bao gồm.

Tôi đã thử nghiệm một trang web đơn giản với hình ảnh + văn bản và mở nó bằng Safari.

Nếu bạn chọn Tệp - & gt; Lưu dưới dạng .. 'webarchive' bạn có thể thấy trong webarchive đã tạo mà hình ảnh được thêm vào cuối tệp.

Rõ ràng là Safari đang sử dụng một số chức năng Internal Swift / Objective-C để triển khai Hình ảnh.

Nếu bạn chọn lấy html và lấy hình ảnh làm tham chiếu thì dường như bỏ qua hình ảnh và chỉ xuất văn bản (thông qua textutil).

Tôi sẽ không dựa vào webarchives khi tải xuống các trang web - thay vào đó hãy sử dụng wget hoặc curl hoặc phế liệu như phế liệu / beautifulSoup và tải chúng xuống.

Tôi biết thật tiện lợi khi có 1 tệp, nhưng đó không phải là cách tốt nhất để lưu hình ảnh và điều đó khiến cho việc trích xuất chúng sau đó trở nên khá khó khăn.


Cảm ơn bạn đã xem xét câu hỏi, nhưng từ sự hiểu biết của tôi, "câu trả lời" của bạn chủ yếu nêu lên vấn đề của tôi: đó là "dòng lệnh" tức là textutil không thể tạo một webarchive thích hợp - ít nhất không phải là cách tôi gọi nó. Tôi đang theo một công cụ / thủ tục làm việc cho dòng lệnh để làm chính xác điều đó.
halloleo
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.