Lưu một bản sao chính xác của một trang web an toàn ở dạng đồ họa vector


9

Tôi muốn lưu một bản sao chính xác của trang web ở dạng đồ họa vector, vì vậy tôi không thể sử dụng kỹ thuật chụp màn hình (vì nó lưu hình ảnh ở dạng đồ họa rastor).

Tôi đã thử 'in thành pdf' và 'lưu dưới dạng pdf' thông qua Safari, Chrome và Firefox. Điều này làm việc hầu hết thời gian. Tuy nhiên, bản pdf được lưu không phải là bản sao chính xác cho tất cả các trang web. Ví dụ: hãy thử lưu trang web này dưới dạng pdf và lưu ý cách các biểu tượng upvote / downvote không được bao gồm trong pdf đã lưu.

Tôi cũng đã thử lưu dưới dạng WebArchive với Safari. Vấn đề ở đây là tôi cần cắt tệp kết quả và tôi không biết cách cắt WebArchive, vì Preview không thể mở nó và nó chỉ đơn giản mở ra trong Safari (quay lại hình vuông).

Tôi cũng đã thử các plugin trình duyệt web cung cấp giải pháp một lần nhấp để lưu trang web dưới dạng pdf (dạng đồ họa vector). Điều này hoạt động tốt hơn (trang chính xác được lưu) và gần như giải quyết vấn đề, ngoại trừ việc các chương trình này hoạt động bằng cách gửi url trang đến chương trình dựa trên đám mây để truy vấn và sau đó lưu trang. Điều này có nghĩa là kỹ thuật này sẽ không hoạt động đối với các trang web https cần thông tin đăng nhập của tôi.

Vì vậy, tôi đang ở một góc. Tôi đang cố lưu một bản sao đồ họa vector chính xác của một trang web cần thông tin đăng nhập của tôi để xem. Tôi có thể làm cái này như thế nào?


1
Tôi nghĩ rằng bạn đang nhầm lẫn - PDF không phải là một định dạng vector.
Kevin Panko

Không nhầm lẫn; đừng lo lắng quá nhiều về chi tiết pdf là một thùng chứa có thể lưu trữ các công cụ đồ họa vector, vì tôi nghĩ rằng điểm chính trong câu hỏi đang được chuyển tải
Clayton Stanley

Câu hỏi của bạn dường như là "Làm cách nào tôi có thể lưu một trang web dưới dạng tệp PDF, chính xác như nó hiển thị trên màn hình và hoạt động với một trang yêu cầu mật khẩu để đăng nhập?"
Kevin Panko

Không phải là pdf; đó chỉ là một tuyến đường để lưu một trang web có văn bản ở dạng đồ họa vector. Tôi không phải cam kết với định dạng đó. Tôi sẽ thêm an toàn vào tiêu đề cho ghi chú thứ hai, để điều này được nhấn mạnh tốt hơn.
Clayton Stanley

Câu trả lời:


6

Bạn đang nhận được các kết quả khác nhau khi in trang thành PDF so với khi bạn xem trang trên màn hình.

Điều này xảy ra vì trang web bao gồm biểu định kiểu CSS thay đổi trang khi nó được in.

Câu hỏi này sẽ giúp bạn tránh được vấn đề đó: Làm cách nào để in bằng biểu định kiểu màn hình?

Làm theo các hướng dẫn ở đó để in trang bằng biểu định kiểu trên màn hình.

Sau đó, bạn sẽ có thể in ra PDF và nhận được kết quả giống như bạn thấy trên màn hình.


1
Chỉ để có tài liệu đầy đủ, tôi đã kết thúc bằng cách sử dụng plugin Chrome Web Developer và chỉnh sửa css thông qua plugin này. Tôi không thể cập nhật trang in sau khi chỉnh sửa css bằng Công cụ dành cho nhà phát triển tích hợp của Google Chrome, nhưng điều này rất có thể là do tôi không quen với công cụ đó.
Clayton Stanley

4

Nếu bạn không sợ một chút kịch bản, bạn có thể thử sử dụng ứng dụng ph Phantomjs cho OSX từ http: //ph Phantomjs.org/

Sau đó, bạn sẽ chỉ chạy nhị phân đi kèm bằng cách sử dụng tập lệnh rasterize.js với một lệnh như:

phantomjs.exe rasterize.js http://www.example.com/sitepage 8.5in*11in outfile.pdf

Một vài lưu ý:

  • Nó được gọi là 'rasterize.js' nhưng bản thân văn bản được lưu vào PDF dưới dạng văn bản thực tế.

  • Xác thực đến một trang web an toàn bằng cách sử dụng xác thực windows có thể được thực hiện bằng cách thêm một vài dòng vào tập lệnh rasterize.js sau khi khởi tạo đối tượng trang:

var page = quiries ('trang web'). created (),
    system = Yêu cầu ('hệ thống'),
    địa chỉ, đầu ra, kích thước;
    page.sinstall.userName = "serviceUserName"; // Tôi đã thêm những
    page.sinstall.password = "servicePassword"; // 2 dòng ở đây

if (system.args.length 5) {

ph Phantomjs đá!
Matthew Khóa
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.