Gần đây, tôi đã thấy rằng scribd khiến người dùng (người dùng miễn phí) rất khó duyệt qua một tài liệu được lưu trữ trên trang web của họ. Không có khả năng tìm kiếm trong một tài liệu, chứ chưa nói đến việc có thể tải xuống cùng.
Sử dụng javascript, họ tải các trang theo yêu cầu trong trình duyệt và do đó tính năng "lưu dưới dạng" của trình duyệt không giúp ích nhiều.
Trước sự ngạc nhiên của tôi, tôi thấy rằng thậm chí sao chép / dán văn bản sao chép vô nghĩa vào bảng tạm! Để kiểm tra xem có gì sai, tôi đã tắt javascript trong trình duyệt và sau đó tải lại cùng một tài liệu. Voila, tôi đã nhìn thấy sự vô nghĩa. Và do đó, có vẻ như javascript từ scribd bằng cách nào đó giải mã văn bản vô nghĩa và sau đó hiển thị nó trong trình duyệt.
Bây giờ, câu hỏi của tôi là, ngay cả sau khi javascript được kích hoạt và văn bản được hiển thị đúng trong trình duyệt, nếu tôi đi và nhìn vào các đối tượng DOM tương ứng với văn bản tôi chọn, tôi vẫn thấy văn bản vô nghĩa.
Vì vậy, bây giờ, tôi bối rối. Văn bản được hiển thị ổn cho người dùng, nhưng các đối tượng DOM vẫn chứa sự vô nghĩa. Vì vậy, câu hỏi là, trang web đang sử dụng loại hook / code javascript nào để có thể giữ lại sự vô nghĩa trong các đối tượng DOM và vẫn hiển thị văn bản được giải mã?
Có cách nào để tôi có thể truy cập vào văn bản được giải mã không? Ý định của tôi không phải là thiết kế ngược thuật toán để giải mã, mà là xác định vị trí nơi văn bản được giải mã đang được lưu trữ?
Tài liệu mẫu là:
Xem những gì xảy ra khi bạn bật / tắt Javascript!