Thủ thuật Javascript? Làm thế nào để scribd gây khó khăn cho việc sao chép và dán văn bản


19

Gần đây, tôi đã thấy rằng scribd khiến người dùng (người dùng miễn phí) rất khó duyệt qua một tài liệu được lưu trữ trên trang web của họ. Không có khả năng tìm kiếm trong một tài liệu, chứ chưa nói đến việc có thể tải xuống cùng.

Sử dụng javascript, họ tải các trang theo yêu cầu trong trình duyệt và do đó tính năng "lưu dưới dạng" của trình duyệt không giúp ích nhiều.

Trước sự ngạc nhiên của tôi, tôi thấy rằng thậm chí sao chép / dán văn bản sao chép vô nghĩa vào bảng tạm! Để kiểm tra xem có gì sai, tôi đã tắt javascript trong trình duyệt và sau đó tải lại cùng một tài liệu. Voila, tôi đã nhìn thấy sự vô nghĩa. Và do đó, có vẻ như javascript từ scribd bằng cách nào đó giải mã văn bản vô nghĩa và sau đó hiển thị nó trong trình duyệt.

Bây giờ, câu hỏi của tôi là, ngay cả sau khi javascript được kích hoạt và văn bản được hiển thị đúng trong trình duyệt, nếu tôi đi và nhìn vào các đối tượng DOM tương ứng với văn bản tôi chọn, tôi vẫn thấy văn bản vô nghĩa.

Vì vậy, bây giờ, tôi bối rối. Văn bản được hiển thị ổn cho người dùng, nhưng các đối tượng DOM vẫn chứa sự vô nghĩa. Vì vậy, câu hỏi là, trang web đang sử dụng loại hook / code javascript nào để có thể giữ lại sự vô nghĩa trong các đối tượng DOM và vẫn hiển thị văn bản được giải mã?

Có cách nào để tôi có thể truy cập vào văn bản được giải mã không? Ý định của tôi không phải là thiết kế ngược thuật toán để giải mã, mà là xác định vị trí nơi văn bản được giải mã đang được lưu trữ?

Tài liệu mẫu là:

http://www.scribed.com/doc/143886351/OCP-Upgrad-to-Oracle-Database-12c-Student-Guide-vol-1-Exam-1Z0-060

Xem những gì xảy ra khi bạn bật / tắt Javascript!


Nó đơn giản. Họ đã tạo một trình xem pdf javascript. Mozilla đã làm một cái gì đó với Firefox. Vì trình xem PDF của bạn không thực sự được sử dụng để hiển thị nội dung nên họ có thể kiểm soát gần như mọi khía cạnh của trải nghiệm xem.
Ramhound

Câu trả lời:


15

Nhìn vào font-familycho span. Họ sử dụng một phông chữ tùy chỉnh (trong trường hợp này ff6).

Họ phải làm điều này để nhiều tài liệu PDF được hiển thị chính xác. Như trong tài liệu PDF, không có yêu cầu rằng văn bản trong tài liệu phải sử dụng một bộ ký tự chuẩn. Nó chỉ cần sử dụng một mã có ánh xạ tới glyphs trong phông chữ nhúng.


10

Nếu bạn nhìn vào văn bản được hiển thị so với "vô nghĩa", bạn có thể thấy rằng một số chữ cái giống nhau, trong khi một số chữ cái được thay thế. Ví dụ: "Mltmrprfsm Jblbemr" là "Trình quản lý doanh nghiệp". Cung cấp đủ văn bản, bạn sẽ có thể xây dựng một bảng dịch nhanh. Chúng ta đã biết rằng M dịch sang E , L -> N , T , RP là rõ ràng, F -> R , v.v. Trong một thời gian, công việc thám tử và kỹ năng lập trình khiêm tốn, người ta có thể dịch toàn bộ tài liệu.

Tất nhiên, không có gì đảm bảo rằng tài liệu tiếp theo sẽ sử dụng cùng một ff6phông chữ mà Dan D. đã đề cập , do đó, việc lấy phông chữ đó để sử dụng cục bộ sẽ là bước tiếp theo của bạn nếu bạn muốn lưu văn bản cho lần sau.


0

Bạn có thể thử chụp ảnh màn hình bằng công cụ cắt của trình duyệt và sau đó sử dụng bất kỳ trang web ocr trực tuyến nào có sẵn để chuyển đổi nó thành văn bản. Điều đó sẽ loại bạn ra.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.