Hacking Recaptcha (còn gọi là 'Lũ dương vật')
Chiến thuật tiếp theo được sử dụng là để xem liệu họ có thể tìm thấy lỗ hổng trong việc triển khai reCAPTCHA hay không. Một điều họ phát hiện ra về reCAPTCHA là nó luôn trình bày hai từ cho người dùng để giải mã - một từ là từ kiểm soát được hệ thống reCAPTCHA biết, trong khi từ kia là một từ chưa biết (reCAPTCHA sử dụng con người để giúp sửa lỗi OCR). Wikipedia mô tả quá trình: Văn bản quét Quét được phân tích bởi hai chương trình nhận dạng ký tự quang học khác nhau; trong trường hợp các chương trình không đồng ý, từ nghi vấn sẽ được chuyển đổi thành CAPTCHA. Từ này được hiển thị cùng với một từ điều khiển đã được biết và được dán nhãn bởi con người. Những từ đó luôn được các thẩm phán của con người đưa ra một nhãn hiệu duy nhất được tái chế dưới dạng các từ kiểm soát. 2iasdo4 Điều mà Anonymous nhận ra là nếu họ luôn gắn nhãn văn bản được quét không xác định bằng cùng một từ - và nếu họ làm điều này hàng ngàn và hàng ngàn lần thì cuối cùng một tỷ lệ lớn các từ chưa biết sẽ bị gắn nhãn sai với từ của họ. Tất cả những gì họ phải làm là nhìn vào hai từ trong hình ảnh xác thực, nhập nhãn thích hợp cho từ 'dễ' (có lẽ đó sẽ là từ mà hai máy quét quang học đồng ý) và nhập từ cái này khó đấy. Nếu họ làm điều này thường xuyên đủ, thì chẳng mấy chốc, một tỷ lệ đáng kể các hình ảnh sẽ được gắn nhãn là 'dương vật' và khả năng tự động lấy lại sẽ được khôi phục (một tác dụng phụ, không bị mất đối với Ẩn danh, là khái niệm mà trong nhiều năm tới sẽ có một số sách kỹ thuật số có chữ 'dương vật' được chèn ngẫu nhiên trong toàn bộ văn bản. Cập nhật: Tôi đã hỏi Ben Maurer,
Tối ưu hóa reCAPTCHA
Hấp dẫn như khái niệm rắc chữ 'dương vật' vào văn bản, nhóm nặc danh biết rằng đồng hồ đang kêu tích tắc và nếu họ định khôi phục Tin nhắn, họ sẽ không có thời gian chờ đợi máy tự động quay lại trực tuyến - họ sẽ phải bỏ phiếu thủ công, rất nhiều lần. Và vì vậy họ cần có khả năng nhập captcha nhanh nhất có thể. Họ đã phát triển một bộ hướng dẫn cho phép họ nhanh chóng quyết định những từ reCAPTCHA nào họ có thể bỏ qua. Ví dụ:
Bạn sẽ được tặng 2 từ: 1 thật, 1 giả.
Đối với [REAL FAKE]
hoặc [FAKE REAL]
, bạn chỉ có thể nhập REAL
và nó nên được chấp nhận.
Nếu nó [LOOKSREAL LOOKSREAL]
hay [LOOKSFAKE LOOKSFAKE]
, nó thường chỉ nhanh hơn để gõ cả hai từ. Đừng lãng phí thời gian quý báu để quyết định xem cái nào là thật.
Sử dụng cả ngoại hình và loại từ để xác định một từ giả mạo. Đừng chỉ dựa vào một trong số họ.
Toàn bộ quy tắc là ở đây: captcha giả .