Làm thế nào để recaptcha biết bạn không tham gia vào các bản dịch không có thật của các bức ảnh [đã đóng]

Đã đóng cửa. Câu hỏi này không đúng chủ đề . Nó hiện không chấp nhận câu trả lời.

Bạn muốn cải thiện câu hỏi này? Cập nhật câu hỏi để nó thuộc chủ đề cho Siêu người dùng.

Đóng cửa 8 năm trước .

Theo những gì tôi hiểu, Captchas là văn bản đã bị biến dạng bởi ứng dụng của các bộ lọc, tiếng ồn và các thuật toán sai khác. Do đó, để tìm hiểu xem khả năng đọc của người đó có phải là của một người hay không, bạn so sánh câu trả lời của họ với câu trả lời đã biết là gì.

Bây giờ, đọc lên ReCaptcha, nó nói rằng những từ được hiển thị là những từ không thể được dịch bởi OCR. Ngoài ra, recaptcha đang được sử dụng để dịch những hình ảnh đó. Làm thế nào nó có thể cho biết liệu bạn có thực sự đúng trong việc đọc của bạn hoặc chỉ đang làm cho lên?

Nếu nó biết những gì nó nói, nó sẽ không được sử dụng trong recaptcha làm tài liệu dịch thuật. Nếu nó không biết văn bản nói gì, thì nó xác nhận câu trả lời của bạn như thế nào?

Tôi đoán đây có lẽ là một số phân tích dựa trên xác suất với kích thước mẫu rất lớn trước khi nó đánh dấu mọi thứ như đã dịch.

Có ai biết câu trả lời cho vấn đề này ở đâu không?

images captcha

— Zigu
nguồn

Quan tâm là trò chơi khăm 4chan / ẩn danh trong cuộc thăm dò thời gian. "Bánh đá cẩm thạch, cũng là trò chơi", khai thác lỗ hổng trong xác minh nguồn gốc từ đám đông của từ thứ hai.

— DanBeale

Bản hack @Dan mentioend: musicmachowder.com/2009/04/27/moot-wins-time-inc-loses

— BlueRaja - Danny Pflughoeft

Câu trả lời:

Các trang sách về cơ bản được quét bằng hình ảnh, sau đó chuyển thành văn bản bằng cách sử dụng "Nhận dạng ký tự quang học" (OCR) và được đưa lên web dưới dạng một hình ảnh với một từ được biết đến bởi chương trình máy tính đằng sau reCAPTCHA và một từ không chưa biết

Sau đó, người dùng gõ cả hai từ và nếu họ giải được câu trả lời đã biết, hệ thống sẽ cho rằng câu trả lời của họ là chính xác cho từ mới. Hệ thống sau đó cung cấp hình ảnh mới cho một số người khác để xác định, với độ tin cậy cao hơn, liệu câu trả lời ban đầu có chính xác hay không. Do đó, hệ thống là một dịch vụ tự cải thiện và trở nên tốt hơn theo thời gian.

http://www.google.com/recaptcha/learnmore

— Paul
nguồn

Đây là lý do tại sao reCaptcha có bạn nhập hai từ. Một trong những từ đã được biết đến, và một trong những từ không được biết đến. Cho dù bạn vượt qua hay thất bại captcha chỉ phụ thuộc vào cách bạn trả lời cho từ được biết. Câu trả lời của bạn cho từ khác (chưa biết) sẽ được sử dụng, cùng với các câu trả lời khác cho cùng một từ, để biến nó thành một từ đã biết.

— Joel Coehoorn
nguồn

... đó cũng là lý do tại sao theo thời gian, nó ngày càng trở nên khó chịu hơn khi sử dụng và thuyết phục bạn rằng bạn là một thằng ngốc / robot khi bạn thất bại lần thứ 5 liên tiếp. :-(

— Sirex

Lạ thật ... Tôi chưa bao giờ thất bại một điều mà tôi có thể nhớ, có lẽ chỉ là may mắn từ phía tôi.

— Paul

@Sirex Tôi đã từng nghĩ như vậy, nhưng sau đó tôi nhận ra rằng điều này chỉ đúng nếu kích thước của văn bản văn bản không đổi hoặc co lại so với các mục captcha số. Sự thật là văn bản kho văn bản đang phát triển ... câu hỏi đặt ra là liệu sự tăng trưởng đó có theo kịp tốc độ tăng trưởng trong việc sử dụng captcha quá mức hay không.

— Joel Coehoorn

vâng tôi đoán vậy Tôi đã thấy rất nhiều reCaptchas cực kỳ khó. Trường hợp ngay cả từ được biết là mơ hồ.

— Sirex