Có bất kỳ thử thách CAPTCHA văn bản nào có thể đánh lừa AI, nhưng không phải con người không?

10

Có bất kỳ kỹ thuật hiện đại nào để tạo ra các thử thách CAPTCHA văn bản (vì vậy mọi người cần phải nhập đúng văn bản) có thể dễ dàng đánh lừa AI bằng một số phương pháp che giấu trực quan, nhưng đồng thời con người có thể giải quyết chúng mà không cần phải đấu tranh?

Ví dụ, tôi đang nói về khả năng nhận dạng văn bản được nhúng vào hình ảnh (mà không xem xét bất kỳ plugin bên ngoài nào như flash hoặc java, phân loại hình ảnh, v.v.) và nhập lại văn bản đã được viết hoặc một cái gì đó tương tự.

Tôi đoán việc thêm nhiễu, độ dốc, xoay chữ hoặc thay đổi màu sắc không còn là phương pháp đáng tin cậy nữa, vì chúng có thể bị phá vỡ nhanh chóng.

Bất kỳ đề xuất hoặc nghiên cứu đã được thực hiện?

image-recognition research ocr

— ken
nguồn

4

Đây không phải là loại ngược? Thông thường ai đó lần đầu tiên tạo ra một Captcha mà họ nghĩ có thể đánh lừa bot, THÌ người khác bắt đầu tự động giải quyết nó. Bất cứ điều gì mới bạn có thể nghĩ đến sẽ trở nên lỗi thời rất nhanh.

— Lurker bất mãn

Hãy thử nghĩ về những gì con người có thể làm tốt hơn máy tính. Chúng ta có thể suy luận và chúng ta (người bản ngữ) sẽ biết gần như mọi thành ngữ. Xem điều này để biết thêm ý tưởng . Tôi nghĩ rằng theo như văn bản, tốt nhất là để người dùng nhập văn bản được phân tích với NLP để phù hợp với một tình cảm được tuyên bố hoặc có thể thể hiện một cái gì đó. Máy tính không giỏi trong việc soạn thảo các câu rõ ràng, có cấu trúc tốt (nhưng tôi đoán hầu hết mọi người đều không giỏi về điều đó).

— JakeD

Thông thường CAPTCHA văn bản được sử dụng có nghĩa là CATPCHA được trình bày dưới dạng văn bản, không phải đầu vào người dùng yêu cầu phải là văn bản. Ví dụ như TextCaptcha .

— Theraot

5

Đó là một câu hỏi thú vị về những gì làm cho con người trở nên độc đáo. Có một cuốn sách hay về chủ đề có tên What Computer Cant Do của Hubert Dreyfus .

Một nhiệm vụ mà máy tính không thể xử lý (ít nhất là bây giờ) là xếp hạng những thứ quan trọng. Ví dụ: CAPTCHA yêu cầu bạn sắp xếp một danh sách ngẫu nhiên các thứ (một, năm hoặc sáu mục) theo mức độ quan trọng. Bài tập đặc biệt này đòi hỏi AI phải đưa ra quyết định (không phải lúc nào cũng hợp lý) dựa trên phán đoán của con người.

— kvfi
nguồn

5

Một phương pháp có thể có thể hoạt động là sử dụng ảo ảnh quang học như một trong đó hai đường xuống hành lang giống hệt nhau nhưng dường như dài hơn mắt người, sau đó chúng có thể được nhắc với một câu hỏi trắc nghiệm về trạng thái của đường kẻ, mắt chúng ta trông dài hơn, nhưng với một chiếc máy tính, vẫn có cùng độ dài đường thẳng. Tất nhiên, luôn có vấn đề về người khuyết tật mắt không thể hoàn thành chúng, nhưng những ảo tưởng khác nhau có thể được sử dụng để đáp ứng điều đó.

Thí dụ

— sgtdragon
nguồn

2

Có nhãn người dùng đánh dấu các đối tượng trong video mà trạng thái phân loại nghệ thuật không thể giải quyết

Tạo một trạng thái của phân loại video nghệ thuật. Cũng có thể đào tạo nó trên dữ liệu đào tạo video YouTube-8M của Google . Nhưng bạn sẽ muốn liên tục cung cấp cho video gốc.

Có nhãn phân loại càng nhiều đối tượng càng tốt. Có nó cô lập những đối tượng mà nó có thể nhận ra là đối tượng nhưng nó không thể gắn nhãn.

Có nó đầu ra video phác thảo các đối tượng. Tốt nhất là GIF, có thể dễ dàng nhúng vào các biểu mẫu.

Đối với 100 trong số này, hãy hỏi 100 người dùng đối tượng là gì. Nếu 90% người dùng đồng ý về tên của một đối tượng, hãy thêm video đó vào bộ captcha. Gọi đây là bộ được đào tạo trước.

Mỗi khi người dùng cần xác thực, hãy cho họ xem một trong những đối tượng được tô sáng trong video không phải từ bộ được đào tạo trước . Nếu hình ảnh có ít hơn 100 lần chiếu, hãy ghi lại nhãn và cung cấp cho người dùng một cái khác từ bộ được đào tạo trước. Nếu họ hiểu đúng, hãy để họ qua, nếu không, hãy đưa cho họ một cái khác từ bộ đã được sàng lọc.

Khi video không được đào tạo trước có hơn 100 buổi chiếu và hơn 90% người dùng captcha đồng ý, hãy thêm video đó vào bộ được đào tạo sau.

Theo thời gian, từ từ loại bỏ các tập đã được đào tạo trước. Đặt thời hạn sử dụng cho mỗi video trong bộ được đào tạo sau và loại bỏ chúng sau khi hết hạn, để chúng không được sử dụng quá nhiều lần.

Lý tưởng nhất, quá trình này sẽ liên tục cải thiện trình phân loại video, giữ cho nó luôn ở trạng thái nghệ thuật và đi trước các phân loại khác một chút. Có lẽ nó cũng có thể ủng hộ các từ và đối tượng ít phổ biến hơn và nhiều thứ bí truyền hơn, để chuyên môn hóa trình phân loại này chống lại các phân loại khác.

Điều tương tự có thể được thực hiện cho ghi nhãn hình ảnh, nhưng tiện ích của trình phân loại video có thể sẽ tồn tại lâu hơn, với những tiến bộ trong AI.

Nói một cách chính xác, mặc dù thiếu một số mánh khóe lượng tử, không có hệ thống captcha nào một ngày nào đó sẽ không được giải quyết bởi các hệ thống AI bên ngoài.

(chỉnh sửa: oh, tôi chỉ nhận thấy bạn đặc biệt nói "captcha văn bản". Nếu đó là ý bạn, thì tôi không nghĩ rằng phân loại văn bản còn nhiều bí ẩn trong đó. Máy tính có thể lượm lặt văn bản từ hình ảnh tốt hơn con người bây giờ. Nhưng về mặt kỹ thuật, đầu vào trong hệ thống captcha được mô tả ở trên là văn bản.)

— Doxosophoi
nguồn