Có nhãn người dùng đánh dấu các đối tượng trong video mà trạng thái phân loại nghệ thuật không thể giải quyết
Tạo một trạng thái của phân loại video nghệ thuật. Cũng có thể đào tạo nó trên dữ liệu đào tạo video YouTube-8M của Google . Nhưng bạn sẽ muốn liên tục cung cấp cho video gốc.
Có nhãn phân loại càng nhiều đối tượng càng tốt. Có nó cô lập những đối tượng mà nó có thể nhận ra là đối tượng nhưng nó không thể gắn nhãn.
Có nó đầu ra video phác thảo các đối tượng. Tốt nhất là GIF, có thể dễ dàng nhúng vào các biểu mẫu.
Đối với 100 trong số này, hãy hỏi 100 người dùng đối tượng là gì. Nếu 90% người dùng đồng ý về tên của một đối tượng, hãy thêm video đó vào bộ captcha. Gọi đây là bộ được đào tạo trước.
Mỗi khi người dùng cần xác thực, hãy cho họ xem một trong những đối tượng được tô sáng trong video không phải từ bộ được đào tạo trước . Nếu hình ảnh có ít hơn 100 lần chiếu, hãy ghi lại nhãn và cung cấp cho người dùng một cái khác từ bộ được đào tạo trước. Nếu họ hiểu đúng, hãy để họ qua, nếu không, hãy đưa cho họ một cái khác từ bộ đã được sàng lọc.
Khi video không được đào tạo trước có hơn 100 buổi chiếu và hơn 90% người dùng captcha đồng ý, hãy thêm video đó vào bộ được đào tạo sau.
Theo thời gian, từ từ loại bỏ các tập đã được đào tạo trước. Đặt thời hạn sử dụng cho mỗi video trong bộ được đào tạo sau và loại bỏ chúng sau khi hết hạn, để chúng không được sử dụng quá nhiều lần.
Lý tưởng nhất, quá trình này sẽ liên tục cải thiện trình phân loại video, giữ cho nó luôn ở trạng thái nghệ thuật và đi trước các phân loại khác một chút. Có lẽ nó cũng có thể ủng hộ các từ và đối tượng ít phổ biến hơn và nhiều thứ bí truyền hơn, để chuyên môn hóa trình phân loại này chống lại các phân loại khác.
Điều tương tự có thể được thực hiện cho ghi nhãn hình ảnh, nhưng tiện ích của trình phân loại video có thể sẽ tồn tại lâu hơn, với những tiến bộ trong AI.
Nói một cách chính xác, mặc dù thiếu một số mánh khóe lượng tử, không có hệ thống captcha nào một ngày nào đó sẽ không được giải quyết bởi các hệ thống AI bên ngoài.
(chỉnh sửa: oh, tôi chỉ nhận thấy bạn đặc biệt nói "captcha văn bản". Nếu đó là ý bạn, thì tôi không nghĩ rằng phân loại văn bản còn nhiều bí ẩn trong đó. Máy tính có thể lượm lặt văn bản từ hình ảnh tốt hơn con người bây giờ. Nhưng về mặt kỹ thuật, đầu vào trong hệ thống captcha được mô tả ở trên là văn bản.)