Tại sao OCR không thể được coi là một ví dụ tốt về AI?


17

Trên trang wikipedia về AI, chúng ta có thể đọc:

Nhận dạng ký tự quang học không còn được coi là một ví dụ điển hình cho "trí tuệ nhân tạo" đã trở thành một công nghệ thông thường.

Mặt khác, cơ sở dữ liệu các chữ số viết tay của MNIST được thiết kế đặc biệt để đào tạo và kiểm tra các mạng thần kinh và tỷ lệ lỗi của chúng (xem: Phân loại ).

Vậy tại sao câu trích dẫn ở trên nói rằng OCR không còn là mẫu mực của AI?

Câu trả lời:


18

Bất cứ khi nào một vấn đề trở nên có thể giải quyết được bằng máy tính, mọi người bắt đầu tranh luận rằng nó không cần đến trí thông minh. John McCarthy thường được trích dẫn: "Ngay khi nó hoạt động, không ai gọi nó là AI nữa" ( Tham khảo trong CACM ).

Một trong những giáo viên của tôi ở trường đại học nói rằng vào những năm 1950, một giáo sư đã được hỏi về những gì ông nghĩ là thông minh cho một chiếc máy. Giáo sư đã trả lời một cách có uy tín rằng nếu một máy bán hàng tự động cho anh ta sự thay đổi phù hợp, thì đó sẽ là thông minh.

Sau đó, chơi cờ được coi là thông minh. Tuy nhiên, máy tính bây giờ có thể đánh bại các đại kiện tướng trong cờ vua, và mọi người không còn nói rằng đó là một hình thức thông minh.

Bây giờ chúng tôi có OCR. Điều đó đã được nêu trong một câu trả lời khác rằng các phương pháp của chúng tôi không có phương tiện nhận dạng của một đứa trẻ 5 tuổi. Ngay khi đạt được điều này, mọi người sẽ nói "meh, đó không phải là trí thông minh, một đứa trẻ 5 tuổi có thể làm điều đó!"

Một khuynh hướng tâm lý, một nhu cầu nói rằng chúng ta bằng cách nào đó vượt trội hơn máy móc, là cơ sở của điều này.


1
Có lẽ câu dẫn cần một số tài liệu tham khảo McCarthy thường được trích dẫn: "Ngay khi nó hoạt động, không ai gọi nó là AI."
Eric Platon

1
@EricPlaton Điểm tốt, cảm ơn! Cập nhật câu trả lời. Không thể tìm thấy tài liệu tham khảo trực tiếp, nhưng CACM phải đủ tin cậy.
SL Barth - Phục hồi Monica

Nếu chúng ta phủ nhận như thế này, chúng ta sẽ không bao giờ biết khi nào robot sẽ đạt được AGI.
logeekal

12

Mặc dù OCR hiện là một công nghệ chính thống, nhưng vẫn không có phương pháp nào của chúng tôi thực sự có các phương tiện nhận dạng của một đứa trẻ 5 tuổi (tuyên bố thành công với CAPTCHA mặc dù). Chúng tôi không biết làm thế nào để đạt được điều này bằng cách sử dụng các kỹ thuật được hiểu rõ, vì vậy OCR vẫn nên được coi là một vấn đề AI.

Để xem tại sao điều này có thể là như vậy, thật sáng sủa khi đọc bài tiểu luận "Khi thấy A và nhìn thấy AS" của Douglas Hofstadter.

Đối với một điểm được đưa ra trong một câu trả lời khác, việc đóng khung tác nhân là một điều hữu ích khi nó thúc đẩy thành công trong môi trường ngày càng phức tạp. Tuy nhiên, có nhiều vấn đề khó khăn (ví dụ như Bongard) không cần phải được nêu trong một kiểu như vậy.


4

Tôi không chắc chắn nếu dự đoán MNIST có thể thực sự được coi là một nhiệm vụ AI. Các vấn đề về AI thường có thể được đóng khung trong bối cảnh tác nhân hoạt động trong môi trường. Mạng lưới thần kinh và kỹ thuật học máy nói chung không phải đối phó với việc đóng khung này. Phân loại chẳng hạn, đang học một ánh xạ giữa hai không gian. Mặc dù người ta có thể lập luận rằng bạn có thể đóng khung phân loại OCR / hình ảnh thành một vấn đề AI - bộ phân loại là tác nhân, mỗi dự đoán mà nó đưa ra là một hành động và nó nhận được phần thưởng dựa trên độ chính xác phân loại của nó - điều này khá bất thường và khác với các vấn đề thường được coi là vấn đề AI.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.