Tôi thận trọng chống lại sự mong đợi sự tương đồng mạnh mẽ giữa các mạng lưới thần kinh sinh học và nhân tạo. Tôi nghĩ cái tên "mạng lưới thần kinh" hơi nguy hiểm, bởi vì nó lừa mọi người mong đợi rằng các quá trình thần kinh và học máy phải giống nhau. Sự khác biệt giữa mạng lưới thần kinh sinh học và nhân tạo vượt xa sự tương đồng.
Như một ví dụ về cách điều này có thể trở nên tồi tệ, bạn cũng có thể biến lý do trong bài viết gốc trên đầu của nó. Bạn có thể đào tạo một mạng lưới thần kinh để học cách nhận biết ô tô vào một buổi chiều, miễn là bạn có một máy tính khá nhanh và một số lượng dữ liệu đào tạo. Bạn có thể thực hiện nhiệm vụ nhị phân này (ô tô / không phải ô tô) hoặc nhiệm vụ đa lớp (ô tô / xe điện / xe đạp / máy bay / thuyền) mà vẫn tự tin vào mức độ thành công cao.
Ngược lại, tôi sẽ không mong đợi một đứa trẻ có thể chọn ra một chiếc xe trong ngày - hoặc thậm chí cả tuần - sau khi nó được sinh ra, ngay cả sau khi nó đã thấy "rất nhiều ví dụ đào tạo." Một cái gì đó rõ ràng là khác nhau giữa một đứa trẻ hai tuổi và một đứa trẻ chiếm sự khác biệt về khả năng học tập, trong khi đó mạng lưới thần kinh phân loại hình ảnh vanilla hoàn toàn có khả năng chọn phân loại đối tượng ngay sau khi "sinh". Tôi nghĩ rằng có hai điểm khác biệt quan trọng: (1) khối lượng dữ liệu đào tạo tương đối có sẵn và (2) cơ chế tự dạy phát triển theo thời gian vì dữ liệu đào tạo phong phú.
Bài viết gốc cho thấy hai câu hỏi. Tiêu đề và nội dung của câu hỏi hỏi tại sao mạng lưới thần kinh cần "rất nhiều ví dụ". Liên quan đến trải nghiệm của trẻ em, các mạng lưới thần kinh được đào tạo sử dụng các điểm chuẩn hình ảnh phổ biến có tương đối ít dữ liệu.
Tôi sẽ diễn đạt lại câu hỏi trong tiêu đề để
"Làm thế nào để đào tạo một mạng lưới thần kinh cho một điểm chuẩn hình ảnh chung so sánh & tương phản với trải nghiệm học tập của một đứa trẻ?"
Để so sánh, tôi sẽ xem xét dữ liệu CIFAR-10 vì đây là điểm chuẩn hình ảnh phổ biến. Phần được dán nhãn bao gồm 10 lớp hình ảnh với 6000 hình ảnh mỗi lớp. Mỗi hình ảnh là 32x32 pixel. Nếu bạn bằng cách nào đó xếp chồng các hình ảnh được dán nhãn từ CIFAR-10 và tạo video 48 khung hình / giây tiêu chuẩn, bạn sẽ có khoảng 20 phút cảnh quay.
Một đứa trẻ 2 tuổi quan sát thế giới trong 12 giờ mỗi ngày có khoảng 263000 phút (hơn 4000 giờ) các quan sát trực tiếp về thế giới, bao gồm cả phản hồi từ người lớn (nhãn). (Đây chỉ là những số liệu về sân bóng - Tôi không biết một đứa trẻ hai tuổi điển hình đã dành bao nhiêu thời gian để quan sát thế giới.) Ngoài ra, đứa trẻ sẽ tiếp xúc với nhiều, nhiều vật thể ngoài 10 lớp học bao gồm CIFAR- 10.
Vì vậy, có một vài điều chơi. Một là đứa trẻ tiếp xúc với nhiều dữ liệu hơn và nguồn dữ liệu đa dạng hơn so với mô hình CIFAR-10 có. Đa dạng dữ liệu và khối lượng dữ liệu được công nhận là điều kiện tiên quyết cho các mô hình mạnh mẽ nói chung. Trong ánh sáng này, không có gì đáng ngạc nhiên khi một mạng lưới thần kinh thực hiện nhiệm vụ này kém hơn trẻ em, bởi vì một mạng lưới thần kinh được đào tạo về CIFAR-10 bị bỏ đói tích cực về dữ liệu đào tạo so với trẻ hai tuổi. Độ phân giải hình ảnh có sẵn cho một đứa trẻ tốt hơn so với hình ảnh CIFAR-10 32x32, vì vậy đứa trẻ có thể tìm hiểu thông tin về các chi tiết đẹp của các vật thể.
So sánh CIFAR-10 đến hai tuổi không hoàn hảo vì mô hình CIFAR-10 có thể sẽ được huấn luyện với nhiều lần vượt qua trên cùng một hình ảnh tĩnh, trong khi đứa trẻ sẽ nhìn thấy, sử dụng thị giác hai mắt, cách sắp xếp các vật thể trong ba thế giới hai chiều trong khi di chuyển và với các điều kiện và quan điểm ánh sáng khác nhau trên cùng một đối tượng.
Giai thoại về con của OP ngụ ý một câu hỏi thứ hai,
"Làm thế nào mạng lưới thần kinh có thể trở thành tự dạy?"
Một đứa trẻ được ban cho một số tài năng để tự học, do đó, các loại đối tượng mới có thể được thêm vào theo thời gian mà không phải bắt đầu lại từ đầu.
Nhận xét của OP về học tập chuyển tên là một loại thích ứng mô hình trong bối cảnh học máy.
Trong các bình luận, những người dùng khác đã chỉ ra rằng học một và vài lần bắn * là một lĩnh vực nghiên cứu máy học khác.
Ngoài ra, học tăng cường giải quyết các mô hình tự dạy từ một góc nhìn khác, về cơ bản cho phép robot thực hiện thử nghiệm thử và sai để tìm chiến lược tối ưu để giải quyết các vấn đề cụ thể (ví dụ: chơi cờ).
Có lẽ đúng là cả ba mô hình học máy này đều có tác dụng cải thiện cách thức máy móc thích ứng với các nhiệm vụ thị giác máy tính mới. Nhanh chóng thích ứng các mô hình học máy với các nhiệm vụ mới là một lĩnh vực nghiên cứu tích cực. Tuy nhiên, vì các mục tiêu thực tế của các dự án này (xác định các trường hợp phần mềm độc hại mới, nhận ra kẻ mạo danh trong ảnh hộ chiếu, lập chỉ mục internet) và tiêu chí thành công khác với mục tiêu của một đứa trẻ học về thế giới và thực tế là chúng đã được thực hiện một máy tính sử dụng toán học và máy tính khác được thực hiện bằng vật liệu hữu cơ sử dụng hóa học, so sánh trực tiếp giữa hai máy tính sẽ vẫn còn nhiều khó khăn.
Bên cạnh đó, sẽ rất thú vị khi nghiên cứu cách lật vấn đề CIFAR-10 và huấn luyện một mạng lưới thần kinh để nhận ra 6000 đối tượng từ 10 ví dụ của mỗi đối tượng. Nhưng ngay cả điều này sẽ không so sánh công bằng với trẻ 2 tuổi, bởi vì vẫn có sự khác biệt lớn về tổng khối lượng, tính đa dạng và độ phân giải của dữ liệu đào tạo.
* Hiện tại chúng tôi không có thẻ cho học tập một lần hoặc học vài lần.