Những thành phần có thể sửa đổi nào của một hệ thống học tập chịu trách nhiệm cho sự thành công hay thất bại của nó? Những thay đổi để cải thiện hiệu suất? Điều này đã được gọi là vấn đề chuyển nhượng tín dụng cơ bản (Minsky, 1963). Có các phương pháp gán tín dụng chung cho người giải quyết vấn đề phổ quát, tối ưu hóa thời gian theo các nghĩa lý thuyết khác nhau (Phần 6.8). Tuy nhiên, cuộc khảo sát hiện tại sẽ tập trung vào hẹp hơn, nhưng hiện tại quan trọng về mặt thương mại, trường con của Deep Learning (DL) trong Mạng nơ ron nhân tạo (NN).
Một mạng nơ ron tiêu chuẩn (NN) bao gồm nhiều bộ xử lý đơn giản, được kết nối được gọi là nơ-ron, mỗi bộ tạo ra một chuỗi các kích hoạt có giá trị thực. Các nơ-ron đầu vào được kích hoạt thông qua các cảm biến nhận biết môi trường, các nơ-ron khác được kích hoạt thông qua các kết nối có trọng số từ các nơ-ron hoạt động trước đó (chi tiết trong Phần 2). Một số tế bào thần kinh có thể ảnh hưởng đến môi trường bằng cách kích hoạt các hành động. Học tập hoặc giao tín dụng là tìm kiếm các trọng số khiến NN thể hiện hành vi mong muốn, chẳng hạn như lái xe hơi. Tùy thuộc vào vấn đề và cách các nơ-ron được kết nối, hành vi đó có thể yêu cầu các chuỗi nguyên nhân dài của các giai đoạn tính toán (Phần 3), trong đó mỗi giai đoạn biến đổi (thường theo cách phi tuyến tính) kích hoạt tổng hợp của mạng. Deep Learning là về việc gán tín dụng chính xác qua nhiều giai đoạn như vậy.
Các mô hình giống như NN nông với vài giai đoạn như vậy đã xuất hiện trong nhiều thập kỷ nếu không phải là thế kỷ (Phần 5.1). Các mô hình với một số lớp tế bào thần kinh phi tuyến liên tiếp có niên đại ít nhất là từ những năm 1960 (Phần 5.3) và 1970 (Phần 5.5). Một phương pháp giảm độ dốc hiệu quả cho Học tập giám sát (SL) dựa trên giáo viên trong các mạng riêng biệt, có độ sâu khác nhau được gọi là backpropagation (BP) đã được phát triển vào những năm 1960 và 1970, và được áp dụng cho NN vào năm 1981 (Phần 5.5). Tuy nhiên, việc đào tạo các NN sâu với nhiều lớp, tuy nhiên, đã gặp khó khăn trong thực tế vào cuối những năm 1980 (Phần 5,6) và đã trở thành một đề tài nghiên cứu rõ ràng vào đầu những năm 1990 (Phần 5,9). DL thực tế trở nên khả thi ở một mức độ nào đó thông qua sự trợ giúp của Học tập không giám sát (UL), ví dụ, Sec. 5.10 (1991), Giây. 5.15 (2006). Những năm 1990 và 2000 cũng chứng kiến nhiều cải tiến của DL hoàn toàn được giám sát (Phần 5). Trong thiên niên kỷ mới, các NN sâu cuối cùng đã thu hút được sự chú ý rộng rãi, chủ yếu bằng cách vượt trội so với các phương pháp học máy thay thế như máy nhân (Vapnik, 1995; Scholkopf et al., 1998) trong nhiều ứng dụng quan trọng. Trên thực tế, kể từ năm 2009, các NN sâu được giám sát đã giành chiến thắng trong nhiều cuộc thi nhận dạng mẫu quốc tế chính thức (ví dụ, Phần 5.17, 5.19, 5.21, 5.22), đạt được kết quả nhận dạng hình ảnh siêu phàm đầu tiên trong các lĩnh vực hạn chế (Phần 5.19, 2011). Các NN sâu cũng đã trở nên phù hợp với lĩnh vực Tổng quát hơn về Học tập Củng cố (RL) khi không có giáo viên giám sát (Phần 6). chủ yếu bằng cách vượt trội so với các phương pháp học máy thay thế như máy nhân (Vapnik, 1995; Scholkopf et al., 1998) trong nhiều ứng dụng quan trọng. Trên thực tế, kể từ năm 2009, các NN sâu được giám sát đã giành chiến thắng trong nhiều cuộc thi nhận dạng mẫu quốc tế chính thức (ví dụ, Phần 5.17, 5.19, 5.21, 5.22), đạt được kết quả nhận dạng hình ảnh siêu phàm đầu tiên trong các lĩnh vực hạn chế (Phần 5.19, 2011). Các NN sâu cũng đã trở nên phù hợp với lĩnh vực Tổng quát hơn về Học tập Củng cố (RL) khi không có giáo viên giám sát (Phần 6). chủ yếu bằng cách vượt trội so với các phương pháp học máy thay thế như máy nhân (Vapnik, 1995; Scholkopf et al., 1998) trong nhiều ứng dụng quan trọng. Trên thực tế, kể từ năm 2009, các NN sâu được giám sát đã giành chiến thắng trong nhiều cuộc thi nhận dạng mẫu quốc tế chính thức (ví dụ, Phần 5.17, 5.19, 5.21, 5.22), đạt được kết quả nhận dạng hình ảnh siêu phàm đầu tiên trong các lĩnh vực hạn chế (Phần 5.19, 2011). Các NN sâu cũng đã trở nên phù hợp với lĩnh vực Tổng quát hơn về Học tập Củng cố (RL) khi không có giáo viên giám sát (Phần 6). đạt được kết quả nhận dạng mẫu hình ảnh siêu phàm đầu tiên trong các lĩnh vực hạn chế (Phần 5.19, 2011). Các NN sâu cũng đã trở nên phù hợp với lĩnh vực Tổng quát hơn về Học tập Củng cố (RL) khi không có giáo viên giám sát (Phần 6). đạt được kết quả nhận dạng mẫu hình ảnh siêu phàm đầu tiên trong các lĩnh vực hạn chế (Phần 5.19, 2011). Các NN sâu cũng đã trở nên phù hợp với lĩnh vực Tổng quát hơn về Học tập Củng cố (RL) khi không có giáo viên giám sát (Phần 6).
Mặt khác, tôi không chắc chắn rằng có nhất thiết phải có lợi khi thử và xây dựng một phân loại các nhóm loại trừ lẫn nhau cho các chiến lược học máy. Tôi nghĩ rằng chúng ta có thể nói rằng có những quan điểm mà từ đó các mô hình có thể được xem là mạng lưới thần kinh. Tôi không nghĩ rằng viễn cảnh đó nhất thiết phải là tốt nhất hay hữu ích trong mọi bối cảnh. Ví dụ, tôi vẫn dự định coi các khu rừng ngẫu nhiên và các cây được tăng cường độ dốc là "quần thể cây" thay vì trừu tượng hóa sự khác biệt của chúng và gọi chúng là "cây mạng lưới thần kinh". Hơn nữa, Schmidhuber phân biệt NN với máy hạt nhân - mặc dù máy hạt nhân có một số kết nối với NN - khi ông viết "Trong thiên niên kỷ mới, NN sâu cuối cùng đã thu hút được sự chú ý rộng rãi, chủ yếu bằng cách vượt trội so với các phương pháp học máy thay thế như máy nhân ... trong nhiều ứng dụng quan trọng. "