Một bài báo gần đây của He et al. ( Học tập sâu để nhận dạng hình ảnh , Microsoft Research, 2015) tuyên bố rằng họ sử dụng tới 4096 lớp (không phải nơ-ron!).
Tôi đang cố gắng để hiểu bài báo, nhưng tôi vấp ngã về từ "dư".
Ai đó có thể xin vui lòng cho tôi một lời giải thích / định nghĩa những gì còn lại có nghĩa là trong trường hợp này?
Ví dụ
Chúng tôi định dạng lại một cách rõ ràng các lớp là học các hàm dư với tham chiếu đến các đầu vào của lớp, thay vì học các hàm không được ước tính.
[...]
Thay vì hy vọng mỗi lớp xếp chồng lên nhau phù hợp trực tiếp với ánh xạ cơ bản mong muốn, chúng tôi rõ ràng để các lớp này phù hợp với ánh xạ dư. Chính thức, biểu thị ánh xạ cơ bản mong muốn như, chúng tôi để các lớp phi tuyến xếp chồng lên nhau phù hợp với ánh xạ khác của . Ánh xạ ban đầu được đúc lại thành. Chúng tôi đưa ra giả thuyết rằng việc tối ưu hóa ánh xạ dư dễ dàng hơn so với tối ưu hóa ánh xạ ban đầu, không được ước tính