Một bản đồ còn lại của người Viking là gì?

Một bài báo gần đây của He et al. ( Học tập sâu để nhận dạng hình ảnh , Microsoft Research, 2015) tuyên bố rằng họ sử dụng tới 4096 lớp (không phải nơ-ron!).

Tôi đang cố gắng để hiểu bài báo, nhưng tôi vấp ngã về từ "dư".

Ai đó có thể xin vui lòng cho tôi một lời giải thích / định nghĩa những gì còn lại có nghĩa là trong trường hợp này?

Ví dụ

Chúng tôi định dạng lại một cách rõ ràng các lớp là học các hàm dư với tham chiếu đến các đầu vào của lớp, thay vì học các hàm không được ước tính.

[...]

Thay vì hy vọng mỗi lớp xếp chồng lên nhau phù hợp trực tiếp với ánh xạ cơ bản mong muốn, chúng tôi rõ ràng để các lớp này phù hợp với ánh xạ dư. Chính thức, biểu thị ánh xạ cơ bản mong muốn như $\mathcal{H}(x)$ , chúng tôi để các lớp phi tuyến xếp chồng lên nhau phù hợp với ánh xạ khác của $\mathcal{F}(x) := \mathcal{H}(x)−x$ . Ánh xạ ban đầu được đúc lại thành $\mathcal{F}(x)+x$ . Chúng tôi đưa ra giả thuyết rằng việc tối ưu hóa ánh xạ dư dễ dàng hơn so với tối ưu hóa ánh xạ ban đầu, không được ước tính

machine-learning neural-network

— Martin Thoma
nguồn

Đây có thể là một vấn đề ngôn ngữ. Nếu bạn biết bản dịch tiếng Đức "dư" trong ngữ cảnh này, tôi cũng sẽ rất vui vì điều đó.

— Martin Thoma

nó là $F(x)$ ; sự khác biệt giữa ánh xạ $H(x)$ và đầu vào của nó $x$ . Đây là một thuật ngữ phổ biến trong toán học ( DE ).

— Emre
nguồn

Điều này LAF không đúng. Thuật ngữ Residual, như được tìm thấy trong toán học, không giống như bản đồ còn lại mà bài báo nói về. Theo liên kết bạn đã liệt kê, chúng tôi thấy rằng với f (x) = b, phần dư là chênh lệch bf (x). Ánh xạ dư là theo định nghĩa của chúng, sự khác biệt giữa đầu vào x và đầu ra của hàm H (x).

— spurra