Những lợi ích chính có mục đích:
(1) Không cần thiết phải sử dụng các tính năng kỹ sư cho các vấn đề học phi tuyến tính (tiết kiệm thời gian và khả năng mở rộng cho tương lai, vì kỹ thuật tay được một số người coi là hỗ trợ ban nhạc ngắn hạn)
(2) Các tính năng đã học đôi khi tốt hơn các tính năng được chế tạo bằng tay tốt nhất và có thể phức tạp (tầm nhìn máy tính - ví dụ như các tính năng giống như khuôn mặt) đến nỗi nó sẽ chiếm quá nhiều thời gian của con người đối với kỹ sư.
(3) Có thể sử dụng dữ liệu chưa được gắn nhãn để đào tạo trước mạng. Giả sử chúng ta có 1000000 hình ảnh không nhãn và 1000 hình ảnh được dán nhãn. Bây giờ chúng ta có thể cải thiện mạnh mẽ một thuật toán học có giám sát bằng cách đào tạo trước trên 1000000 hình ảnh không nhãn với học sâu. Ngoài ra, trong một số miền, chúng tôi có rất nhiều dữ liệu chưa được gắn nhãn nhưng dữ liệu được gắn nhãn rất khó tìm. Một thuật toán có thể sử dụng dữ liệu chưa được gắn nhãn này để cải thiện phân loại là có giá trị.
(4) Theo kinh nghiệm, phá vỡ nhiều điểm chuẩn chỉ thấy được sự cải thiện gia tăng cho đến khi đưa ra các phương pháp học sâu.
(5) Thuật toán tương tự hoạt động trong nhiều lĩnh vực với đầu vào thô (có thể với tiền xử lý nhỏ).
(6) Tiếp tục cải thiện khi nhiều dữ liệu được cung cấp cho mạng (giả sử các bản phân phối cố định, v.v.).