Lý do gradient trực tuyến là hữu ích cho các ứng dụng quy mô lớn. Trong mọi trường hợp, bây giờ có các thư viện triển khai nó, do đó bạn không cần phải lập trình nó. Đó là một cách tốt để tìm hiểu làm thế nào mọi thứ hoạt động.
Học máy quy mô lớn lần đầu tiên được tiếp cận như một vấn đề kỹ thuật. Ví dụ, để tận dụng tập huấn luyện lớn hơn, chúng ta có thể sử dụng máy tính song song để chạy thuật toán học máy đã biết hoặc điều chỉnh các phương pháp số nâng cao hơn để tối ưu hóa chức năng mục tiêu học máy đã biết. Cách tiếp cận như vậy dựa trên giả định hấp dẫn rằng người ta có thể tách rời các khía cạnh thống kê khỏi các khía cạnh tính toán của vấn đề máy học.
Công trình này cho thấy giả định này là không chính xác, và việc từ bỏ nó dẫn đến các thuật toán học tập hiệu quả hơn đáng kể. Một khung lý thuyết mới có tính đến hiệu quả của tối ưu hóa gần đúng đối với các thuật toán học tập.
Phân tích cho thấy sự đánh đổi khác biệt cho trường hợp các vấn đề học tập quy mô nhỏ và quy mô lớn. Các vấn đề học tập quy mô nhỏ phải tuân theo sự đánh đổi ước tính xấp xỉ thông thường. Các vấn đề học tập quy mô lớn phải chịu sự đánh đổi khác nhau về chất lượng liên quan đến độ phức tạp tính toán của các thuật toán tối ưu hóa cơ bản theo những cách không tầm thường. Ví dụ, thuật toán Stochastic Gradient Descent (SGD) dường như là thuật toán tối ưu hóa tầm thường và được chứng minh là hoạt động rất tốt trong các vấn đề học tập quy mô lớn.