Văn học học sâu có đầy đủ các thủ thuật thông minh với việc sử dụng tỷ lệ học tập không liên tục theo độ dốc. Những thứ như phân rã theo cấp số nhân, RMSprop, Adagrad, v.v ... rất dễ thực hiện và có sẵn trong mọi gói học sâu, nhưng dường như chúng không tồn tại bên ngoài mạng lưới thần kinh. Có lý do cho điều này? Nếu mọi người chỉ đơn giản là không quan tâm, có lý do tại sao chúng ta không phải quan tâm bên ngoài mạng lưới thần kinh?