Tôi đang thực hiện các thử nghiệm trên bộ xác thực EMNIST bằng cách sử dụng các mạng với RMSProp, Adam và SGD. Tôi đang đạt được độ chính xác 87% với SGD (tỷ lệ học là 0,1) và bỏ học (thăm dò bỏ học 0,1) cũng như chính quy hóa L2 (phạt 1e-05). Khi kiểm tra cấu hình chính xác tương tự với RMSProp và Adam cũng như tỷ lệ học tập ban đầu là 0,001, tôi đạt được độ chính xác 85% và đường cong đào tạo kém mượt mà hơn đáng kể. Tôi không biết làm thế nào để giải thích hành vi này. Điều gì có thể là lý do đằng sau sự thiếu trơn tru trong đường cong đào tạo và độ chính xác thấp hơn và tỷ lệ lỗi cao hơn đạt được?