Một người ngoài đối với trường ML / DL; bắt đầu khóa học Deepacity của Udacity dựa trên Tensorflow; làm bài tập 3 bài 4; cố gắng điều chỉnh tốc độ học tập với cấu hình sau:
- Kích thước hàng loạt 128
- Số bước: đủ để lấp đầy 2 epoch
- Kích thước của các lớp ẩn: 1024, 305, 75
- Trọng lượng khởi tạo: cắt ngắn bình thường với tiêu chuẩn. độ lệch của sqrt (2 / n) trong đó n là kích thước của lớp trước
- Bỏ học xác suất: 0,75
- Chính quy: không áp dụng
- Thuật toán tỷ lệ học tập: phân rã theo cấp số nhân
chơi xung quanh với các thông số tỷ lệ học tập; chúng dường như không có hiệu lực trong hầu hết các trường hợp; mã ở đây ; các kết quả:
Accuracy learning_rate decay_steps decay_rate staircase
93.7 .1 3000 .96 True
94.0 .3 3000 .86 False
94.0 .3 3000 .96 False
94.0 .3 3000 .96 True
94.0 .5 3000 .96 True
- Làm thế nào tôi nên điều chỉnh tỷ lệ học tập một cách có hệ thống?
- Làm thế nào là tỷ lệ học tập liên quan đến số lượng các bước?