Tôi đã đọc một vài giấy tờ về khởi tạo hạt nhân và nhiều giấy tờ kể rằng họ sử dụng L2 quy tắc của hạt nhân (thường với ).
Có ai làm điều gì khác hơn là khởi tạo sai lệch với số không liên tục và không thường xuyên hóa nó không?
Giấy tờ khởi tạo hạt nhân
- Mishkin và Matas: Tất cả những gì bạn cần là một khởi đầu tốt
- Xavier Glorot và Yoshua Bengio: Hiểu được sự khó khăn của việc đào tạo mạng lưới thần kinh sâu rộng
- Ông và cộng sự: Đi sâu vào các bộ chỉnh lưu: Vượt qua hiệu suất ở cấp độ con người trong phân loại ImageNet