Tại sao các mạng thần kinh ban đầu có trọng số ban đầu là số ngẫu nhiên? Tôi đã đọc ở đâu đó rằng điều này được thực hiện để "phá vỡ tính đối xứng" và điều này làm cho mạng lưới thần kinh học nhanh hơn. Làm thế nào để phá vỡ tính đối xứng làm cho nó học nhanh hơn?
Sẽ không khởi tạo các trọng số về 0 là một ý tưởng tốt hơn? Bằng cách đó, các trọng số sẽ có thể tìm thấy các giá trị của chúng (dù là tích cực hay tiêu cực) nhanh hơn?
Có một số triết lý cơ bản khác đằng sau việc ngẫu nhiên hóa các trọng số ngoài việc hy vọng rằng chúng sẽ ở gần các giá trị tối ưu của chúng khi được khởi tạo?