Tôi đã đọc bài viết chuẩn hóa hàng loạt (BN) (1) và nó nói:
Đối với điều này, khi mạng đã được đào tạo, chúng tôi sử dụng chuẩn hóa bằng cách sử dụng dân số , thay vì mini -batch, thống kê.
Câu hỏi của tôi là, làm thế nào để tính toán số liệu thống kê dân số này và qua tập huấn luyện nào (kiểm tra, xác nhận, đào tạo)? Tôi nghĩ rằng tôi biết điều đó có nghĩa là gì nhưng sau một thời gian, tôi nhận ra rằng tôi không chắc nó tính toán như thế nào. Tôi cho rằng nó sẽ cố gắng để ước tính đúng nghĩa và phương sai mặc dù tôi không chắc chắn làm thế nào nó làm thế. Những gì tôi có thể làm là tính giá trị trung bình và phương sai theo toàn bộ tập dữ liệu và sử dụng những khoảnh khắc đó để suy luận.
Tuy nhiên, điều khiến tôi nghi ngờ rằng tôi sai là cuộc thảo luận của họ về ước tính phương sai không thiên vị sau đó trong cùng phần đó:
Chúng tôi sử dụng ước tính phương sai không thiên vị khi quá trình đào tạo kết thúc các lô nhỏ có kích thước và là phương sai mẫu của chúng.
Vì chúng ta đang nói về thống kê dân số, nhận xét này trên tờ báo có cảm giác như nó không xuất hiện (đối với tôi) và không chắc họ đang nói về cái gì. Có phải họ chỉ (ngẫu nhiên) làm rõ họ sử dụng các ước tính không thiên vị trong quá trình đào tạo hay họ đang sử dụng một ước tính không thiên vị để tính toán thống kê dân số?
1 : Ioffe S. và Szegedy C. (2015),
"Bình thường hóa hàng loạt: Tăng tốc đào tạo mạng lưới sâu bằng cách giảm sự thay đổi đồng biến nội bộ",
Kỷ yếu của Hội nghị quốc tế về học máy lần thứ 32 , Lille, Pháp, 2015.
Tạp chí Nghiên cứu về máy học: Khối lượng W & CP 37