Tôi đã thấy rằng Imagenet và CNN lớn khác sử dụng các lớp chuẩn hóa phản ứng cục bộ. Tuy nhiên, tôi không thể tìm thấy nhiều thông tin về họ. Chúng quan trọng như thế nào và khi nào chúng nên được sử dụng?
Từ http : // caffe.berICHvision.org/tutorial/layers.html#data-layers :
"Lớp chuẩn hóa phản hồi cục bộ thực hiện một loại ức chế bên cạnh bằng cách chuẩn hóa trên các vùng đầu vào cục bộ. Trong chế độ ACROSS_CHANNELS, các vùng cục bộ mở rộng qua các kênh lân cận, nhưng không có phạm vi không gian (nghĩa là chúng có hình dạng local_size x 1 x 1) Trong chế độ FORIN_CHANNEL, các vùng cục bộ mở rộng theo không gian, nhưng ở các kênh riêng biệt (nghĩa là chúng có hình dạng 1 x local_size x local_size). Mỗi giá trị đầu vào được chia cho (1+ (α / n) ∑ix2i), trong đó n là kích thước của từng khu vực địa phương và tổng được lấy trên khu vực tập trung ở giá trị đó (phần đệm bằng 0 được thêm vào khi cần thiết). "
Biên tập:
Dường như các loại lớp này có tác động tối thiểu và không được sử dụng nữa. Về cơ bản, vai trò của họ đã bị vượt qua bởi các kỹ thuật chính quy hóa khác (như bỏ học và chuẩn hóa hàng loạt), khởi tạo và phương pháp đào tạo tốt hơn. Xem câu trả lời của tôi dưới đây để biết thêm chi tiết.