Câu hỏi được gắn thẻ «batch-normalization»

2
Làm thế nào và tại sao Batch Chuẩn hóa sử dụng các đường trung bình di động để theo dõi độ chính xác của mô hình khi nó đào tạo?
Tôi đã đọc giấy bình thường hóa hàng loạt (BN) (1) và không hiểu nhu cầu sử dụng đường trung bình di động để theo dõi độ chính xác của mô hình và ngay cả khi tôi chấp nhận rằng đó là điều đúng đắn, tôi không hiểu những gì …



2
Có cách nào để đối phó với độ dốc biến mất để bão hòa các phi tuyến tính không liên quan đến các đơn vị Batch bình thường hóa hoặc ReLu không?
Tôi muốn đào tạo một mạng lưới với các phi tuyến tính bị sự biến mất (hoặc bùng nổ vấn đề độ dốc mặc dù chủ yếu là biến mất). Tôi biết rằng cách tiêu chuẩn (hiện tại) là sử dụng chuẩn hóa hàng loạt 1 [BN] 1 hoặc đơn …

2
Làm thế nào để bình thường hóa hàng loạt tính toán số liệu thống kê dân số sau khi đào tạo?
Tôi đã đọc bài viết chuẩn hóa hàng loạt (BN) (1) và nó nói: Đối với điều này, khi mạng đã được đào tạo, chúng tôi sử dụng chuẩn hóa bằng cách sử dụng dân số , thay vì mini -batch, thống kê.x^=x−E[x]Var[x]+ϵ−−−−−−−−√x^=x−E[x]Var[x]+ϵ\hat{x} = \frac{x - E[x]}{ \sqrt{Var[x] + \epsilon}} …
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.