Câu hỏi được gắn thẻ «deep-learning»

một lĩnh vực mới của nghiên cứu Machine Learning liên quan đến các công nghệ được sử dụng để học biểu diễn dữ liệu phân cấp, chủ yếu được thực hiện với các mạng thần kinh sâu (tức là các mạng có hai hoặc nhiều lớp ẩn), nhưng cũng có một số Mô hình đồ họa xác suất.


6
Khi nào nên sử dụng GRU trên LSTM?
Sự khác biệt chính giữa GRU và LSTM là GRU có hai cổng (cổng đặt lại và cập nhật ) trong khi LSTM có ba cổng (cụ thể là cổng đầu vào , đầu ra và cổng quên ). Tại sao chúng ta sử dụng GRU khi chúng ta rõ …





2
Khi nào nên sử dụng (He hoặc Glorot) khởi tạo bình thường trên đồng phục init? Và tác dụng của nó với Batch Normalization là gì?
Tôi biết rằng Mạng dư (ResNet) khiến cho việc khởi tạo bình thường trở nên phổ biến. Trong ResNet, He khởi tạo bình thường được sử dụng , trong khi lớp đầu tiên sử dụng khởi tạo thống nhất He. Tôi đã xem qua giấy ResNet và giấy "Đi sâu …


3
Số lượng tham số trong mô hình LSTM
Một LSTM xếp chồng có bao nhiêu tham số? Số lượng tham số áp đặt giới hạn thấp hơn về số lượng ví dụ đào tạo cần thiết và cũng ảnh hưởng đến thời gian đào tạo. Do đó biết số lượng tham số là hữu ích cho các mô …






6
Giải thích mất entropy chéo
Giả sử tôi xây dựng một NN để phân loại. Lớp cuối cùng là một lớp dày đặc với kích hoạt softmax. Tôi có năm lớp khác nhau để phân loại. Giả sử cho một ví dụ đào tạo duy nhất, đó true labellà [1 0 0 0 0]trong khi …

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.