3
Tạo động lực cho các đơn vị sản lượng sigmoid trong các mạng thần kinh bắt đầu với xác suất log unnormalized tuyến tính trong
Bối cảnh: Tôi đang học chương 6 của Deep Learning của Ian Goodfellow và Yoshua Bengio và Aaron Courville. Trong phần 6.2.2.2 (trang 182 trên 183 có thể xem tại đây ) việc sử dụng sigmoid để xuất được thúc đẩy.P(y=1|x)P(y=1|x)P(y=1|x) Để tóm tắt một số tài liệu họ cho …