Tôi đã đọc được rằng hầu hết các vấn đề có thể được giải quyết với 1-2 lớp ẩn. Làm thế nào để bạn biết bạn cần nhiều hơn 2? Đối với loại vấn đề bạn sẽ cần chúng (cho tôi một ví dụ)?
Hai hàm kích hoạt phổ biến được sử dụng trong học sâu là hàm tiếp tuyến hyperbol và hàm kích hoạt sigmoid. Tôi hiểu rằng tiếp tuyến hyperbol chỉ là một sự thay đổi kích thước và dịch của hàm sigmoid: tanh(z)=2σ(z)−1tanh(z)=2σ(z)−1\tanh(z) = 2\sigma(z) - 1 . Có sự khác …