Hai hàm kích hoạt phổ biến được sử dụng trong học sâu là hàm tiếp tuyến hyperbol và hàm kích hoạt sigmoid. Tôi hiểu rằng tiếp tuyến hyperbol chỉ là một sự thay đổi kích thước và dịch của hàm sigmoid:
.
Có sự khác biệt đáng kể giữa hai chức năng kích hoạt này và đặc biệt, khi nào thì cái này thích hợp hơn cái kia ?
Tôi nhận thấy rằng trong một số trường hợp (như khi ước tính xác suất), các đầu ra trong phạm vi sẽ thuận tiện hơn các đầu ra trong phạm vi từ . Tôi muốn biết nếu có sự khác biệt ngoài sự tiện lợi phân biệt hai chức năng kích hoạt.