Người ta thường đề cập rằng các đơn vị tuyến tính chỉnh lưu (ReLU) có các đơn vị phần mềm thay thế bởi vì chúng là tuyến tính và nhanh hơn để tính toán.
Liệu softplus nó vẫn có lợi thế gây ra sự thưa thớt hay bị hạn chế trong ReLU?
Lý do tôi hỏi là tôi tự hỏi về hậu quả tiêu cực của độ dốc bằng không của ReLU. Không phải tài sản này "bẫy" các đơn vị ở mức 0, nơi nó có thể mang lại lợi ích cho chúng khả năng kích hoạt lại?