Tôi tò mò muốn biết nút thiên vị quan trọng như thế nào đối với hiệu quả của các mạng thần kinh hiện đại. Tôi có thể dễ dàng hiểu rằng nó có thể quan trọng trong một mạng nông chỉ với một vài biến đầu vào. Tuy nhiên, các mạng lưới thần kinh hiện đại như trong học sâu thường có một số lượng lớn các biến đầu vào để quyết định xem một nơron nhất định có được kích hoạt hay không. Chỉ đơn giản là loại bỏ chúng khỏi, ví dụ, LeNet5 hoặc ImageNet có bất kỳ tác động thực sự nào không?