Đầu ra Softmax tạo ra một vectơ không âm và tổng bằng 1. Thật hữu ích khi bạn có các danh mục loại trừ lẫn nhau ("những hình ảnh này chỉ chứa mèo hoặc chó, không phải cả hai"). Bạn có thể sử dụng softmax nếu bạn có nhãn loại trừ lẫn nhau .2,3,4,5,...
Sử dụng đầu ra sigmoid tạo ra một vectơ trong đó mỗi phần tử là một xác suất. Điều này hữu ích khi bạn có các danh mục không loại trừ lẫn nhau ("những hình ảnh này có thể chứa mèo, chó hoặc cả mèo và chó với nhau"). Bạn sử dụng nhiều nơ-ron sigmoid như bạn có các loại và nhãn của bạn không nên loại trừ lẫn nhau.2,3,4,...
Một mẹo dễ thương là bạn cũng có thể sử dụng một đơn vị sigmoid nếu bạn gặp vấn đề nhị phân loại trừ lẫn nhau; bởi vì một đơn vị sigmoid có thể được sử dụng để ước tính , các tiên đề Kolmogorov ngụ ý rằng .p(y=1)1−p(y=1)=p(y=0)
Sử dụng chức năng nhận dạng làm đầu ra có thể hữu ích khi đầu ra của bạn không bị ràng buộc. Lợi nhuận hoặc thua lỗ của một số công ty trong một quý có thể không bị ràng buộc ở hai bên.
Các đơn vị ReLU hoặc các biến thể tương tự có thể hữu ích khi đầu ra được giới hạn ở trên hoặc bên dưới. Nếu đầu ra chỉ bị hạn chế là không âm, thì sẽ tốt hơn nếu sử dụng kích hoạt ReLU làm chức năng đầu ra.
Tương tự như vậy, nếu đầu ra bằng cách nào đó bị hạn chế nằm trong , tanh có thể có ý nghĩa.[−1,1]
Điều thú vị về mạng lưới thần kinh là chúng là những công cụ cực kỳ linh hoạt.