Giả sử tôi muốn thực hiện phân loại nhị phân (một cái gì đó thuộc về lớp A hoặc lớp B). Có một số khả năng để làm điều này trong lớp đầu ra của mạng thần kinh:
Sử dụng 1 nút đầu ra. Đầu ra 0 (<0,5) được coi là lớp A và 1 (> = 0,5) được coi là lớp B (trong trường hợp sigmoid)
Sử dụng 2 nút đầu ra. Đầu vào thuộc về lớp của nút có giá trị / xác suất cao nhất (argmax).
Có bất kỳ giấy tờ nào được viết (cũng) thảo luận về điều này? Từ khóa cụ thể để tìm kiếm là gì?
Câu hỏi này đã được hỏi trước đây trên trang web này, ví dụ: xem liên kết này không có câu trả lời thực sự. Tôi cần phải đưa ra lựa chọn (Luận văn thạc sĩ), vì vậy tôi muốn hiểu rõ hơn về những hạn chế / nhược điểm của từng giải pháp.