Tôi đã nghiên cứu kiến trúc của mạng lưới thần kinh siamese được giới thiệu bởi Yann LeCun và các đồng nghiệp của ông vào năm 1994 để nhận biết chữ ký ( xác minh chữ ký sử dụng mạng thần kinh trì hoãn thời gian siamese .pdf , NIPS 1994)
Tôi đã hiểu ý tưởng chung của kiến trúc này, nhưng tôi thực sự không thể hiểu làm thế nào backpropagation hoạt động trong trường hợp này. Tôi không thể hiểu các giá trị đích của mạng nơ-ron là gì, điều đó sẽ cho phép truyền ngược để đặt đúng trọng lượng của mỗi nơ-ron.
Trong kiến trúc này, thuật toán tính toán độ tương tự cosin giữa các biểu diễn cuối cùng của hai mạng thần kinh Giấy viết: "Đầu ra mong muốn là một góc nhỏ giữa các đầu ra của hai mạng con (F1 và f2) khi xuất hiện chữ ký chính hãng và một góc lớn nếu một trong những chữ ký là giả mạo ".
Tôi thực sự không thể hiểu làm thế nào họ có thể sử dụng hàm nhị phân (độ tương tự cosine giữa hai vectơ) làm mục tiêu để chạy backpropagation.
Làm thế nào là backpropagation được tính toán trong các mạng lưới thần kinh siamese?