Từ khóa ở đây là Chia sẻ thông số hoặc Chia sẻ trọng lượng trên các phần hình ảnh khác nhau.
Nếu chúng ta lấy một ví dụ đơn giản về hình ảnh nhị phân thang độ xám của bảng chữ cái 'F', thì đó là sự kết hợp của nhiều mẫu. Các mẫu ở đây là các đường thẳng đứng và đường ngang. Những mô hình này dựa trên mối quan hệ giữa cường độ của các tế bào tiếp giáp. Mối quan hệ này giữa các ô liền kề được thiết lập bằng ma trận trọng số.
Ngoài ra, để xác định nhiều đường ngang, chúng ta không cần nhiều tập hợp nút trong lớp dày đặc ẩn cố gắng xác định các đường ngang khác nhau trong ảnh. Các mô hình là như nhau nhưng hiện diện ở các địa điểm khác nhau. Do đó việc chia sẻ trọng lượng đi vào hình ảnh.
Trong lớp ẩn thứ 1, mã hóa đường ngang mẫu trong ma trận trọng số (được học trong quá trình đào tạo và được sử dụng trong thử nghiệm). Đặt nó trên lưới nhỏ và kiểm tra sự hiện diện. Khi ma trận này được trượt và thử nghiệm trên hình ảnh, sự hiện diện của các đường ngang được đánh dấu ở các vị trí khác nhau. Ma trận trọng lượng này được gọi là một hạt nhân.
Kết hợp các điểm trên, kernel cung cấp cách xử lý chia sẻ tham số / trọng số giữa các ô liền kề để xác định các mẫu. Lớp dày đặc thay vì hạt nhân cuối cùng sẽ giải quyết nó nhưng bắt đầu một cách ngẫu nhiên. Vì một cách hiệu quả đã được xác định, nó đang được sử dụng.
Tiếp theo để xác định các đường thẳng đứng, một hạt nhân khác cần thiết và trượt qua.
Giả sử tiếp theo chúng ta có lớp dày đặc là lớp ẩn thứ 2. Lớp này tìm kiếm sự kết hợp của các mẫu ('p' đường ngang và 'q' đường thẳng đứng trong trường hợp này cho 'F') và tìm hiểu các kết hợp để xác định đầu ra.
Chỉ cần so sánh với lập trình truyền thống, hạt nhân giống như các biểu thức thông thường. các lớp dày đặc giống như các vòng lặp. Chỉ chia sẻ suy nghĩ của tôi. Bất kỳ lời giải thích tốt hơn đều được chào đón.