Tôi đã đọc bài báo mới của Hinton, "Định tuyến động giữa các viên nang" và không hiểu thuật ngữ "vectơ hoạt động" trong bản tóm tắt.
Một viên nang là một nhóm các nơ-ron có vectơ hoạt động đại diện cho các tham số khởi tạo của một loại thực thể cụ thể như một đối tượng hoặc một phần đối tượng. Chúng tôi sử dụng độ dài của vectơ hoạt động để biểu thị xác suất mà thực thể tồn tại và hướng của nó để biểu diễn các tham số khởi tạo. Các viên nang hoạt động ở một cấp đưa ra dự đoán, thông qua ma trận biến đổi, cho các tham số khởi tạo của các viên nang cấp cao hơn. Khi nhiều dự đoán đồng ý, một viên nang cấp cao hơn sẽ hoạt động. Chúng tôi cho thấy rằng một hệ thống viên nang nhiều lớp được đào tạo phân biệt đối xử đạt được hiệu suất hiện đại trên MNIST và tốt hơn đáng kể so với mạng tích chập trong việc nhận ra các chữ số chồng chéo cao. Để đạt được những kết quả này, chúng tôi sử dụng cơ chế định tuyến theo thỏa thuận lặp:
https://arxiv.org/pdf/1710.09829.pdf
Tôi nghĩ rằng một vectơ giống như một mảng dữ liệu mà bạn đang chạy qua mạng.
Tôi bắt đầu làm việc thông qua khóa học sâu của Andrew Ng nhưng tất cả đều mới và các điều khoản vượt qua đầu tôi.