Mạng trạng thái Echo là một ví dụ của khái niệm tổng quát hơn về tính toán hồ chứa . Ý tưởng cơ bản đằng sau ESN là nhận được các lợi ích của RNN (xử lý một chuỗi các đầu vào phụ thuộc lẫn nhau, tức là phụ thuộc thời gian như tín hiệu) nhưng không có vấn đề về đào tạo RNN truyền thống như vấn đề độ dốc biến mất .
ESN đạt được điều này bằng cách có một kho chứa các nơ-ron kết nối thưa thớt tương đối lớn bằng cách sử dụng chức năng chuyển sigmoidal (liên quan đến kích thước đầu vào, tương đương 100-1000 đơn vị). Các kết nối trong hồ chứa được chỉ định một lần và hoàn toàn ngẫu nhiên; trọng lượng hồ chứa không được đào tạo. Các nơ-ron đầu vào được kết nối với bể chứa và cung cấp các kích hoạt đầu vào vào bể chứa - chúng cũng được gán các trọng số ngẫu nhiên không được đào tạo. Các trọng số duy nhất được đào tạo là các trọng số đầu ra kết nối hồ chứa với các nơ-ron đầu ra.
Trong đào tạo, các đầu vào sẽ được đưa vào bể chứa và đầu ra của giáo viên sẽ được áp dụng cho các đơn vị đầu ra. Các trạng thái hồ chứa được nắm bắt theo thời gian và được lưu trữ. Khi tất cả các đầu vào đào tạo đã được áp dụng, một ứng dụng đơn giản của hồi quy tuyến tính có thể được sử dụng giữa các trạng thái hồ chứa bị bắt và các đầu ra đích. Các trọng số đầu ra này sau đó có thể được tích hợp vào mạng hiện có và được sử dụng cho các đầu vào mới.
Ý tưởng là các kết nối ngẫu nhiên thưa thớt trong hồ chứa cho phép các trạng thái trước đó "dội lại" ngay cả khi chúng đã đi qua, do đó, nếu mạng nhận được một đầu vào mới giống với thứ mà nó được đào tạo, động lực học trong hồ chứa sẽ bắt đầu theo quỹ đạo kích hoạt phù hợp với đầu vào và theo cách đó có thể cung cấp tín hiệu phù hợp với những gì nó được đào tạo và nếu được đào tạo tốt, nó sẽ có thể khái quát từ những gì nó đã thấy, theo các quỹ đạo kích hoạt sẽ có ý nghĩa đưa ra tín hiệu đầu vào lái xe chứa.
Ưu điểm của phương pháp này là trong quy trình đào tạo cực kỳ đơn giản vì hầu hết các trọng số chỉ được chỉ định một lần và ngẫu nhiên. Tuy nhiên, họ có thể nắm bắt các động lực phức tạp theo thời gian và có thể mô hình hóa các thuộc tính của các hệ thống động lực. Cho đến nay, các tài liệu hữu ích nhất tôi đã tìm thấy trên ESN là:
Cả hai đều có những giải thích dễ hiểu để đi cùng với chủ nghĩa hình thức và lời khuyên nổi bật để tạo ra một triển khai với hướng dẫn chọn các giá trị tham số phù hợp.
UPDATE: Các cuốn sách sâu Learning từ Goodfellow, Bengio, và Courville có một cuộc thảo luận cấp cao một chút chi tiết hơn, nhưng vẫn tốt đẹp của Nhà nước Networks Echo. Mục 10.7 thảo luận về vấn đề độ dốc biến mất (và bùng nổ) và những khó khăn khi học phụ thuộc dài hạn. Mục 10.8 là tất cả về Mạng lưới Nhà nước Echo. Nó đặc biệt đi sâu vào chi tiết về lý do tại sao việc chọn trọng lượng hồ chứa có giá trị bán kính quang phổ phù hợp là rất quan trọng - nó hoạt động cùng với các đơn vị kích hoạt phi tuyến để khuyến khích sự ổn định trong khi vẫn truyền thông tin theo thời gian.