Giả sử tôi đang cho ma trận 2D có hình dạng (99,13) làm đầu vào cho lớp LSTM. Tôi đang có n số tệp, trong đó mỗi tệp chứa (99,13) vectơ kích thước. Tôi đã quyết định coi 13 là số lượng tính năng và 99 là dấu thời gian.
(Trong khi thực hiện với Keras, tôi đã thêm lớp LSTM làm lớp đầu tiên. Và tôi đã đặt output_dim của lớp là 100)
Nhưng tôi không thể tìm ra cách mọi thứ thực sự trong mạng khi chúng tôi cung cấp đầu vào như trên. Tôi có những câu hỏi sau đây, mà tôi không thể tự trả lời.
- Có gì loại giá trị này chúng tôi cung cấp như là đầu vào cho các tế bào LSTM? ( xt , ht-1 được sử dụng làm đầu vào cho ô luôn là vectơ? Trong trường hợp của tôi, xt có hình dạng [1,13] không?)
- Khi chúng ta nói rằng chúng ta có một lớp LSTM là lớp đầu tiên của chế độ l, nó có cung cấp vectơ đầu vào đầu tiên cho tất cả các ô trong lớp đã cho không? (Ví dụ: cung cấp khung hình đầu tiên có kích thước 13 (trong số 99 khung hình) cho tất cả n ô LSTM trong lớp đầu tiên?)
- Có gì loại một giá trị hiện một lượng tế bào LSTM tại mỗi bước thời gian ? (Chúng ta có coi trạng thái ô là đầu ra chính xác từ nút không? Nó là một giá trị đơn hay một vectơ? Nếu đó là một vectơ thì kích thước là gì? Có cách nào chúng ta có thể đoán kích thước không? Tôi đã giả sử ht là một vectơ)
- Điều gì có nghĩa là output_dim (kích thước đầu ra) của một lớp nhất định? Có phải luôn luôn là số lượng nút trong lớp tiếp theo?
Vui lòng không thực hiện việc này hoặc giữ trực tiếp cho bất kỳ nhóm nào khác. Tôi nghĩ những câu hỏi này có liên quan đến học máy và rnn. Tôi đã đọc các tài liệu nghiên cứu, nhưng tôi chưa thể có một ý tưởng rõ ràng về cách mọi thứ thực sự hoạt động trong mạng LSTM.