Câu trả lời:
LSTM có một bộ 2 ma trận: U và W cho mỗi cổng (3). (.) Trong sơ đồ biểu thị phép nhân của các ma trận này với đầu vào và đầu ra .
Do đó tổng # tham số =
Tuy nhiên, trong trường hợp LSTM của bạn bao gồm các vectơ sai lệch, ( ví dụ , đây là mặc định trong máy ảnh ), số sẽ trở thành:
Theo đó :
Cấu trúc tế bào LSTM
Phương trình LSTM
Nắm bắt phi tuyến tính
Nếu x_t đầu vào có kích thước n × 1 và có các ô nhớ d , thì kích thước của mỗi W và U ∗ là d × n và d × d resp. Kích thước của W sau đó sẽ là 4d × (n + d) . Lưu ý rằng mỗi một trong số các tế bào bộ nhớ dd có trọng lượng riêng của mình W * và U * , và rằng các giá trị tế bào bộ nhớ chỉ có thời gian được chia sẻ với các đơn vị LSTM khác là trong các sản phẩm với U * .
Cảm ơn Arun Mallya đã trình bày tuyệt vời.