Nói chung, không có hướng dẫn về cách xác định số lượng lớp hoặc số lượng ô nhớ trong LSTM.
Số lượng lớp và ô cần thiết trong một LSTM có thể phụ thuộc vào một số khía cạnh của vấn đề:
Sự phức tạp của bộ dữ liệu. Số lượng tính năng, số lượng điểm dữ liệu, vv
Quá trình tạo dữ liệu. Ví dụ sau về cách quá trình tạo dữ liệu có thể đóng một phần quan trọng.
Ex - Dự đoán giá dầu so với dự đoán GDP của một nền kinh tế được hiểu rõ. Cái sau dễ hơn cái trước. Do đó, dự đoán giá dầu cũng có thể cần số lượng tế bào bộ nhớ LSTM nhiều hơn để dự đoán với độ chính xác tương đương so với GDP.
- Độ chính xác cần thiết cho trường hợp sử dụng. Số lượng ô nhớ sẽ phụ thuộc nhiều vào điều này. Nếu mục tiêu là đánh bại các công nghệ tiên tiến - người ta cần nhiều tế bào LSTM nói chung. So sánh điều đó với mục tiêu đưa ra các dự đoán hợp lý - sẽ cần số lượng tế bào LSTM ít hơn.
Tôi làm theo các bước sau khi lập mô hình bằng LSTM:
Hãy thử một lớp ẩn duy nhất với 2 hoặc 3 ô nhớ. Xem cách nó thực hiện so với điểm chuẩn. Nếu đó là một vấn đề về chuỗi thời gian thì tôi thường đưa ra dự báo từ các kỹ thuật chuỗi thời gian cổ điển làm điểm chuẩn.
Hãy thử và tăng số lượng ô nhớ. Nếu hiệu suất không tăng nhiều thì chuyển sang bước tiếp theo.
Bắt đầu làm cho mạng sâu, tức là thêm một lớp khác với một số lượng nhỏ các ô nhớ.
Qua một bên :
Không có giới hạn về số lượng lao động có thể được dành để đạt đến mức tối thiểu toàn cầu của hàm mất mát và điều chỉnh các tham số siêu tốt nhất. Vì vậy, tập trung vào mục tiêu cuối cùng cho mô hình hóa nên là chiến lược thay vì cố gắng tăng độ chính xác càng nhiều càng tốt.
Hầu hết các vấn đề có thể được xử lý bằng cách sử dụng 2-3 lớp của mạng.