Tôi đang mở rộng kiến thức về gói Keras và tôi đã sử dụng một số mô hình có sẵn. Tôi có một vấn đề phân loại nhị phân NLP mà tôi đang cố gắng giải quyết và đang áp dụng các mô hình khác nhau.
Sau khi làm việc với một số kết quả và đọc nhiều hơn về LSTM, có vẻ như phương pháp này vượt trội hơn nhiều so với bất kỳ điều gì khác mà tôi đã thử (trên nhiều bộ dữ liệu). Tôi tiếp tục suy nghĩ, "tại sao / khi nào bạn sẽ không sử dụng LSTM?". Việc sử dụng các cổng bổ sung, vốn có của LSTM, có ý nghĩa hoàn hảo với tôi sau khi có một số mô hình bị biến mất độ dốc.
Vì vậy, những gì bắt với LSTM? Họ làm không tốt ở đâu? Tôi biết không có thuật toán "một kích thước phù hợp với tất cả", do đó phải có nhược điểm đối với LSTM.