Ngăn chặn quá mức LSTM trên tập dữ liệu nhỏ


13

Tôi đang lập mô hình 15000 tweet để dự đoán tình cảm bằng cách sử dụng LSTM một lớp với 128 đơn vị ẩn bằng cách sử dụng biểu diễn giống như word2vec với 80 thứ nguyên. Tôi nhận được độ chính xác gốc (38% với ngẫu nhiên = 20%) sau 1 epoch. Đào tạo nhiều hơn làm cho độ chính xác xác nhận bắt đầu giảm khi độ chính xác đào tạo bắt đầu tăng lên - một dấu hiệu rõ ràng của việc quá mức.

Do đó, tôi đang nghĩ cách để thực hiện chính quy. Tôi không muốn giảm số lượng các đơn vị ẩn (128 có vẻ hơi thấp). Tôi hiện đang sử dụng bỏ học với xác suất 50%, nhưng điều này có lẽ có thể tăng lên. Trình tối ưu hóa là Adam với các tham số mặc định cho Keras ( http://keras.io/optimulators/#adam ).

Một số cách hiệu quả để giảm quá mức cho mô hình này trên tập dữ liệu của tôi là gì?


Tôi đang có cùng một vấn đề. Làm thế nào cuối cùng bạn đã quản lý để thường xuyên LSTM của bạn? Độ chính xác xác nhận LSTM của tôi là 41%. Hình dạng đầu vào của tôi là (200,) và tôi có 1 lớp LSTM với 64 đơn vị, tiếp theo là 2 lớp Mật độ với 0,4 lần bỏ.
Nirvan Anjirbag

Câu trả lời:


7

Bạn có thể thử:

  • Giảm số lượng các đơn vị ẩn, tôi biết bạn đã nói rằng nó có vẻ thấp, nhưng với điều kiện là lớp đầu vào chỉ có 80 tính năng, thực sự có thể là 128 là quá nhiều. Một nguyên tắc nhỏ là có số lượng đơn vị ẩn nằm giữa số lượng đơn vị đầu vào (80) và các lớp đầu ra (5);
  • Ngoài ra, bạn có thể tăng kích thước của không gian đại diện đầu vào lên hơn 80 (tuy nhiên điều này cũng có thể phù hợp nếu biểu diễn quá hẹp đối với bất kỳ từ nào).

Một cách tốt để phù hợp với một mạng là bắt đầu với một mạng quá mức và sau đó giảm dung lượng (các đơn vị ẩn và không gian nhúng) cho đến khi nó không còn mặc quần áo nữa.


1
Bạn đã thử chuẩn hóa l1 và l2 chưa? Nó thực sự hoạt động? Câu trả lời này gợi ý rằng bạn không nên làm điều này nói chung
Jakub Bartczuk

Tôi không biết về tài sản này của RNNs, tôi sẽ xóa điểm đó của câu trả lời
Miguel

Xin chào, tôi đã tự hỏi làm thế nào bạn có quy tắc ngón tay cái nói rằng "có số lượng đơn vị ẩn nằm giữa số lượng đơn vị đầu vào và các lớp đầu ra". Có một bài báo mà tôi có thể tham khảo?
Kong

Đó là điều về quy tắc của ngón tay cái, tôi không biết tôi đã lấy nó từ đâu ...
Miguel
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.