Tôi là người mới bắt đầu cố gắng kết hợp dự án đầu tiên của mình. Tôi đã có một dự án phân loại bài hát trong đầu, nhưng vì tôi sẽ được dán nhãn thủ công, tôi chỉ có thể kết hợp hợp lý khoảng 1000 bài hát, hoặc 60 giờ âm nhạc.
Tôi sẽ phân loại với một số lớp, vì vậy có thể một lớp sẽ có ít nhất 50 - 100 bài hát trong tập huấn luyện - điều này dường như quá ít! Có một quy tắc chung cho việc cần bao nhiêu dữ liệu để đào tạo một mạng lưới thần kinh để cho nó hoạt động?
Chỉnh sửa: Tôi đã nghĩ đến việc sử dụng LSTM vanilla. Các tính năng đầu vào sẽ có kích thước 39, kích thước đầu ra 6, lần thử đầu tiên của tôi cho kích thước lớp ẩn sẽ là 100.