Làm thế nào ít ví dụ đào tạo là quá ít khi đào tạo một mạng lưới thần kinh?


14

Tôi là người mới bắt đầu cố gắng kết hợp dự án đầu tiên của mình. Tôi đã có một dự án phân loại bài hát trong đầu, nhưng vì tôi sẽ được dán nhãn thủ công, tôi chỉ có thể kết hợp hợp lý khoảng 1000 bài hát, hoặc 60 giờ âm nhạc.

Tôi sẽ phân loại với một số lớp, vì vậy có thể một lớp sẽ có ít nhất 50 - 100 bài hát trong tập huấn luyện - điều này dường như quá ít! Có một quy tắc chung cho việc cần bao nhiêu dữ liệu để đào tạo một mạng lưới thần kinh để cho nó hoạt động?

Chỉnh sửa: Tôi đã nghĩ đến việc sử dụng LSTM vanilla. Các tính năng đầu vào sẽ có kích thước 39, kích thước đầu ra 6, lần thử đầu tiên của tôi cho kích thước lớp ẩn sẽ là 100.


2
Điều này thực sự không thể trả lời được vì không phải tất cả các nhiệm vụ đều dễ dàng và các kiến ​​trúc mạng và lựa chọn siêu tham số khác nhau sẽ cải thiện / làm tổn thương các mô hình khác nhau theo những cách khác nhau.
Sycorax nói Phục hồi lại

Tối thiểu, bạn cần xác định cấu trúc mạng của mình và sẽ có bao nhiêu liên kết để đào tạo.
gung - Phục hồi Monica

Câu trả lời:


16

Nó thực sự phụ thuộc vào dữ liệu của bạn và kiến ​​trúc mạng. Một nguyên tắc nhỏ mà tôi đã đọc (2) là vài nghìn mẫu mỗi lớp để mạng lưới thần kinh bắt đầu hoạt động rất tốt.

Trong thực tế, mọi người thử và xem. Không hiếm khi tìm thấy các nghiên cứu cho thấy kết quả tốt với tập huấn luyện nhỏ hơn 1000 mẫu.


Một cách tốt để đánh giá đại khái mức độ có thể có ích khi có nhiều mẫu đào tạo hơn là vẽ biểu đồ hiệu suất của mạng lưới thần kinh dựa trên kích thước của tập huấn luyện, ví dụ từ (1):

nhập mô tả hình ảnh ở đây


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.