Có một quy tắc cũ cho thống kê đa biến khuyến nghị tối thiểu 10 trường hợp cho mỗi biến độc lập. Nhưng đó thường là nơi có một tham số phù hợp với từng biến.
Tại sao tôi hỏi: Tôi đang làm việc thông qua một ví dụ trong sách giáo khoa sử dụng 500 trường hợp Đào tạo (trong số 25000 trong tập dữ liệu) với 15 biến dự đoán và một lớp ẩn với 8 nút ẩn. Vì vậy, chúng tôi ước tính 153 trọng lượng. Trong số 500 trường hợp, có 129 1 và 0 còn lại. do đó, có nhiều trọng số hơn các trường hợp tích cực được dự đoán. Điều này có vẻ sai. Các trang phục mô hình kết quả (nhưng xác nhận không được đề cập trong vấn đề sách giáo khoa này).
Vì vậy, những gì một hướng dẫn đến tối thiểu? 10 lần biến đầu vào? 10 lần tham số để ước tính? Thứ gì khác?
Có những câu trả lời liên quan, nhưng dường như chúng đề cập nhiều hơn đến kích thước mẫu mong muốn hơn mức tối thiểu, ví dụ: Làm thế nào để có được kích thước tập dữ liệu cần thiết cho đào tạo mạng thần kinh?
Trao đổi kích thước lô so với số lần lặp để đào tạo mạng lưới thần kinh
hoặc không được trả lời Kích thước mẫu đào tạo tối thiểu cần thiết cho một bộ phân loại
Nhưng, tất nhiên, tôi có thể đã bỏ lỡ một số câu trả lời tốt trước đó.
number of parameters squared
các mẫu