Tôi tự hỏi, nếu có bất kỳ heuristic về số lượng các tính năng so với số lượng quan sát. Rõ ràng, nếu một số tính năng bằng với số lượng quan sát, mô hình sẽ phù hợp hơn. Bằng cách sử dụng các phương pháp thưa thớt (LASSO, lưới đàn hồi), chúng tôi có thể loại bỏ một số tính năng để giảm mô hình.
Câu hỏi của tôi là (về mặt lý thuyết): trước khi chúng tôi sử dụng các số liệu để đánh giá lựa chọn mô hình, có bất kỳ quan sát thực nghiệm nào liên quan đến số lượng tính năng tối ưu với số lượng quan sát không?
Ví dụ: đối với một vấn đề phân loại nhị phân với 20 trường hợp trong mỗi lớp, có giới hạn trên nào về số lượng tính năng sẽ sử dụng không?