Có rất nhiều kỹ thuật chính quy, không thực tế để thử tất cả các kết hợp:
- l1 / l2
- định mức tối đa
- rơi ra ngoài
- dừng sớm
- ...
Có vẻ như hầu hết mọi người đều hài lòng với sự kết hợp của bỏ học + dừng sớm: có trường hợp sử dụng các kỹ thuật khác có ý nghĩa không?
Ví dụ, nếu bạn muốn một mô hình thưa thớt, bạn có thể thêm vào một chút chính quy hóa l1. Ngoài ra, có những lập luận mạnh mẽ ủng hộ việc rắc vào các kỹ thuật chính quy hóa khác không?
Tôi biết về định lý không ăn trưa miễn phí, theo lý thuyết tôi sẽ phải thử tất cả các kết hợp các kỹ thuật chính quy, nhưng không đáng để thử nếu nó gần như không bao giờ mang lại hiệu suất tăng đáng kể.