Dường như có những lời khuyên mâu thuẫn ngoài kia về cách xử lý so sánh lỗi tàu và kiểm tra, đặc biệt khi có khoảng cách giữa hai người. Dường như có hai trường phái cho tôi, dường như mâu thuẫn. Tôi đang tìm cách hiểu cách hòa giải hai người (hoặc hiểu những gì tôi đang thiếu ở đây).
Suy nghĩ số 1: Chỉ riêng khoảng cách giữa hiệu suất của bộ thử nghiệm và bộ thử nghiệm không biểu thị quá mức
Đầu tiên, (cũng được thảo luận ở đây: Làm thế nào có thể đào tạo và kiểm tra các so sánh lỗi có thể là dấu hiệu của việc quá mức? ), Ý tưởng rằng một sự khác biệt giữa tập huấn và kiểm tra một mình có thể chỉ ra quá mức. Điều này đồng ý với kinh nghiệm thực tế của tôi, ví dụ, với các phương thức cây, trong đó ngay cả sau khi điều chỉnh siêu tham số dựa trên xác thực chéo, khoảng cách giữa lỗi tàu và lỗi kiểm tra có thể vẫn còn lớn. Nhưng (không phân biệt loại mô hình) miễn là lỗi xác thực của bạn không xảy ra, bạn vẫn ổn. Ít nhất, đó là suy nghĩ.
Suy nghĩ # 2: Khi bạn thấy một khoảng cách giữa hiệu suất tàu và kiểm tra: Làm những việc sẽ chống lại việc quá mức
Tuy nhiên, sau đó có lời khuyên mà bạn thấy, từ các nguồn rất tốt cho thấy rằng khoảng cách giữa lỗi tàu và kiểm tra là dấu hiệu của việc quá mức. Dưới đây là một ví dụ: Cuộc nói chuyện "Nuts and Bolts of Deep Learning" của Andrew Ng (một cuộc nói chuyện tuyệt vời) https://www.youtube.com/watch?v=F1ka6a13S9I trong đó vào khoảng thời gian 48:00 anh ấy vẽ một biểu đồ dòng chảy có nghĩa là "nếu lỗi tập tàu của bạn thấp và lỗi tập tàu của bạn cao, bạn nên thêm chính quy, lấy thêm dữ liệu hoặc thay đổi kiến trúc mô hình" ... đó là tất cả các hành động bạn có thể thực hiện để chống lại tình trạng quá mức.
Điều này đưa tôi đến ... : Tôi có thiếu điều gì ở đây không? Đây có phải là một quy tắc cụ thể của mô hình (nói chung các mô hình đơn giản hơn dường như có ít khoảng cách hơn giữa tàu và kiểm tra)? Hay chỉ đơn giản là có hai trường phái tư tưởng khác nhau?