Chúng ta hãy xem xét vấn đề về việc phân loại bộ dữ liệu MNIST.
Theo trang web MNIST của Yann LeCun , 'Ciresan et al.' nhận được 0,23% tỷ lệ lỗi trên bộ kiểm tra MNIST bằng cách sử dụng Mạng thần kinh chuyển đổi.
Chúng ta hãy biểu thị tập huấn luyện MNIST là , bài kiểm tra MNIST được đặt là D t e s t , giả thuyết cuối cùng họ nhận được khi sử dụng D t r a i n là h 1 và tỷ lệ lỗi của họ trên tập kiểm tra MNIST sử dụng h 1 như E t e s t ( h 1 ) = 0,0023 .
Theo quan điểm của họ, vì được lấy mẫu ngẫu nhiên được đặt từ không gian đầu vào bất kể h 1 , họ có thể khẳng định rằng hiệu suất lỗi ngoài mẫu của giả thuyết cuối cùng của họ E o u t ( h 1 ) được giới hạn như sau từ bất đẳng thức Hoeffding P [ | E o u t ( h 1 ) - E t e s t ( h 1 ) | < ϵ | ] nơi N t e s t = | D t e s t | .
Nói cách khác, ít nhất là xác xuất , E o u t ( h 1 ) ≤ E t e s t ( h 1 ) + √
Hãy xem xét một quan điểm khác. Giả sử rằng một số người muốn phân loại tốt thử nghiệm MNIST. Vì vậy, lần đầu tiên anh nhìn vào trang web MNIST của Yann LeCun và thấy kết quả sau đây của những người khác sử dụng 8 mô hình khác nhau,
Kết quả này ngụ ý rằng có thể có quá mức trên bộ thử nghiệm nếu chúng ta chọn mô hình hoạt động tốt nhất trong số một số mô hình.
Howerver, rõ ràng là hai bất đẳng thức này không tương thích.
Tôi đang làm sai ở đâu? Cái nào đúng và cái nào sai?
Nếu điều sau là sai, cách đúng đắn để áp dụng ràng buộc VC cho các bộ giả thuyết hữu hạn trong trường hợp này là gì?