Trong lý thuyết học thống kê, không có vấn đề gì về việc quá mức trong một bài kiểm tra?


16

Chúng ta hãy xem xét vấn đề về việc phân loại bộ dữ liệu MNIST.

Theo trang web MNIST của Yann LeCun , 'Ciresan et al.' nhận được 0,23% tỷ lệ lỗi trên bộ kiểm tra MNIST bằng cách sử dụng Mạng thần kinh chuyển đổi.

Chúng ta hãy biểu thị tập huấn luyện MNIST là , bài kiểm tra MNIST được đặt là D t e s t , giả thuyết cuối cùng họ nhận được khi sử dụng D t r a i nh 1 và tỷ lệ lỗi của họ trên tập kiểm tra MNIST sử dụng h 1 như E t e s t ( h 1 ) = 0,0023 .DtrainDtestDtrainh1h1EteSt(h1)= =0,0023

Theo quan điểm của họ, vì được lấy mẫu ngẫu nhiên được đặt từ không gian đầu vào bất kể h 1 , họ có thể khẳng định rằng hiệu suất lỗi ngoài mẫu của giả thuyết cuối cùng của họ E o u t ( h 1 ) được giới hạn như sau từ bất đẳng thức Hoeffding P [ | E o u t ( h 1 ) - E t e s t ( h 1 ) | < ϵ | ]DteSth1Eobạnt(h1) nơi N t e s t = | D t e s t | .

P[|Eout(h1)Etest(h1)|<ϵ|]12e2ϵ2Ntest

Ntest=|Dtest|

Nói cách khác, ít nhất là xác xuất , E o u t ( h 1 ) E t e s t ( h 1 ) + 1δ

Eout(h1)Etest(h1)+12Ntestln2δ

Hãy xem xét một quan điểm khác. Giả sử rằng một số người muốn phân loại tốt thử nghiệm MNIST. Vì vậy, lần đầu tiên anh nhìn vào trang web MNIST của Yann LeCun và thấy kết quả sau đây của những người khác sử dụng 8 mô hình khác nhau,

Kết quả phân loại MNIST

g

gDtestHtrained={h1,h2,..,h8}

Etest(g)

P[|Eout(g)Ein(g)|<ϵ]12|Htrained|e2ϵ2Ntest

1δ

Eout(g)Etest(g)+12Ntestln2|Htrained|δ

Kết quả này ngụ ý rằng có thể có quá mức trên bộ thử nghiệm nếu chúng ta chọn mô hình hoạt động tốt nhất trong số một số mô hình.

h1Etest(h1)=0.0023h1Dtesth1

Eout(h1)Etest(h1)+12Ntestln2|Htrained|δ

P[Eout(h1)Etest(h1)+12Ntestln2δ]1δ
P[Eout(h1)Etest(h1)+12Ntestln2|Htrained|δ]1δ

Howerver, rõ ràng là hai bất đẳng thức này không tương thích.

Tôi đang làm sai ở đâu? Cái nào đúng và cái nào sai?

Nếu điều sau là sai, cách đúng đắn để áp dụng ràng buộc VC cho các bộ giả thuyết hữu hạn trong trường hợp này là gì?

Câu trả lời:


1

g= =h1gh1

gHtrmộtTôined= ={h1,h2,...,hsố 8}DteSt

Vì thế, g là một chức năng của DteSt. Đối với một bộ thử nghiệm cụ thể,DteSt* (giống như bạn đã đề cập), nó có thể xảy ra rằng g(DteSt*)= =h1, nhưng nói chung, tùy thuộc vào bộ thử nghiệm, g(DteSt) có thể nhận bất kỳ giá trị nào trong HtrmộtTôined. Mặt khách1 chỉ là một giá trị trong HtrmộtTôined.

Đối với câu hỏi khác:

Nếu điều sau là sai, cách đúng đắn để áp dụng ràng buộc VC cho các bộ giả thuyết hữu hạn trong trường hợp này là gì?

Chỉ không thay thế g bởi h1, bạn sẽ có được ràng buộc chính xác (cho g, tất nhiên) và nó sẽ không có xung đột với các ràng buộc khác (dành cho h1).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.