Câu hỏi thú vị. Cá nhân tôi đã không thấy rằng đối với các sản phẩm đi vào sản xuất, nhưng hiểu logic.
Về mặt lý thuyết, mô hình triển khai của bạn đã nhìn thấy càng nhiều dữ liệu, thì càng tốt để khái quát hóa. Vì vậy, nếu bạn đã đào tạo mô hình trên bộ dữ liệu đầy đủ mà bạn có sẵn, thì nó nên khái quát hóa tốt hơn mô hình chỉ nhìn thấy ví dụ về bộ tàu / val (ví dụ ~ 90%) từ bộ dữ liệu đầy đủ.
Vấn đề với điều này (và lý do chúng tôi chia dữ liệu thành tập hợp thử nghiệm / val / thử nghiệm ngay từ đầu!) Là chúng tôi muốn có thể đưa ra yêu cầu thống kê về độ chính xác của dữ liệu chưa xem. Ngay sau khi chúng tôi đào tạo lại một mô hình một lần nữa trên tất cả các dữ liệu, không còn có thể đưa ra các yêu cầu như vậy nữa.
[Chỉnh sửa]
Dưới đây là một câu hỏi liên quan về Xác thực chéo , trong đó câu trả lời được chấp nhận đưa ra những điểm tương tự với tôi và đề cập đến các cách làm việc khác.
Chúng tôi lặp lại:
- đào tạo người mẫu
- đánh giá hiệu suất trên bộ xác thực nếu đạt yêu cầu, chuyển sang bước 5→
- thay đổi mô hình
- sang bước 1
- đánh giá hiệu suất trên bộ kiểm tra
- Mô hình hiện tại với độ chính xác kiểm tra được tìm thấy trong bước 5
Cuối cùng, nếu bạn quản lý để có được một số điểm tuyệt vời trong bộ bài kiểm tra, bạn có thể khẳng định nó tổng quát tốt. Vì vậy, câu hỏi liệu đào tạo lại trên bộ dữ liệu đầy đủ sẽ cải thiện hiệu suất trên dữ liệu chưa xem trong tương lai không hoàn toàn là điều bạn có thể kiểm tra. Bằng chứng thực nghiệm về hiệu suất tốt hơn trong các bộ vấn đề liên quan khác sẽ là nguồn hoặc hướng dẫn duy nhất tại thời điểm bạn phải đưa ra quyết định.
Kiểm tra độ tỉnh táo sẽ là kiểm tra lại mô hình được đào tạo lại lần cuối trên bộ thử nghiệm ban đầu; hy vọng rằng nó đạt điểm cao hơn bao giờ hết khi người mẫu chỉ nhìn thấy bộ xe lửa / val, bởi vì nó thực sự đã nhìn thấy bộ thử nghiệm trong quá trình đào tạo. Điều này sẽ không khiến tôi cảm thấy tự tin 100% rằng mô hình cuối cùng này vượt trội trong tất cả các trường hợp trong tương lai, nhưng ít nhất nó cũng tốt như nó có thể với dữ liệu đã cho.
Có lẽ có nhiều lập luận chặt chẽ hơn đối với việc làm những gì bạn nói (có thể là bị chế giễu về mặt học thuật), tuy nhiên nó có vẻ hấp dẫn cho các ứng dụng thực tế!