Tôi có một câu hỏi cụ thể về xác nhận trong nghiên cứu máy học.
Như chúng ta đã biết, chế độ học máy yêu cầu các nhà nghiên cứu đào tạo các mô hình của họ về dữ liệu đào tạo, chọn từ các mô hình ứng viên theo bộ xác nhận và báo cáo độ chính xác trên bộ thử nghiệm. Trong một nghiên cứu rất nghiêm ngặt, bộ thử nghiệm chỉ có thể được sử dụng một lần. Tuy nhiên, nó không bao giờ có thể là kịch bản nghiên cứu, bởi vì chúng tôi phải cải thiện hiệu suất của mình cho đến khi độ chính xác kiểm tra tốt hơn kết quả hiện đại trước khi chúng tôi có thể xuất bản (hoặc thậm chí gửi) một bài báo.
Bây giờ đến vấn đề. Giả sử 50% là kết quả tiên tiến nhất và mô hình của tôi nói chung có thể đạt được độ chính xác 50--51, trung bình tốt hơn.
Tuy nhiên, độ chính xác xác thực tốt nhất của tôi (52%) mang lại độ chính xác kiểm tra rất thấp, ví dụ: 49%. Sau đó, tôi phải báo cáo 49% là hiệu suất tổng thể của mình nếu tôi không thể cải thiện thêm xác nhận hợp lệ, điều mà tôi nghĩ là không có hy vọng. Điều này thực sự ngăn cản tôi nghiên cứu vấn đề, nhưng nó không thành vấn đề với các đồng nghiệp của tôi, vì họ không thấy acc 52%, mà tôi nghĩ là ngoại lệ.
Vì vậy, làm thế nào để mọi người thường làm trong nghiên cứu của họ?
xác thực ps k-Fold là không có ích, bởi vì tình huống tương tự vẫn có thể xảy ra.