Nó không dẫn đến phù hợp quá mức? Kết quả của tôi sẽ đáng tin cậy hơn nếu tôi thêm quy trình jack-dao hoặc bootstrap như một phần của phân tích?
Nó không dẫn đến phù hợp quá mức? Kết quả của tôi sẽ đáng tin cậy hơn nếu tôi thêm quy trình jack-dao hoặc bootstrap như một phần của phân tích?
Câu trả lời:
Tôi nghĩ rằng việc xây dựng một mô hình và thử nghiệm nó là những điều khác nhau. Việc loại bỏ lạc hậu là một phần của việc xây dựng mô hình. Jack dao và bootstrap được sử dụng nhiều hơn để kiểm tra nó.
Bạn chắc chắn có thể có các ước tính đáng tin cậy hơn với bootstrap và jack dao hơn là cách di chuyển ngược đơn giản. Nhưng nếu bạn thực sự muốn kiểm tra quá mức, thử nghiệm cuối cùng là một mẫu phân tách, đào tạo trên một số, thử nghiệm trên những người khác. Rời khỏi một lần là quá không ổn định / không đáng tin cậy cho mục đích này: http://www.russpoldrack.org/2012/12/the-perils-of-leave-one-out.html
Tôi nghĩ rằng ít nhất 10% đối tượng cần phải ra ngoài để có được ước tính ổn định hơn về độ mạnh của mô hình. Và nếu bạn có 20 môn, 2 môn vẫn còn rất ít. Nhưng sau đó, câu hỏi đặt ra là liệu bạn có một mẫu đủ lớn để xây dựng một mô hình có thể áp dụng cho phần còn lại của dân số hay không.
Hy vọng nó trả lời câu hỏi của bạn ít nhất một phần.