Lựa chọn nào trong các bước dưới đây là tùy chọn chính xác khi tạo mô hình dự đoán?
Lựa chọn 1:
Trước tiên, loại bỏ các yếu tố dự đoán xấu rõ ràng nhất và tiền xử lý còn lại nếu cần, sau đó huấn luyện các mô hình khác nhau với xác thực chéo, chọn một vài mô hình tốt nhất, xác định các dự đoán hàng đầu mà mỗi mô hình đã sử dụng, sau đó chỉ giữ lại các mô hình đó với các dự báo đó và đánh giá độ chính xác một lần nữa với xác nhận chéo, sau đó chọn cái tốt nhất và huấn luyện nó trên tập huấn luyện đầy đủ bằng cách sử dụng các bộ dự đoán chính của nó và sau đó sử dụng nó để dự đoán bộ kiểm tra.
Lựa chọn 2:
Trước tiên, loại bỏ các yếu tố dự đoán xấu rõ ràng nhất, sau đó xử lý trước phần còn lại nếu cần, sau đó sử dụng kỹ thuật chọn tính năng như chọn tính năng đệ quy (ví dụ: RFE với rf) với xác thực chéo để xác định số lượng dự đoán chính lý tưởng và những dự đoán này là, sau đó huấn luyện các loại mô hình khác nhau với xác nhận chéo và xem loại nào cho độ chính xác tốt nhất với các dự đoán hàng đầu được xác định trước đó. Sau đó huấn luyện một trong những mô hình tốt nhất một lần nữa với các dự đoán đó trên tập huấn luyện đầy đủ và sau đó sử dụng nó để dự đoán tập kiểm tra.