Tôi đã theo dõi các cuộc thi của Kaggle trong một thời gian dài và tôi nhận ra rằng nhiều chiến lược chiến thắng liên quan đến việc sử dụng ít nhất một trong số "ba lô lớn": đóng gói, tăng cường và xếp chồng.
Đối với hồi quy, thay vì tập trung vào xây dựng một mô hình hồi quy tốt nhất có thể, việc xây dựng nhiều mô hình hồi quy như hồi quy tuyến tính (Tổng quát hóa), mô hình hồi quy ngẫu nhiên, KNN, NN và SVM và trộn các kết quả thành một cách hợp lý dường như không phù hợp - phù hợp với từng phương pháp riêng lẻ rất nhiều lần.
Tất nhiên, một sự hiểu biết vững chắc về từng phương pháp là chìa khóa và một câu chuyện trực quan có thể được kể dựa trên mô hình hồi quy tuyến tính, nhưng tôi tự hỏi liệu điều này có trở thành trạng thái của phương pháp nghệ thuật để đạt được kết quả tốt nhất có thể.