Tôi đang cố gắng để giải quyết các nhiệm vụ hồi quy. Tôi phát hiện ra rằng 3 mô hình đang hoạt động tốt cho các tập hợp dữ liệu khác nhau: LassoLARS, SVR và Gradient Tree Boosting. Tôi nhận thấy rằng khi tôi đưa ra dự đoán bằng cách sử dụng cả 3 mô hình này và sau đó tạo một bảng 'đầu ra thực' và đầu ra của 3 mô hình của tôi, tôi thấy rằng mỗi lần ít nhất một trong số các mô hình thực sự gần với đầu ra thực, mặc dù có 2 mô hình khác có thể là tương đối xa.
Khi tôi tính toán sai số tối thiểu có thể (nếu tôi dự đoán từ dự đoán 'tốt nhất' cho mỗi ví dụ kiểm tra), tôi nhận được một lỗi nhỏ hơn nhiều so với lỗi của bất kỳ mô hình nào. Vì vậy, tôi nghĩ về việc cố gắng kết hợp các dự đoán từ 3 mô hình khác nhau này thành một loại hòa tấu nào đó. Câu hỏi là, làm thế nào để làm điều này đúng? Tất cả 3 mô hình của tôi đều được xây dựng và điều chỉnh bằng scikit-learn, nó có cung cấp một loại phương pháp nào đó có thể được sử dụng để đóng gói các mô hình thành tập hợp không? Vấn đề ở đây là tôi không muốn chỉ dự đoán trung bình từ cả ba mô hình, tôi muốn thực hiện điều này với trọng số, trong đó trọng số phải được xác định dựa trên các thuộc tính của ví dụ cụ thể.
Ngay cả khi scikit-learn không cung cấp chức năng như vậy, sẽ rất tuyệt nếu ai đó biết cách xử lý thuộc tính này - tìm ra trọng số của từng mô hình cho từng ví dụ trong dữ liệu. Tôi nghĩ rằng nó có thể được thực hiện bởi một bộ hồi quy riêng được xây dựng trên cả ba mô hình này, chúng sẽ thử trọng lượng tối ưu đầu ra cho mỗi 3 mô hình, nhưng tôi không chắc liệu đây có phải là cách tốt nhất để làm việc này không.