Tôi có một bộ dữ liệu chứa dữ liệu về nhiệt độ, lượng mưa và sản lượng đậu tương cho một trang trại trong 10 năm (2005 - 2014). Tôi muốn dự đoán sản lượng cho năm 2015 dựa trên dữ liệu này.
Xin lưu ý rằng bộ dữ liệu có các giá trị HÀNG NGÀY cho nhiệt độ và lượng mưa, nhưng chỉ có 1 giá trị mỗi năm cho sản lượng, vì việc thu hoạch cây trồng xảy ra vào cuối vụ trồng trọt.
Tôi muốn xây dựng hồi quy hoặc một số mô hình dựa trên máy học khác để dự đoán năng suất năm 2015, dựa trên hồi quy / một số mô hình khác có được bằng cách nghiên cứu mối quan hệ giữa năng suất và nhiệt độ và lượng mưa trong những năm trước.
Tôi quen với việc thực hiện học máy bằng cách sử dụng scikit-learn. Tuy nhiên, không chắc chắn làm thế nào để đại diện cho vấn đề này. Phần khó khăn ở đây là nhiệt độ và lượng mưa là hàng ngày nhưng năng suất chỉ là 1 giá trị mỗi năm.
Làm thế nào để tôi tiếp cận điều này?