Xây dựng mô hình học máy để dự đoán năng suất cây trồng dựa trên dữ liệu môi trường


10

Tôi có một bộ dữ liệu chứa dữ liệu về nhiệt độ, lượng mưa và sản lượng đậu tương cho một trang trại trong 10 năm (2005 - 2014). Tôi muốn dự đoán sản lượng cho năm 2015 dựa trên dữ liệu này.

Xin lưu ý rằng bộ dữ liệu có các giá trị HÀNG NGÀY cho nhiệt độ và lượng mưa, nhưng chỉ có 1 giá trị mỗi năm cho sản lượng, vì việc thu hoạch cây trồng xảy ra vào cuối vụ trồng trọt.

Tôi muốn xây dựng hồi quy hoặc một số mô hình dựa trên máy học khác để dự đoán năng suất năm 2015, dựa trên hồi quy / một số mô hình khác có được bằng cách nghiên cứu mối quan hệ giữa năng suất và nhiệt độ và lượng mưa trong những năm trước.

Tôi quen với việc thực hiện học máy bằng cách sử dụng scikit-learn. Tuy nhiên, không chắc chắn làm thế nào để đại diện cho vấn đề này. Phần khó khăn ở đây là nhiệt độ và lượng mưa là hàng ngày nhưng năng suất chỉ là 1 giá trị mỗi năm.

Làm thế nào để tôi tiếp cận điều này?


thậm chí tôi đang cố gắng xây dựng một mô hình để dự đoán năng suất cây trồng. Bạn có thể vui lòng chia sẻ chi tiết về cách tiếp cận bạn đang theo dõi?
Nitz

Bạn có thể nhận được một câu trả lời đầy đủ. Nếu không, xin vui lòng cho tôi biết và tôi sẽ rất vui khi viết câu trả lời chi tiết về cách đi về nó khi tôi làm việc trong cùng một miền
89_Simple

@ Crop89, đó sẽ là tuyệt vời! mong chờ câu trả lời của bạn
user308827

Bạn đã tìm ra nó? Tôi đang đối mặt với cùng một vấn đề. Bạn có thể chia sẻ chi tiết nếu bạn đã làm việc đó? cảm ơn nhiều
eric huang

Câu trả lời:


3

Để bắt đầu, bạn có thể dự đoán sản lượng cho năm tới dựa trên dữ liệu hàng ngày cho năm trước. Bạn có thể ước tính các tham số mô hình bằng cách xem xét giá trị dữ liệu của mỗi năm là một "điểm", sau đó xác thực mô hình bằng xác thực chéo. Bạn có thể mở rộng mô hình này bằng cách xem xét nhiều hơn năm ngoái, nhưng nhìn lại quá xa và bạn sẽ gặp khó khăn khi xác nhận mô hình và sự phù hợp của mình.


cảm ơn @Emre, sự nhầm lẫn của tôi là làm thế nào để tôi coi dữ liệu của cả năm là 1 điểm? Không phải mỗi hàng dữ liệu (đại diện cho một ngày) tạo thành một mẫu trong danh pháp học scikit? Làm cách nào để tôi coi cả năm là một mẫu chứ không phải 365?
dùng308827

1
Tôi đã không giải quyết các chi tiết cụ thể của sklearn, nhưng vì bạn đã hỏi, bạn muốn sử dụng các sklearn.cross_validationphương thức với "Nhãn" trong tên, chẳng hạn như sklearn.cross_validation.LabelKFold .
Emre

cảm ơn @Emre, vì vậy ý ​​tưởng là chỉ định mỗi năm một nhãn duy nhất, phải không?
dùng308827

Có, @ người dùng308827.
Emre

cảm ơn một lần nữa @Emre, vui lòng xem câu hỏi tiếp theo: datascience.stackexchange.com/questions/9612/ mẹo
user308827


1

Bạn có 10 điểm dữ liệu với mỗi điểm dữ liệu có kích thước 365 (nhiệt độ cho mỗi ngày) + 365 (lượng mưa cho mỗi ngày). Lý tưởng nhất, trước tiên tôi sẽ giảm kích thước thông qua các phương pháp học máy, ví dụ PCA. Sau đó sử dụng phương pháp học máy để xây dựng mô hình dự đoán. Tuy nhiên, do bộ dữ liệu nhỏ, tôi không nghĩ các kỹ thuật máy học phù hợp với vấn đề của bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.