Tôi đang phát triển một ứng dụng dự báo với mục đích là cho phép nhà nhập khẩu dự báo nhu cầu cho các sản phẩm của mình từ mạng lưới nhà phân phối khách hàng. Số liệu bán hàng là một proxy khá tốt cho nhu cầu, miễn là có đủ hàng tồn kho để đáp ứng nhu cầu. Tuy nhiên, khi hàng tồn kho được rút xuống 0, (tình huống chúng tôi đang tìm cách giúp khách hàng tránh), chúng tôi không biết nhiều về việc chúng tôi đã bỏ lỡ mục tiêu. Khách hàng đã thực hiện bao nhiêu doanh số, nếu họ có đủ nguồn cung? Các cách tiếp cận ML dựa trên hồi quy tiêu chuẩn sử dụng Bán hàng làm biến mục tiêu đơn giản sẽ tạo ra các ước tính không thống nhất về mối quan hệ giữa thời gian, các biến mô tả và nhu cầu của tôi.
Mô hình Tobit là cách rõ ràng nhất để tiếp cận vấn đề: http://en.wikipedia.org/wiki/Tobit_model . Tôi đang tự hỏi về sự thích ứng ML của các khu rừng ngẫu nhiên, GBMS, SVM và mạng lưới thần kinh cũng chiếm cấu trúc kiểm duyệt dữ liệu thuận tay trái.
Nói tóm lại, làm cách nào để áp dụng các công cụ học máy vào dữ liệu hồi quy bị kiểm duyệt trái để có được ước tính nhất quán về mối quan hệ giữa các biến phụ thuộc và biến độc lập của tôi? Ưu tiên đầu tiên sẽ là các giải pháp khả dụng trong R, tiếp theo là Python.
Chúc mừng
Aaron