Tôi đang làm việc để phát triển một mô hình để dự đoán tổng doanh số của một sản phẩm. Tôi có khoảng một năm rưỡi dữ liệu đặt chỗ, vì vậy tôi có thể thực hiện phân tích chuỗi thời gian tiêu chuẩn. Tuy nhiên, tôi cũng có rất nhiều dữ liệu về mỗi 'cơ hội' (bán hàng tiềm năng) đã bị đóng hoặc bị mất. "Cơ hội" được tiến hành theo các giai đoạn của một đường ống cho đến khi chúng bị đóng hoặc mất; họ cũng có dữ liệu liên quan về người mua tiềm năng, nhân viên bán hàng, lịch sử tương tác, ngành, quy mô đặt chỗ ước tính, v.v.
Mục tiêu của tôi cuối cùng là dự đoán tổng số lượng đặt phòng, nhưng tôi muốn tính đến tất cả các thông tin này về 'cơ hội' hiện tại, đó là 'nguyên nhân gốc' của việc đặt chỗ.
Một ý tưởng tôi có là sử dụng hai mô hình khác nhau như sau:
Sử dụng 'cơ hội' lịch sử để xây dựng mô hình dự đoán các đặt chỗ phát sinh từ một 'cơ hội' cá nhân (có thể tôi sẽ sử dụng rừng ngẫu nhiên hoặc thậm chí hồi quy tuyến tính cũ đơn giản cho bước này).
Sử dụng mô hình từ 1 để dự đoán các đặt chỗ ước tính của tất cả 'cơ hội' hiện đang được triển khai, sau đó tổng hợp các ước tính đó dựa trên tháng mỗi 'cơ hội' đã được tạo.
Sử dụng mô hình chuỗi thời gian (có thể là ARIMA?), Sử dụng 1,5 năm dữ liệu chuỗi thời gian lịch sử hàng tháng VÀ dự đoán (sử dụng mô hình từ 1) tổng số đặt chỗ cho tất cả 'cơ hội' được tạo trong tháng đó.
Cấp sẽ có một độ trễ trong những cơ hội chuyển đổi sang đặt chỗ thực tế, nhưng mô hình chuỗi thời gian sẽ có thể đối phó với độ trễ.
Làm thế nào để âm thanh này? Tôi đã đọc rất nhiều về chuỗi thời gian và dự đoán doanh số, và từ những gì tôi có thể nói đây là một cách tiếp cận có phần độc đáo. Vì vậy, tôi thực sự đánh giá cao bất kỳ thông tin phản hồi!