Dự báo dữ liệu chuỗi thời gian thưa không âm


7

Tôi có bộ dữ liệu chuỗi thời gian (tần suất hàng ngày) thể hiện doanh số bán sản phẩm cho khách hàng theo thời gian. Doanh số được thể hiện như sau:

[0,0,0,0,24,0,0,0,0,0,0,0,4,0,0,0,0,17,0,0,0,0,9,0,...]

trong đó mỗi số đại diện cho doanh số bán hàng của sản phẩm trong một ngày.

Vấn đề là các phương pháp dự báo chuỗi thời gian (ARMA, HoltWinters) hoạt động tốt cho dữ liệu "liên tục" và "trơn tru", nhưng không tạo ra kết quả tốt trong trường hợp này.

Tôi muốn đưa ra dự báo về chuỗi đó, chú ý đến 2 điểm: (1) đảm bảo các giá trị không âm và (2) dữ liệu thưa thớt / không liên tục. Bất cứ ai cũng biết làm thế nào để tiếp cận vấn đề này? Phương pháp / kỹ thuật gì?

Cảm ơn!


Chỉ cần bấm chuông, nếu bạn không cần giải quyết hàng ngày trong dự đoán của mình, có lẽ bằng cách tổng hợp thành hàng tuần, bạn sẽ có một chuỗi thời gian dễ dàng hơn để dự báo.
Juan

Câu trả lời:


3

Tôi có hai ý tưởng ở đây, có thể chúng sẽ hữu ích.

Ý tưởng 1: Thời gian mô hình giữa các sự kiện

Bạn có thể nghĩ dữ liệu của mình được tạo bởi hai quy trình: đầu tiên là phân phối theo các khoảng thời gian và thứ hai là phân phối theo số lượng mua. Vì vậy, để mô hình hóa dữ liệu của bạn, bạn có thể tạo một phân phối (gaussian?) Qua các giá trị khác 0 trong tập dữ liệu của bạn và một phân đoạn khác theo độ dài của các số 0 (poisson?).

Ý tưởng 2: Mô hình hàng tồn kho của khách hàng

Mặc dù các sự kiện bán hàng trong bộ dữ liệu của bạn rất ít, bạn có thể dành một chút thời gian để đưa ra một mô hình về lý do tại sao khách hàng thực hiện mua hàng khi họ thực hiện. Trong một mô hình có thể, khách hàng có một hàng tồn kho co lại theo thời gian và họ thực hiện mua hàng khi hàng tồn kho của họ vượt qua một số ngưỡng tối thiểu. Bạn có thể sử dụng dữ liệu bán hàng của mình để phù hợp với độ dốc (đối với co rút tuyến tính) hoặc tỷ lệ (đối với co rút theo cấp số nhân) cũng như ngưỡng.

Điều này có thể trở nên phức tạp tùy ý, vì khách hàng theo mô hình này có thể có các ngưỡng hoặc tỷ lệ thu hẹp khác nhau vào các thời điểm khác nhau ... nhưng đối với người mới bắt đầu, đó có thể là một cách tiếp cận hữu ích để hiểu được mọi thứ.


cảm ơn vì câu trả lời, @ lmjohns3! Thật vậy, những gì tôi có trong đầu ngày hôm nay rất giống với những gì bạn đề xuất: (1) mô hình hóa mức tiêu thụ của khách hàng dựa trên lịch sử mua hàng bằng cách sử dụng quy trình Poisson; (2) dự báo giá trị này; (3) mô hình hóa hành vi mua hàng, một lần nữa sử dụng quy trình Poisson. Nếu bạn có bất kỳ đề nghị thêm, xin vui lòng cho tôi biết!
Bernardo Aflalo ngày

1

Trong loại dữ liệu này, thông tin đến từ 2 nơi

  1. Khoảng thời gian giữa doanh số : khoảng thời gian giữa vàTiSalei1Salei
  2. Số tiền của :SaleiYi

Tương tự như câu trả lời trước , tôi sẽ đề nghị bắt đầu bằng cách kiểm tra khoảng thời gian cho bất kỳ mẫu tiềm năng nào. Thứ hai là kiểm tra mối quan hệ giữa số lượng bán hàng với và , . Trong trường hợp chung nhất, 2 nên được tương quan. Dựa trên điều này, bạn có thể quyết định nên mô hình hóa chúng một cách độc lập hay cùng nhau. Một mô hình thường được sử dụng là mô hình không gian trạng thái. Ý tưởng cơ bản ở đây là phân tách ts thưa thớt thành các thành phần phụ không thưa thớt và dễ dàng hơn cho mô hình hóa.YiYi1TiTi1

Một mô hình chung có thể là:

Ti=g(Ti1,Yi1)+ei,

Yi=f(Yi1,Ti)+hi

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.