Vâng, có nhiều cách để làm điều này. Mọi người kiếm sống bằng cách làm những thứ như thế này ;-)
Bạn đang tìm kiếm dự báo nhân quả . Nhìn vào sách giáo khoa trực tuyến miễn phí này về dự báo để tìm hiểu về phương pháp dự báo.
Bạn có hai vấn đề chính trong tay mà bạn cần phải giải quyết: tính thời vụ (hay nói chung hơn là cấu trúc chuỗi thời gian, có thể là tự phát) một mặt và mặt khác là các tác động như quảng cáo. Chương 8 trong sách giáo khoa ở trên đề cập đến các chuỗi thời gian trong bối cảnh ARIMA, trong khi Chương 5 đề cập đến các hiệu ứng nhân quả.
Thật hạnh phúc, có thể giải quyết cả hai vấn đề bằng cách tính toán cái gọi là ARIMAX (chữ X là viết tắt của mô hình "hiệu ứng bên ngoài", tức là ARIMA với các hiệu ứng bên ngoài) hoặc hồi quy với lỗi ARIMA. Xem bài đăng trên blog của Rob Hyndman về "Mô hình ARIMAX lầy lội" để biết sự khác biệt. Các auto.arima()
chức năng trong forecast
gói R sẽ phù hợp với một hồi quy với các lỗi ARIMA. Hãy xem qua một ví dụ, trong đó tôi lấy một bộ dữ liệu tiêu chuẩn với xu hướng và tính thời vụ mạnh mẽ và thêm "chương trình khuyến mãi".
library(forecast)
AirPassengers # a built-in dataset
# Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
# 1949 112 118 132 129 121 135 148 148 136 119 104 118
# 1950 115 126 141 135 125 149 170 170 158 133 114 140
# 1951 145 150 178 163 172 178 199 199 184 162 146 166
# 1952 171 180 193 181 183 218 230 242 209 191 172 194
# 1953 196 196 236 235 229 243 264 272 237 211 180 201
# 1954 204 188 235 227 234 264 302 293 259 229 203 229
# 1955 242 233 267 269 270 315 364 347 312 274 237 278
# 1956 284 277 317 313 318 374 413 405 355 306 271 306
# 1957 315 301 356 348 355 422 465 467 404 347 305 336
# 1958 340 318 362 348 363 435 491 505 404 359 310 337
# 1959 360 342 406 396 420 472 548 559 463 407 362 405
# 1960 417 391 419 461 472 535 622 606 508 461 390 432
set.seed(1) # for reproducibility
promos <- rep(0,length(AirPassengers))
promos[sample(seq_along(AirPassengers),10)] <- 1
promos.future <- c(0,1,0,0,1,0,0,1,0,0,1,0)
AP.with.promos <- AirPassengers
AP.with.promos[promos==1] <- AP.with.promos[promos==1]+120
model <- auto.arima(AP.with.promos,xreg=promos)
summary(model) # examine the model - you'll see the estimated promo coefficient
# Series: AP.with.promos
# ARIMA(0,1,1)(0,1,0)[12]
# Coefficients:
# ma1 promos
# -0.3099 122.2599
# s.e. 0.0947 2.2999
# sigma^2 estimated as 151.2: log likelihood=-457.4
# AIC=920.79 AICc=920.98 BIC=929.42
# Training set error measures:
# ME RMSE MAE MPE MAPE MASE ACF1
# Training set 0.2682805 11.12974 8.24397 0.06139784 2.867274 0.1860814 0.0008326436
fcast <- forecast(model,xreg=promos.future,h=length(promos.future))
fcast
# Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
# Jan 1961 447.1516 431.3951 462.9081 423.0542 471.2490
# Feb 1961 543.4115 524.2670 562.5559 514.1326 572.6904
# Mar 1961 449.1516 427.1345 471.1687 415.4793 482.8239
# Apr 1961 491.1516 466.5956 515.7076 453.5964 528.7068
# May 1961 624.4115 597.5556 651.2674 583.3389 665.4841
# Jun 1961 565.1516 536.1777 594.1255 520.8399 609.4633
# Jul 1961 652.1516 621.2044 683.0988 604.8220 699.4812
# Aug 1961 758.4115 725.6095 791.2135 708.2452 808.5778
# Sep 1961 538.1516 503.5942 572.7090 485.3006 591.0026
# Oct 1961 491.1516 454.9237 527.3795 435.7459 546.5573
# Nov 1961 542.4115 504.5869 580.2361 484.5637 600.2593
# Dec 1961 462.1516 422.7950 501.5082 401.9608 522.3424
promos.ts <- ts(c(AP.with.promos,fcast$mean),
start=start(AirPassengers),frequency=frequency(AirPassengers))
promos.ts[c(promos,promos.future)==0] <- NA
plot(fcast)
points(promos.ts,pch=19,col="red")

Các chấm đỏ là chương trình khuyến mãi. Theo mặc định, bạn sẽ nhận được các khoảng dự đoán được vẽ bằng màu xám. Bạn có thể cung cấp nhiều biến hồi quy vào mô hình của mình thông qua xreg
tham số, điều bạn nên làm nếu bạn có các loại quảng cáo khác nhau với các hiệu ứng khác nhau. Thử nghiệm một chút.
Tôi sẽ khuyên bạn nên xem xét dữ liệu chi tiết hơn so với hàng tháng nếu bạn có chúng, ví dụ: hàng tuần. Đặc biệt là tất nhiên nếu chương trình khuyến mãi của bạn không chạy trong cả tháng. Bạn có thể làm điều này một cách riêng biệt theo sản phẩm, đặc biệt là nếu bạn quảng bá các sản phẩm cụ thể hoặc trên toàn bộ danh mục.
Một giải pháp thay thế sẽ là, nếu bạn quan tâm đến các khái niệm hơn mã, để xem xét Làm mịn theo cấp số nhân và thay đổi nó cho phù hợp với nhu cầu của bạn, bằng cách thêm các thành phần quảng cáo vào các thành phần ba cấp độ, mùa và xu hướng tiêu chuẩn. Bạn có thể tự mình làm nhiều hơn với Làm mịn theo cấp số nhân so với việc cố gắng ước tính tối đa một mô hình ARIMAX, nhưng Smoothing có thể biến thành một cơn ác mộng của sổ sách kế toán nếu bạn có nhiều loại khuyến mãi.