Tôi có 3 tháng dữ liệu (mỗi hàng tương ứng với mỗi ngày) được tạo và tôi muốn thực hiện phân tích chuỗi thời gian đa biến cho cùng:
các cột có sẵn là -
Date Capacity_booked Total_Bookings Total_Searches %Variation
Mỗi Ngày có 1 mục trong tập dữ liệu và có 3 tháng dữ liệu và tôi muốn điều chỉnh mô hình chuỗi thời gian đa biến để dự báo các biến khác.
Cho đến nay, đây là nỗ lực của tôi và tôi đã cố gắng đạt được điều tương tự bằng cách đọc các bài báo.
Tôi làm giống vậy -
df['Date'] = pd.to_datetime(Date , format = '%d/%m/%Y')
data = df.drop(['Date'], axis=1)
data.index = df.Date
from statsmodels.tsa.vector_ar.vecm import coint_johansen
johan_test_temp = data
coint_johansen(johan_test_temp,-1,1).eig
#creating the train and validation set
train = data[:int(0.8*(len(data)))]
valid = data[int(0.8*(len(data))):]
freq=train.index.inferred_freq
from statsmodels.tsa.vector_ar.var_model import VAR
model = VAR(endog=train,freq=train.index.inferred_freq)
model_fit = model.fit()
# make prediction on validation
prediction = model_fit.forecast(model_fit.data, steps=len(valid))
cols = data.columns
pred = pd.DataFrame(index=range(0,len(prediction)),columns=[cols])
for j in range(0,4):
for i in range(0, len(prediction)):
pred.iloc[i][j] = prediction[i][j]
Tôi có một bộ xác nhận và bộ dự đoán. Tuy nhiên, dự đoán là cách tồi tệ hơn dự kiến.
Các lô của bộ dữ liệu là - 1.% Biến đổi
Đầu ra mà tôi đang nhận là -
Khung dữ liệu dự đoán -
Khung dữ liệu xác nhận -
Như bạn có thể thấy rằng các dự đoán đang tắt đi những gì được mong đợi. Bất cứ ai có thể tư vấn một cách để cải thiện độ chính xác. Ngoài ra, nếu tôi phù hợp với mô hình trên toàn bộ dữ liệu và sau đó in dự báo, thì sẽ không tính đến việc tháng mới đã bắt đầu và do đó để dự đoán như vậy. Làm thế nào mà có thể được kết hợp ở đây. bất kỳ trợ giúp được đánh giá cao.
BIÊN TẬP
Liên kết đến tập dữ liệu - Bộ dữ liệu
Cảm ơn