Statsmodels nói rằng ARIMA không phù hợp vì loạt phim không ổn định, làm thế nào để thử nghiệm điều đó?


12

Tôi có một chuỗi thời gian mà tôi đang cố gắng mô hình hóa với số liệu thống kê ARIMA api của Python. Khi tôi áp dụng như sau:

from statsmodels.tsa.arima_model import ARIMA
model = ARIMA(data['Sales difference'].dropna(), order=(2, 1, 2))
results_AR = model.fit(disp=-1)

Tôi nhận được lỗi sau đây:

ValueError: The computed initial AR coefficients are not stationary
You should induce stationarity, choose a different model order, or you can
pass your own start_params.

Nhưng tôi đã phân biệt dữ liệu:

data['Sales'] = data['Sales'] - data['Sales'].shift() 

Tôi có thể làm gì hơn nữa để gây ra sự cố định?

Và thử nghiệm nào là api ARIMA đang chạy để xác định rằng dữ liệu không ổn định?

Chuỗi thời gian ban đầu của tôi trông như: nhập mô tả hình ảnh ở đây

Chuỗi thời gian khác nhau trông như: nhập mô tả hình ảnh ở đây

Và cốt truyện ACF của tôi trông như sau: nhập mô tả hình ảnh ở đây


Tiền đề là sai. Sự khác biệt trong họ ARIMA cho phép loại bỏ các xu hướng đa thức do đó cho phép một số mô hình không cố định được chuyển đổi thành văn phòng phẩm. Họ ARMA không cho phép phân biệt và không bao gồm các mô hình không cố định.
Michael R. Chernick

2
@MichaelCécick nhưng tôi đang gọi api ARIMA, không phải là ARMA. Tui bỏ lỡ điều gì vậy?
Skander H.

Câu trả lời:


4

Bạn hỏi "Tôi có thể làm gì hơn nữa để gây ra sự cố chấp?" Nếu một loạt biểu hiện sự thay đổi mức độ (triệu chứng) thì đây là một ví dụ về tình trạng không ổn định. Biện pháp khắc phục chính xác là "khử" dữ liệu không làm khác biệt dữ liệu. Ngoài ra, một loạt có thể thể hiện sự thay đổi trong xu hướng xác định hoặc xung theo mùa có thể được điều chỉnh bằng các sơ đồ Phát hiện Can thiệp. Nếu chuỗi có thay đổi về tham số theo thời gian (triệu chứng), biện pháp khắc phục chính xác là tìm điểm dừng thông qua Thử nghiệm Chow và sử dụng bộ gần đây nhất hoặc một dạng mô hình ngưỡng (TAR) nào đó . Nếu một chuỗi có sự thay đổi về phương sai lỗi theo thời gian (triệu chứng), biện pháp khắc phục chính xác có thể là WLS dưới dạng GLS hoặc một số dạng biến đổi công suất hoặc thất bại trong những biện pháp tương đối đơn giản đó một số dạng của mô hình GARCH.

Nếu bạn đăng dữ liệu gốc của mình, tôi có thể giúp nhiều hơn.


2

Đọc kỹ: không nói rằng chuỗi thời gian không ổn định. Nó nói rằng các hệ số ban đầu không ổn định (mà tôi cho rằng chúng không mô tả quá trình đứng yên).

Bạn có thể thử đưa ra dự đoán của riêng mình cho các giá trị bắt đầu, như nó gợi ý. Nhưng tôi nghi ngờ rằng việc chọn giá trị khởi đầu không tốt ngay từ đầu vì mô hình được chỉ định sai. Nếu bạn đã phân biệt chuỗi thời gian, có lẽ bạn cũng không muốn chỉ định thứ tự tích hợp 1. Bạn có thể có nghĩa là thứ tự = (2, 0, 2), không phải thứ tự = (2, 1, 2).


0

Trong tín hiệu chuỗi thời gian, sự ổn định có thể được đưa vào bằng cách sử dụng cửa sổ. Bạn có thể chia tín hiệu chuỗi thời gian đơn của mình thành các tín hiệu nhỏ hơn bằng cách sử dụng kỹ thuật cửa sổ tốt với sự chồng chéo. Cửa sổ là cần thiết để tránh các đỉnh giả trong miền tần số và cần có sự chồng lấp để bảo toàn năng lượng tín hiệu. Thông thường, tín hiệu giọng nói (tần số lấy mẫu 8KHz) có 30 khung hình cho 240 mẫu trên mỗi khung. Điều này được tạo ra bằng cách sử dụng cửa sổ hãm với 50% trùng lặp.


0

Chuỗi thời gian khác nhau không đứng yên vì nó không có phương sai không đổi. Bạn có thể thử một sự khác biệt logarit.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.