Lựa chọn mô hình Box-Jenkins


14

Quy trình lựa chọn mô hình Box-Jenkins trong phân tích chuỗi thời gian bắt đầu bằng cách xem xét các chức năng tự tương quan và tự động một phần của chuỗi. Các ô này có thể đề xuất q thích hợp trong ARMA ( p , q )pq(p,q) mô hình . Quy trình tiếp tục bằng cách yêu cầu người dùng áp dụng tiêu chí AIC / BIC để chọn mô hình đáng chú ý nhất trong số các mô hình sản xuất mô hình có thuật ngữ lỗi tiếng ồn trắng.

Tôi đã tự hỏi làm thế nào các bước kiểm tra trực quan và lựa chọn mô hình dựa trên tiêu chí này ảnh hưởng đến các lỗi tiêu chuẩn ước tính của mô hình cuối cùng. Tôi biết rằng nhiều quy trình tìm kiếm trong một tên miền cắt ngang có thể sai lệch tiêu chuẩn xuống dưới, ví dụ.

Bước đầu tiên, việc chọn số độ trễ phù hợp bằng cách xem dữ liệu (ACF / PACF) ảnh hưởng đến các lỗi tiêu chuẩn cho các mô hình chuỗi thời gian như thế nào?

Tôi đoán rằng việc chọn mô hình dựa trên điểm AIC / BIC sẽ có tác động tương tự như đối với phương pháp cắt ngang. Tôi thực sự không biết nhiều về lĩnh vực này, vì vậy bất kỳ ý kiến ​​cũng sẽ được đánh giá cao về điểm này.

Cuối cùng, nếu bạn viết ra tiêu chí chính xác được sử dụng cho từng bước, bạn có thể khởi động lại toàn bộ quá trình để ước tính các lỗi tiêu chuẩn và loại bỏ những lo ngại này không?


sai lệch trong các lỗi tiêu chuẩn (của các tham số?) rất quan trọng trong các mô hình ARMA theo lý thuyết? Các mô hình ARMA ASFAIK được sử dụng cho các dự báo ngắn hạn là chủ yếu. Các vấn đề với giải thích tham số và tính chất của chúng là ít (ít nhất?) Quan trọng. Tất nhiên nếu bạn không có nghĩa là các đặc điểm của một quá trình đổi mới (thuật ngữ lỗi), hãy lập kế hoạch để tạo ra các khoảng dự đoán có liên quan.
Dmitrij Celov

@Dmitrij, Có hai lý do chính khiến tôi lo ngại về sai lệch trong các lỗi tiêu chuẩn của các hệ số. Đầu tiên, như bạn đã đề cập, là việc tạo ra các khoảng dự đoán. Thứ hai là thử nghiệm cho sự phá vỡ cấu trúc trong mô hình, một câu hỏi phổ biến mà một nhà kinh tế sẽ quan tâm để trả lời. Các lỗi tiêu chuẩn được tạo bằng quy trình lựa chọn phải quá nhỏ, đưa ra các khoảng dự đoán quá hẹp và thống kê kiểm tra quá lớn.
Charlie

nhưng trong các mô hình lý thuyết (có nghĩa là không có lý thuyết, không có cấu trúc), sự phá vỡ cấu trúc rất ít liên quan đến các tham số, đó sẽ là một số thử nghiệm chung, liên quan đến hành vi của phần dư của mô hình. Trong trường hợp này, các ước tính không thiên vị của các tham số mô hình ít quan trọng hơn, ARMA đơn giản là không có giải thích mô hình cấu trúc. Do đó, các mô hình phân tích thực sự là các yếu tố dự đoán tốt hơn, vì chúng cân bằng tốt các đặc tính thường kém của các công cụ ước tính mẫu nhỏ và độ chính xác của dự đoán.
Dmitrij Celov

Lưu ý rằng ngay cả khi bạn biết quy trình tạo dữ liệu có nhiều tham số, trong các mẫu nhỏ, mô hình đơn giản hơn có thể sẽ dự đoán tốt hơn, nhưng trong bối cảnh cấu trúc, các tham số của mô hình đó sẽ rất sai lệch (bỏ qua sai lệch biến thiên)!
Dmitrij Celov

Câu trả lời:


5

Bất kỳ quy trình lựa chọn mô hình nào cũng sẽ ảnh hưởng đến các lỗi tiêu chuẩn và điều này hầu như không được tính đến. Ví dụ, các khoảng dự đoán được tính toán có điều kiện trên mô hình ước tính và ước lượng tham số và lựa chọn mô hình thường bị bỏ qua.

Có thể khởi động lại toàn bộ quy trình để ước tính hiệu quả của quá trình lựa chọn mô hình. Nhưng hãy nhớ rằng bootstrapping chuỗi thời gian khó hơn bootstrapping thông thường vì bạn phải duy trì mối tương quan nối tiếp. Bootstrap khối là một cách tiếp cận có thể mặc dù nó mất một số tương quan nối tiếp do cấu trúc khối.


6

Theo tôi, việc chọn số lượng độ trễ thích hợp không khác gì việc chọn số lượng chuỗi đầu vào trong quy trình hồi quy từng bước. Tầm quan trọng gia tăng của độ trễ hoặc một chuỗi đầu vào cụ thể là cơ sở cho đặc tả mô hình dự kiến.

Vì bạn đã khẳng định rằng acf / pacf là cơ sở duy nhất để lựa chọn mô hình Box-Jenkins, hãy để tôi nói cho bạn biết những kinh nghiệm nào đã dạy tôi. Nếu một loạt biểu hiện một acf không phân rã, cách tiếp cận Box-Jenkins (khoảng năm 1965) cho thấy sự khác biệt của dữ liệu. Nhưng nếu một chuỗi có sự thay đổi cấp độ, như dữ liệu Nile , thì sự không ổn định "rõ ràng trực quan" là một triệu chứng của cấu trúc cần thiết nhưng sự khác biệt không phải là biện pháp khắc phục. Bộ dữ liệu Nile này có thể được mô hình hóa mà không có sự khác biệt bằng cách đơn giản xác định nhu cầu thay đổi cấp độ trước. Trong một mạch tương tự, chúng ta được dạy sử dụng các khái niệm năm 1960 rằng nếu acf thể hiện cấu trúc theo mùa ( nghĩa làcác giá trị quan trọng ở độ trễ của s, 2s, 3s, ...) sau đó chúng ta nên kết hợp một thành phần ARIMA theo mùa. Đối với mục đích thảo luận, hãy xem xét một loạt đứng yên xung quanh một giá trị trung bình và theo các khoảng thời gian cố định, giả sử mỗi tháng sáu có một "giá trị cao". Sê-ri này được xử lý đúng cách bằng cách kết hợp một loạt hình nộm "lỗi thời" là 0 và 1 (vào tháng 6) để xử lý cấu trúc theo mùa. Một mô hình ARIMA theo mùa sẽ sử dụng bộ nhớ không chính xác thay vì biến X không xác định nhưng đang chờ tìm thấy. Hai khái niệm xác định / kết hợp cấu trúc xác định không xác định là những ứng dụng trực tiếp trong công việc của I. Chang, William Bell, George Tiao, R.Tsay , Chen et al (bắt đầu từ năm 1978) theo khái niệm chung về Phát hiện can thiệp.

Thậm chí ngày nay, một số nhà phân tích đang vô tư thực hiện các chiến lược tối đa hóa bộ nhớ, gọi chúng là ARIMA tự động, mà không nhận ra rằng "mô hình bộ nhớ không suy nghĩ" giả định rằng cấu trúc xác định như xung, dịch chuyển cấp, xung theo mùa và xu hướng thời gian cục bộ là không tồn tại hoặc tệ hơn là không chơi vai trò trong nhận dạng mô hình. Điều này giống như đặt đầu của một người vào cát, IMHO.


Cảm ơn lời khuyên tuyệt vời về lựa chọn mô hình, nhưng tôi đã quan tâm đến cách quá trình này tác động đến suy luận của chúng tôi sau đó.
Charlie

Charlie: Tôi không tin rằng các chẩn đoán dữ liệu trực tiếp như xem xét tự động tương quan hoặc tương quan chéo hoặc bất kỳ Quy trình nhận dạng mô hình nào khác như trình bày đồ họa có bất kỳ ảnh hưởng nào đến ý nghĩa thống kê của bất kỳ tham số ước tính nào. Đó là ý kiến ​​của tôi và "ở đây tôi đứng tôi không thể làm gì khác". Cảm ơn về danh tiếng và nếu tôi có thể giúp Charlie trẻ bằng mọi cách xin vui lòng liên lạc với tôi vì tôi thích được liệt kê là tài nguyên hỗ trợ (không trả tiền!) Trong các luận án Phd.
IrishStat
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.