Mối quan hệ và sự khác biệt giữa chuỗi thời gian và hồi quy?


12

Mối quan hệ và sự khác biệt giữa chuỗi thời gian và hồi quy là gì?

Đối với các mô hình và giả định , có đúng không khi các mô hình hồi quy giả định tính độc lập giữa các biến đầu ra cho các giá trị khác nhau của biến đầu vào, trong khi mô hình chuỗi thời gian thì không? Một số khác biệt khác là gì?

Đối với phương pháp , từ một trang web của Darlington

Có một số cách tiếp cận để phân tích chuỗi thời gian, nhưng hai phương pháp được biết đến nhiều nhất là phương pháp hồi quy và phương pháp Box-Jenkins (1976) hoặc ARIMA (AutoRegressive Integration Move Average). Tài liệu này giới thiệu phương pháp hồi quy. Tôi xem xét phương pháp hồi quy vượt trội hơn nhiều so với ARIMA vì ba lý do chính

Tôi hoàn toàn không hiểu "phương pháp hồi quy" cho chuỗi thời gian trên trang web là gì và nó khác với phương pháp Box-Jenkins hay ARIMA như thế nào. Tôi đánh giá cao nếu ai đó có thể đưa ra một số hiểu biết về những câu hỏi đó.

Cảm ơn và trân trọng!


2
Hầu hết các câu trả lời và nhận xét ở đây tập trung vào câu hỏi cụ thể hơn về cuối. Đây chỉ là một lá cờ mà phân tích chuỗi thời gian nói về nhiều, nhiều hơn so với Box-Jenkins hoặc ARIMA. Toàn bộ các lĩnh vực phân tích chuỗi thời gian có trọng tâm khá khác nhau (hoặc ít nhất là tổng quát hơn). Các mô hình thành phần không quan sát chỉ là một trong một số ví dụ.
Nick Cox

Câu trả lời:


17

Tôi thực sự nghĩ rằng đây là một câu hỏi hay và xứng đáng có câu trả lời. Liên kết được cung cấp được viết bởi một nhà tâm lý học, người đang tuyên bố rằng một số phương pháp pha chế tại nhà là một cách tốt hơn để phân tích chuỗi thời gian so với Box-Jenkins. Tôi hy vọng rằng nỗ lực của tôi trong một câu trả lời sẽ khuyến khích những người khác, những người hiểu biết nhiều hơn về chuỗi thời gian, đóng góp.

zt= =α1zt-1++αkzt-k+εt
ztzt12karchức năng. Tôi đã thử nghiệm nó và nó có xu hướng đưa ra câu trả lời tương tự cho phương thức mặc định để phù hợp với mô hình AR trong R.

zttt

Nhưng có vẻ như anh ta cũng ủng hộ việc lắp quá mức và sau đó sử dụng việc giảm sai số bình phương trung bình giữa loạt được trang bị và dữ liệu làm bằng chứng cho thấy phương pháp của anh ta tốt hơn. Ví dụ:

Tôi cảm thấy các biểu đồ tương quan đã lỗi thời. Mục đích chính của họ là cho phép công nhân đoán mô hình nào sẽ phù hợp nhất với dữ liệu, nhưng tốc độ của máy tính hiện đại (ít nhất là trong hồi quy nếu không phù hợp với mô hình chuỗi thời gian) cho phép công nhân chỉ cần lắp một số mô hình và xem chính xác cách thức mỗi cái phù hợp như được đo bằng sai số bình phương trung bình. [Vấn đề viết hoa về cơ hội không liên quan đến lựa chọn này, vì hai phương pháp này dễ bị ảnh hưởng như nhau đối với vấn đề này.]

Đây không phải là một ý tưởng tốt bởi vì thử nghiệm của một mô hình được cho là nó có thể dự báo tốt như thế nào, chứ không phải nó phù hợp với dữ liệu hiện có như thế nào. Trong ba ví dụ của mình, anh ta sử dụng "lỗi bình phương gốc được điều chỉnh" làm tiêu chí cho chất lượng của sự phù hợp. Tất nhiên, việc điều chỉnh quá mức một mô hình sẽ làm cho ước tính lỗi trong mẫu nhỏ hơn, do đó, tuyên bố của anh ta rằng các mô hình của anh ta "tốt hơn" vì chúng có RMSE nhỏ hơn là sai.

Tóm lại, vì anh ta đang sử dụng tiêu chí sai để đánh giá mức độ tốt của một mô hình, anh ta đã đưa ra kết luận sai về hồi quy so với ARIMA. Tôi cá rằng, nếu anh ta đã kiểm tra khả năng dự đoán của các mô hình thay vào đó, ARIMA sẽ xuất hiện trên đỉnh. Có lẽ ai đó có thể thử nó nếu họ có quyền truy cập vào những cuốn sách mà anh ấy đề cập ở đây .

[Bổ sung: để biết thêm về ý tưởng hồi quy, bạn có thể muốn kiểm tra các bộ sách thời gian cũ hơn được viết trước khi ARIMA trở nên phổ biến nhất. Ví dụ, Kendall, Time-Series , 1973, Chương 11 có cả một chương về phương pháp này và so sánh với ARIMA.]


Câu hỏi là sự khác biệt (vốn có) là gì?
hbaghishani

Theo như tôi có thể nói tác giả không bao giờ mô tả phương pháp pha chế tại nhà của mình trong một ấn phẩm được đánh giá ngang hàng và các tài liệu tham khảo đến và từ các tài liệu thống kê xuất hiện tối thiểu và các ấn phẩm chính của ông về các chủ đề phương pháp có từ những năm 70. Nói một cách chính xác, không ai trong số các thành viên này chứng minh bất cứ điều gì nhưng không có đủ thời gian hoặc chuyên môn để tự đánh giá các yêu sách, tôi sẽ vô cùng miễn cưỡng khi sử dụng bất kỳ điều gì.
Gala

@hbaghishani sự khác biệt đáng kể là dữ liệu tự tương quan tức là trong mỗi chuỗi làm sai lệch cách giải thích tương quan chéo. Hơn nữa, Vi phạm Gaussian, ví dụ trung bình không đổi của erros, phương sai không đổi theo thời gian, tham số không đổi theo thời gian cần được xem xét / khắc phục.
IrishStat

@flounderer Mọi người viết sách giáo khoa để bán chúng và gặt hái những phần thưởng. Chúng đôi khi bao gồm các phương pháp lỗi thời đang được dạy không chính xác bởi vì vào một ngày trước đó, chúng được cho là chính xác. Để tăng doanh số, nhà xuất bản thường yêu cầu (từ kinh nghiệm cá nhân của tôi) lỗi thời nhưng phương pháp không chính xác vì các phương pháp này nằm trong giáo trình.
IrishStat

@IrishStat mô hình hóa dữ liệu tự tương quan có thể được thực hiện bằng mô hình hồi quy động. Ngoài ra, các mô hình khác, như các mô hình hỗn hợp, có thể được sử dụng cho dữ liệu đó. Vì vậy, tôi không nghĩ rằng tính năng này là sự khác biệt đáng kể.
hbaghishani

7

Giáo sư E. Parzen, có lẽ hơi ghen tị rằng ông đã không đề xuất các phương pháp cải tiến của Box và Jenkins, đã đề xuất phương pháp này phù hợp quá mức và sau đó từ chức. Nó không thành công vì nhiều lý do (nhiều trong số đó Flounderer đã tóm tắt rất hay), bao gồm cả việc không xác định và khắc phục các xung, dịch chuyển cấp độ, xung theo mùa và xu hướng thời gian địa phương. Ngoài ra, các thay đổi về tham số theo thời gian hoặc thay đổi về phương sai lỗi theo thời gian cần được xem xét.

Tôi đã viết một tác phẩm mà bạn có thể quan tâm. Nó được gọi là "Regression vs Box-Jenkins" và có sẵn từ http://www.autobox.com/cms/index.php/afs-university/intro-to-forecasting / doc_doad / 24-regression-vs-box-jenkins

Một nhận xét về thủ tục của Darlington phản ánh thời gian, thời gian * thời gian, thời gian * thời gian * thời gian * thời gian như những người dự đoán. Trong trường hợp không có Phát hiện can thiệp dẫn đến sự cô lập các hiệu ứng ngoại lai, hoàn toàn có thể (và không chính xác!) Để kết luận về sức mạnh thời gian cao hơn. Coi chừng những người không thống kê thực hiện phân tích thống kê vì bạn sẽ cảnh giác với các nhà thống kê thực hiện phẫu thuật não. Nói một cách công bằng, người ta cũng có thể thêm cảnh giác với các nhà thống kê / nhà toán học không theo thời gian cố gắng thực hiện phân tích chuỗi thời gian với đào tạo hạn chế trong phân tích chuỗi thời gian.

Các áp phích khác (đặc biệt là whuber) trong danh sách này đã nhiều lần cảnh báo không sử dụng "phương pháp phù hợp" này, chủ yếu là trong một thiết lập đơn biến. Cảnh báo này cũng áp dụng cho các mô hình nhân quả.

Hi vọng điêu nay co ich.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.