Sự khác biệt cơ học giữa các cơ chế giữa các hồi quy tuyến tính với độ trễ và chuỗi thời gian là gì?


13

Tôi tốt nghiệp ngành kinh doanh và kinh tế, những người hiện đang học thạc sĩ về kỹ thuật dữ liệu. Trong khi nghiên cứu hồi quy tuyến tính (LR) và sau đó phân tích chuỗi thời gian (TS), một câu hỏi xuất hiện trong đầu tôi. Tại sao tạo một phương thức hoàn toàn mới, tức là chuỗi thời gian (ARIMA), thay vì sử dụng nhiều hồi quy tuyến tính và thêm các biến bị trễ cho nó (với thứ tự độ trễ được xác định bằng ACF và PACF)? Vì vậy, giáo viên đề nghị tôi viết một bài luận nhỏ về vấn đề này. Tôi sẽ không đến để tìm kiếm sự giúp đỡ tay không, vì vậy tôi đã nghiên cứu về chủ đề này.

Tôi đã biết rằng khi sử dụng LR, nếu các giả định Gauss-Markov bị vi phạm, hồi quy OLS là không chính xác và điều này xảy ra khi sử dụng dữ liệu chuỗi thời gian (tự động tương quan, v.v.). (một câu hỏi khác về vấn đề này, một giả định của GM là các biến độc lập nên được phân phối bình thường? hay chỉ là biến phụ thuộc có điều kiện cho các biến độc lập?)

Tôi cũng biết rằng khi sử dụng hồi quy độ trễ phân tán, đó là điều tôi nghĩ rằng tôi đang đề xuất ở đây và sử dụng OLS để ước tính các tham số, tính đa hình giữa các biến có thể (rõ ràng) phát sinh, vì vậy ước tính sẽ sai.

Trong một bài viết tương tự về TS và LR ở đây, @IrishStat nói:

... Mô hình hồi quy là trường hợp cụ thể của Mô hình hàm truyền còn được gọi là mô hình hồi quy động hoặc mô hình XARMAX. Điểm nổi bật là nhận dạng mô hình theo chuỗi thời gian tức là sự khác biệt thích hợp, độ trễ thích hợp của X, cấu trúc ARIMA thích hợp, xác định thích hợp của cấu trúc xác định không xác định như Xung, Chuyển dịch cấp độ, Xu hướng thời gian địa phương, Xung theo mùa và Kết hợp các thay đổi trong tham số hoặc phương sai lỗi phải được xem xét.

(Tôi cũng đã đọc bài viết của anh ấy trong Autobox về Box Jenkins vs LR.) Nhưng điều này vẫn không giải quyết được câu hỏi của tôi (hoặc ít nhất nó không làm rõ các cơ chế khác nhau của RL và TS đối với tôi).

Rõ ràng là ngay cả với các biến bị trễ, các vấn đề OLS phát sinh và nó không hiệu quả cũng không đúng, nhưng khi sử dụng khả năng tối đa, các vấn đề này có tồn tại không? Tôi đã đọc rằng ARIMA được ước tính thông qua khả năng tối đa, do đó, nếu ước tính độ trễ của LR bằng ML thay vì OLS, thì nó có mang lại các hệ số "chính xác" không (giả sử rằng chúng tôi cũng bao gồm các thuật ngữ lỗi bị trễ, như MA theo thứ tự q).

Tóm lại, là vấn đề OLS? Là vấn đề được giải quyết áp dụng ML?


4
Sự giống nhau kỳ lạ ở đó với John Maynard Keynes.
Nick Cox

Xin chào @NickCox, vâng, anh ấy là nhà kinh tế yêu thích của tôi, tôi nghĩ anh ấy là một người đàn ông tuyệt vời và cực kỳ tài năng theo nhiều cách ... có giúp được gì cho câu hỏi của tôi không? Những gì tôi đang cố gắng tìm hiểu là tại sao mô hình bị trễ không hoạt động với ước tính OLS và nếu nó sẽ ước tính chính xác với ước tính khả năng tối đa. Tôi hiểu rằng mô hình tốt nhất là một chức năng chuyển giao, và hiện đang nghiên cứu nó. Nhưng câu hỏi lý thuyết vẫn còn đó về OLS. Nếu không có hiện tượng tự tương quan gây ra sự chậm trễ loại bỏ nó (giả sử rằng đa hướng. Không có mặt), nó có hoạt động không? hoặc vẫn còn và bên dưới
Miguel M.

@NickCox ... ảnh hưởng / vi phạm các giả định gaussian mà OLS không thể làm việc và không thể phù hợp với phương pháp này? Như bạn có thể thấy tôi hơi lạc lõng với điều này, nếu quá lâu để trả lời, xin vui lòng nếu bạn có thể cung cấp một số bài giảng có thể khai sáng tôi cũng đánh giá cao
Miguel M.

1
Về mặt cơ học, tôi xin đề xuất rằng mô hình ARMA cho người dùng được đề xuất (phân biệt thích hợp) biến X phản ánh không ổn định. Nếu bộ lọc đó được áp dụng cho BOTH loạt phân biệt thích hợp, cặp chuỗi kết quả thường có thể được nghiên cứu thông qua các thủ tục tương quan chéo mang lại một cấu trúc độ trễ đề xuất (sự hiểu biết). Cấu trúc độ trễ này sau đó có thể được áp dụng cho chuỗi gốc được phân biệt thích hợp để đưa ra gợi ý về chuỗi không xác định / nền (quy trình lỗi dự kiến.). Quá trình lỗi này sau đó có thể được nghiên cứu để mang lại ARMA thích hợp.
IrishStat

@IrishStat vì vậy hãy để tôi nói lại những gì bạn vừa nói. Chúng ta có biến phụ thuộc Yt và biến độc lập Xt, chúng ta khác nhau cả Yt và Xt cho đến khi chúng ta có sự ổn định trong cả hai, và sau đó chúng ta có thể áp dụng hàm tương quan chéo để tìm ra cấu trúc độ trễ. Sau đó, chúng tôi hồi quy Yt thành Xt và chúng tôi nghiên cứu thuật ngữ lỗi. Nếu chúng ta tìm thấy cấu trúc ARMA trong thuật ngữ lỗi, chúng ta sẽ áp dụng nó trong mô hình cho đến khi chúng ta có nhiễu trắng, đúng không? Nhưng, câu hỏi của tôi vẫn là, mô hình cuối cùng được trang bị thông qua OLS? Nếu không, tại sao không, và chúng ta sử dụng phương pháp nào?
Miguel M.

Câu trả lời:


8

Tại sao tạo một phương thức hoàn toàn mới, tức là chuỗi thời gian (ARIMA), thay vì sử dụng nhiều hồi quy tuyến tính và thêm các biến bị trễ cho nó (với thứ tự độ trễ được xác định bằng ACF và PACF)?

Một điểm ngay lập tức là hồi quy tuyến tính chỉ hoạt động với các biến quan sát trong khi ARIMA kết hợp các biến không quan sát được trong phần trung bình di chuyển; do đó, ARIMA linh hoạt hơn, hoặc tổng quát hơn, theo một cách nào đó. Mô hình AR có thể được xem như một mô hình hồi quy tuyến tính và các hệ số của nó có thể được ước tính bằng OLS; trong đó bao gồm độ trễ của biến phụ thuộc được quan sát . Trong khi đó, các mô hình MA hoặc ARMA không phù hợp với khung OLS do một số biến, cụ thể là các thuật ngữ lỗi bị trễ, không quan sát được và do đó, công cụ ước tính OLS là không khả thi.β^OLS=(XX)1XyX

một giả định GM là các biến độc lập nên được phân phối bình thường? hoặc chỉ là biến phụ thuộc có điều kiện cho những người độc lập?

Giả định quy tắc đôi khi được gọi cho các lỗi mô hình, không phải cho các biến độc lập. Tuy nhiên, tính quy phạm không bắt buộc đối với tính nhất quán và hiệu quả của công cụ ước tính OLS cũng như đối với định lý Gauss-Markov. Bài viết trên Wikipedia về định lý Gauss-Markov nói rõ rằng "Các lỗi không cần phải bình thường".

tính đa hình giữa các biến có thể (rõ ràng) phát sinh, vì vậy ước tính sẽ sai.

Một mức độ đa hình cao có nghĩa là phương sai tăng cao của công cụ ước tính OLS. Tuy nhiên, công cụ ước tính OLS vẫn là BLUE miễn là tính đa hình không hoàn hảo. Do đó, tuyên bố của bạn không đúng.

Rõ ràng là ngay cả với các biến bị trễ, các vấn đề OLS phát sinh và nó không hiệu quả cũng không đúng, nhưng khi sử dụng khả năng tối đa, các vấn đề này có tồn tại không?

Một mô hình AR có thể được ước tính bằng cả OLS và ML; cả hai phương pháp này đều cho các ước lượng phù hợp. Các mô hình MA và ARMA không thể được ước tính bằng OLS, vì vậy ML là lựa chọn chính; một lần nữa, nó là phù hợp. Tài sản thú vị khác là hiệu quả, và ở đây tôi không hoàn toàn chắc chắn (nhưng rõ ràng thông tin nên có sẵn ở đâu đó vì câu hỏi khá chuẩn). Tôi sẽ thử bình luận về "tính đúng đắn", nhưng tôi không chắc ý của bạn là gì.


Xin chào ông Hardy, cảm ơn bạn rất nhiều vì câu trả lời. Về các giá trị quan sát so với không quan sát, chỉ để tóm tắt. Trong ARIMA và chuỗi thời gian (cụ thể hơn là XARIMAX), chúng tôi sử dụng phương pháp "động", vì chúng tôi sử dụng lỗi dự đoán và trong hồi quy tuyến tính, chúng tôi không sử dụng chúng - tuy nhiên chúng tôi có thể sử dụng chúng. Tôi không hiểu vấn đề ở đây. Hoặc như @IrishStat nói, sự khác biệt duy nhất là đường dẫn đến các chiến lược sửa đổi mô hình và nhận dạng?
Miguel M.

Và những gì về ước tính, OLS (một lần nữa) có đúng không khi bao gồm các lỗi bị trễ trong mô hình? Về đa tuyến, tôi có nghĩa là các hệ số ước tính có thể không chính xác, vì ước tính của chúng có phương sai lớn. Theo phương pháp đúng, ý tôi là, nếu sử dụng OLS sẽ đưa ra các ước tính không thiên vị và hiệu quả so với ML khi sử dụng các mô hình độ trễ được đề xuất.
Miguel M.

@MiguelM, tôi đang đi du lịch, tôi sẽ cố gắng quay lại sau.
Richard Hardy

1
Về "trong hồi quy tuyến tính, chúng tôi không sử dụng chúng - nhưng chúng tôi vẫn có thể sử dụng chúng": chúng tôi không quan sát các biến này và do đó chúng không thể được sử dụng trong khung hồi quy tuyến tính do cơ học ở đó (như tôi đã lưu ý trong câu trả lời, công cụ ước tính là không khả thi); tuy nhiên, chúng có thể được sử dụng trong khung ARIMA. Về "OLS (một lần nữa) có đúng không khi bao gồm các lỗi bị trễ trong mô hình?", Vâng, điều đó đúng. Về "tính chính xác", nếu mô hình được chỉ định chính xác và cả OLS và ML đều khả thi, cả hai sẽ hoạt động tốt. Theo sai chính tả mọi thứ có xu hướng đi sai.
Richard Hardy

1
Tôi phải rất tệ trong việc giải thích và tôi cảm thấy khó khăn khi đưa ra một lời giải thích khác trong trường hợp này ... Giả sử bạn phải chạy hồi quy và bạn không quan sát . Sau đó, không có cách nào bạn có thể chạy hồi quy. Đây là điểm chính. OLS không cho phép thiếu các biến. Tuy nhiên, một số cấu trúc nhất định có các biến bị thiếu có thể được phục hồi bằng ML và một ví dụ về cấu trúc như vậy là mô hình MA. (Hồi quy không chỉ khả thi đối với OLS mà còn đối với ước tính ML khi không được quan sát.)y=β0+β1x+εxy=β0+β1x+εx
Richard Hardy

5

Đó là một câu hỏi tuyệt vời. Sự khác biệt thực sự giữa các mô hình ARIMA và hồi quy tuyến tính đa nằm ở cấu trúc lỗi của bạn. Bạn có thể thao tác các biến độc lập trong mô hình hồi quy tuyến tính đa biến để chúng phù hợp với dữ liệu chuỗi thời gian của bạn, đó là những gì @IrishStat đang nói. Tuy nhiên, sau đó, bạn cần kết hợp các lỗi ARIMA vào mô hình hồi quy bội để có được hệ số và kết quả kiểm tra chính xác. Một cuốn sách miễn phí tuyệt vời về điều này là: https://www.otexts.org/fpp/9/1 . Tôi đã liên kết phần thảo luận về việc kết hợp ARIMA và nhiều mô hình hồi quy.


1

Câu hỏi hay, tôi thực sự đã xây dựng cả hai trong công việc hàng ngày của mình là Nhà khoa học dữ liệu. Các mô hình chuỗi thời gian rất dễ xây dựng (gói dự báo trong R cho phép bạn xây dựng một trong ít hơn 5 giây), giống hoặc chính xác hơn các mô hình hồi quy, v.v. Nói chung, người ta phải luôn xây dựng chuỗi thời gian, sau đó hồi quy. Cũng có những ý nghĩa triết học của chuỗi thời gian, nếu bạn có thể dự đoán mà không biết gì, thì điều đó có nghĩa là gì?

Tôi nhận Dar Dar. 1) "Hồi quy linh hoạt và mạnh mẽ hơn nhiều, tạo ra các mô hình tốt hơn. Điểm này được phát triển ở nhiều điểm trong suốt công việc."

Không, hoàn toàn ngược lại. Các mô hình hồi quy tạo ra nhiều giả định hơn nhiều so với các mô hình chuỗi thời gian. Các giả định càng ít, khả năng chịu được động đất (thay đổi chế độ) càng cao. Hơn nữa, các mô hình chuỗi thời gian đáp ứng nhanh hơn với sự thay đổi đột ngột.

2) "Hồi quy dễ dàng hơn nhiều so với ARIMA, ít nhất là đối với những người đã quen với việc sử dụng hồi quy trong các lĩnh vực khác." Đây là lý luận tròn.

3) "Hồi quy sử dụng thuật toán tính toán" đóng "về cơ bản được đảm bảo để mang lại kết quả nếu có thể, trong khi ARIMA và nhiều phương pháp khác sử dụng thuật toán lặp thường không đạt được giải pháp. Tôi thường thấy phương pháp ARIMA" bị treo "trên dữ liệu đã cho phương pháp hồi quy không có vấn đề."

Hồi quy cho bạn một câu trả lời, nhưng nó có phải là câu trả lời đúng không? Nếu tôi xây dựng mô hình hồi quy tuyến tính và máy học và tất cả chúng đều đi đến cùng một kết luận, điều đó có nghĩa là gì?

Vì vậy, tóm lại, chuỗi hồi quy có và chuỗi thời gian có thể trả lời cùng một câu hỏi và về mặt kỹ thuật, chuỗi thời gian là hồi quy kỹ thuật (mặc dù hồi quy tự động). Các mô hình chuỗi thời gian ít phức tạp hơn và do đó mạnh hơn các mô hình hồi quy. Nếu bạn nghĩ về chuyên môn hóa, thì các mô hình TS chuyên về dự báo trong khi hồi quy chuyên về hiểu biết. Nó sôi sùng sục cho dù bạn muốn giải thích hay dự đoán.


1
"Các mô hình chuỗi thời gian ít phức tạp hơn và do đó mạnh hơn mô hình hồi quy" .... Điều bạn muốn nói là "Mô hình ARIMA ít phức tạp hơn và do đó mạnh hơn mô hình hồi quy". Kết hợp ARIMA và hồi quy được gọi là Mô hình hàm truyền ... đây là lựa chọn khôn ngoan do đó kết hợp cả hai yếu tố hiểu biết (hồi quy) và các yếu tố nền không xác định / không xác định (ARIMA).
IrishStat

2
@IrishStat Xin chào ông Reilly, tôi đã đọc câu trả lời của bạn cho một số bài đăng ở đây trong stackexchange và tôi cũng đã đọc nhiều bài viết trong Autobox cũng như các liên kết cho khóa học chuỗi thời gian PSU, nhưng tôi vẫn không hiểu tại sao (hoặc nếu) một hồi quy tuyến tính (sử dụng OLS), với việc sử dụng các biến bị trễ và các thuật ngữ lỗi bị trễ nếu cần thiết sẽ không hoạt động
Miguel M.

@IrishStat có phải là phương pháp OLS không hoạt động?
Miguel M.

1
IrishStat để mở rộng theo quan điểm của bạn, mục tiêu sẽ là nhân quả Granger. Ví dụ, ngay cả khi một hệ số có ý nghĩa thống kê, nó có thể không nhất thiết có ý nghĩa trong việc cải thiện độ chính xác dự báo. Trong nghiên cứu của tôi, tôi đã phát hiện ra rằng các mô hình hồi quy (tuyến tính, lasso, v.v.), có xu hướng nói rằng mọi thứ quan trọng hơn thực tế, trong khi rừng ngẫu nhiên có xu hướng hạ cấp chúng và xác định các đòn bẩy thực sự. Ngoài ra, rừng ngẫu nhiên có độ chính xác mẫu tương tự như các mô hình tuyến tính. Hạn chế duy nhất là bạn không thể biết hệ số thực sự là gì.
Mô hình Markov ẩn

2
@MiguelM. Nó chắc chắn có thể hoạt động vì Hàm truyền là mô hình Lag phân phối đa thức có lẽ bao gồm cả sự dịch chuyển mức độ / xu hướng thời gian / xung theo mùa được phát hiện theo kinh nghiệm trong khi điều chỉnh các xung (bất thường một lần) Tôi nghĩ rằng sự khác biệt chính là đường dẫn đến chiến lược sửa đổi mô hình và nhận dạng
IrishStat

0

Trong suy nghĩ, sự khác biệt sâu sắc nhất giữa các hàm truyền và hồi quy tuyến tính đa biến (trong cách sử dụng thông thường) nằm ở các mục tiêu của chúng, nhiều hồi quy được định hướng để tìm các yếu tố quyết định quan sát nhân quả chính của biến phụ thuộc trong khi các hàm truyền chỉ muốn dự báo hiệu ứng trên một phụ thuộc biến số của biến thể của một biến ngoại sinh cụ thể ... Tóm lại, hồi quy bội được định hướng để giải thích toàn diện và chuyển hàm để dự báo các hiệu ứng rất cụ thể ...


Tôi không nghĩ rằng điều này là khá chính xác, bởi vì cả hai phương pháp đều mang lại hệ số thực tế có thể được giải thích. Ngoài ra, các hàm truyền DO phụ thuộc rất nhiều vào phân tích nguyên nhân và thực sự tốt hơn trong việc phân biệt như hồi quy tuyến tính nhiều. Ngoài ra, bài đăng này yêu cầu sự khác biệt cơ học / phương pháp giữa hai phương pháp như vậy
Miguel M.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.