Có sự khác biệt giữa chuỗi thời gian tự động tương quan và lỗi tự động tương quan huyết thanh không?


9

Tôi khá chắc chắn rằng tôi đang thiếu một cái gì đó rõ ràng ở đây, nhưng tôi khá bối rối với các thuật ngữ khác nhau trong lĩnh vực chuỗi thời gian. Nếu tôi hiểu chính xác, lỗi tự động tương quan là một vấn đề trong các mô hình hồi quy (xem ví dụ ở đây ). Câu hỏi của tôi bây giờ là những gì xác định chính xác một lỗi tự động tương quan? Tôi biết định nghĩa của autocorrelation và tôi có thể áp dụng các công thức, nhưng đây là một vấn đề về sự hiểu biết với chuỗi thời gian trong hồi quy.

Ví dụ: chúng ta hãy lấy chuỗi thời gian của nhiệt độ hàng ngày: Nếu hôm nay là một ngày nóng (thời gian mùa hè!), Thì có lẽ ngày mai cũng nóng và ngược lại. Tôi đoán rằng tôi có một vấn đề khi gọi hiện tượng này là hiện tượng "lỗi tự động hoàn toàn" bởi vì nó không gây ra lỗi cho tôi, mà là một điều gì đó được mong đợi.

Chính thức hơn, giả sử thiết lập hồi quy với một biến phụ thuộc và một biến độc lập và mô hình.ytxt

yt= =α+βxt+εt

Có thể là được tự động tương thích, trong khi là iid? Nếu vậy, điều đó có nghĩa gì đối với tất cả các phương pháp điều chỉnh lỗi tiêu chuẩn cho tự động tương quan? Bạn vẫn phải làm điều đó hay chúng chỉ áp dụng cho các lỗi tự động? Hoặc bạn sẽ luôn mô hình tự động tương quan trong một cài đặt như vậy trong cụm từ lỗi, vì vậy về cơ bản nó sẽ không tạo ra sự khác biệt nếu là tự động tương quan hoặc ?xtεtxtet

Đây là câu hỏi đầu tiên của tôi ở đây. Tôi hy vọng nó không quá khó hiểu và tôi hy vọng tôi đã không bỏ lỡ bất cứ điều gì rõ ràng ... Tôi cũng đã thử google nó và tìm thấy một số liên kết thú vị (ví dụ, ở đây trên SA ), nhưng không có gì thực sự giúp tôi.

Câu trả lời:


7

Dường như với tôi rằng bạn đang cảm thấy khó chịu về sự khác biệt giữa tự phát (nhiệt độ hôm nay bị ảnh hưởng bởi nhiệt độ ngày hôm qua, hoặc việc tiêu thụ heroin của tôi hôm nay phụ thuộc vào việc sử dụng ma túy trước đây của tôi) và các lỗi tự động (có liên quan đến đường chéo các thuật ngữ về phương sai hiệp phương sai choεlà khác không. Bám sát ví dụ thời tiết của bạn, giả sử bạn mô hình nhiệt độ là một hàm của thời gian, nhưng nó cũng bị ảnh hưởng bởi những thứ như núi lửa phun trào, mà bạn đã rời khỏi mô hình của mình. Núi lửa gửi lên những đám mây bụi, ngăn chặn mặt trời, hạ nhiệt độ. Sự xáo trộn ngẫu nhiên này sẽ tồn tại trong hơn một khoảng thời gian. Điều này sẽ làm cho xu hướng thời gian của bạn xuất hiện ít dốc hơn so với nó nên được. Công bằng mà nói, có lẽ trường hợp cả lỗi tự phát và lỗi tự động là một vấn đề với nhiệt độ.

Lỗi tự động cũng có thể phát sinh trong dữ liệu không gian cắt ngang, trong đó một cú sốc ngẫu nhiên ảnh hưởng đến hoạt động kinh tế ở một khu vực sẽ lan sang các khu vực khác vì chúng có quan hệ kinh tế. Một cú sốc giết chết nho ở California cũng sẽ làm giảm doanh số bán thịt bò từ Montana. Bạn cũng có thể gây ra nhiễu loạn tự động tương quan nếu bạn bỏ qua một biến độc lập có liên quan và tự động tương quan từ mô hình chuỗi thời gian của bạn.


Cảm ơn bạn rất nhiều, Dimitriy. Bạn đã hiểu đúng: Tôi đã nhầm lẫn về sự khác biệt giữa lỗi tự động và lỗi tự động. Mặc dù vậy, chỉ để chắc chắn: Trong ví dụ của tôi, tôi sẽ mô hình như một chuỗi thời gian tự phát (trừu tượng hóa từ các vụ phun trào núi lửa, v.v.) vì thời gian mùa hè và mùa đông và sau đó sẽ không phải xử lý các lỗi tự động? xt
Christoph_J

1
@Christoph_J Lý tưởng nhất là bạn muốn hồi quy chống lại một quặng chậm hơn thời gian cho mô hình theo mùa hoạt động núi lửa. Nếu thay vào đó, chúng ta đã bỏ qua nguyên nhân gây ra lỗi tự động, một mô hình trung bình di chuyển có thể giúp đỡ. Trong trường hợp này, nó sẽ là một mô hình ARIMA.
Robert Kubrick

1
@Christoph_J Tôi không chắc là tôi hiểu câu hỏi của bạn. Ý của bạn là viết ở trên? Bạn cũng nên cho chúng tôi biết thêm về vấn đề thực tế mà bạn đang giải quyết. Ví dụ nhiệt độ của tôi chỉ là một mô hình đồ chơi để làm nổi bật các vấn đề. Có một số giải pháp để đối phó với AR, trong đó dễ nhất là đặc tả độ trễ phân tán Koyck, giúp tìm ra phương trình đơn giản với thuật ngữ lỗi . Tuy nhiên, bạn vẫn nên tiến hành một số loại thử nghiệm tự tương quan, như Durbin-Watson, mặc dù điều đó có thể mang lại cho bạn kết quả dương tính giả nếu bạn không hiểu đúng về đặc điểm kỹ thuật. ytMMột(1)
Dimitriy V. Masterov

Cám ơn hai bạn. @ DimitriyV.Masterov Tại thời điểm này, tôi không có vấn đề thực sự. Đó là lý do tôi cố gắng giải quyết vấn đề của mình một cách chung chung nhất có thể. Tôi nghĩ rằng tôi chỉ đấu tranh với chuỗi thời gian một mặt và mặt khác hồi quy. Đôi khi chúng dường như là hai vấn đề hoàn toàn khác nhau; nếu tôi hiểu đúng, có những trường hợp bạn chỉ cố gắng mô hình một chuỗi thời gian (nó có bao nhiêu độ trễ? nó có đứng yên không, v.v.). Ở một thái cực khác, đôi khi bạn dường như thụt lùi một chuỗi thời gian khác, mà không chú ý nhiều đến thực tế rằng đó là một TS.
Christoph_J

Và đôi khi tôi chỉ gặp một số vấn đề là cách tốt nhất để tiến lên phía trước: Tôi có phải mô hình hóa quy trình tự động trước hay tôi có thể sửa lỗi tự động trong các điều khoản lỗi không? Tuy nhiên, theo như câu hỏi của tôi, câu trả lời của bạn và Robert đã giúp ích rất nhiều và tôi nghĩ rằng trong lĩnh vực của tôi (mô hình nhân tố trong tài chính) nên xử lý các lỗi tự động, chứ không phải tự phát. Nếu một câu hỏi khác được đưa ra, tôi sẽ hỏi một câu hỏi mới.
Christoph_J

4

Chỉ cần thêm vào Dimitriy câu trả lời rất hay: tự động sửa lỗi đặt ra các vấn đề cho việc tính toán sai số chuẩn hệ số và do đó các mức ý nghĩa, hoặc giá trị p, làm cho việc lựa chọn IV trở nên đơn giản hơn. và giá trị F cũng bị ảnh hưởng.R2

Trong tất cả các giả định về hồi quy tuyến tính (homoscedasticity, tính độc lập của phần dư, độ tuyến tính của mối quan hệ IV -> DV, tính quy tắc của phần dư) tính tuyến tính và tính độc lập của phần dư là những tác động nghiêm trọng hơn nếu vi phạm.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.