Giới thiệu
Tôi quan tâm đến chủ đề này khoảng 7 năm và dẫn đến luận án tiến sĩ Chuỗi thời gian: tổng hợp, phân tổ và bộ nhớ dài , trong đó chú ý đến một câu hỏi cụ thể về vấn đề phân tổ cắt ngang cho sơ đồ AR (1).
Dữ liệu
Làm việc với các cách tiếp cận khác nhau để tổng hợp câu hỏi đầu tiên bạn cần làm rõ là loại dữ liệu nào bạn xử lý (dự đoán của tôi là không gian, ly kỳ nhất). Trong thực tế, bạn có thể xem xét tổng hợp thời gian (xem Silvestrini, A. và Veridas, D. (2008) ), mặt cắt ngang (Tôi yêu bài viết của Granger, CWJ (1990) ) hoặc cả thời gian và không gian (tổng hợp không gian được khảo sát độc đáo trong Giacomini, R. và Granger, CWJ (2004) ).
Đáp án (dài dòng)
Bây giờ, trả lời câu hỏi của bạn, tôi đặt một số trực giác thô trước. Vì các vấn đề tôi gặp trong thực tế thường dựa trên dữ liệu không chính xác (giả định của Andy
bạn có thể đo một chuỗi thời gian quan sát ở bất kỳ mức độ chính xác nào về thời gian
Có vẻ quá mạnh đối với kinh tế lượng vĩ mô, nhưng tốt cho kinh tế lượng và tài chính vi mô hoặc bất kỳ lĩnh vực thử nghiệm nào, bạn có kiểm soát độ chính xác khá tốt không) Tôi phải nhớ rằng chuỗi thời gian hàng tháng của tôi kém chính xác hơn so với khi tôi làm việc với dữ liệu hàng năm. Bên cạnh chuỗi thời gian thường xuyên hơn ít nhất là trong kinh tế vĩ mô có mô hình theo mùa , điều đó có thể dẫn đến giả mạokết quả (các phần theo mùa không tương quan với chuỗi), vì vậy bạn cần điều chỉnh theo mùa dữ liệu của mình - một nguồn chính xác nhỏ hơn cho dữ liệu tần số cao hơn. Làm việc với dữ liệu cắt ngang cho thấy mức độ phân tổ cao mang lại nhiều vấn đề hơn với rất nhiều vấn đề có thể xảy ra. Chẳng hạn, một hộ gia đình cụ thể trong bảng dữ liệu có thể mua xe một lần trong 5-10 năm, nhưng tổng cầu về xe mới (đã qua sử dụng) sẽ mượt mà hơn nhiều (ngay cả đối với một thị trấn nhỏ hoặc khu vực).
Tập hợp điểm yếu nhất luôn dẫn đến việc mất thông tin, bạn có thể có GDP được sản xuất bởi mặt cắt ngang của các quốc gia EU trong cả thập kỷ (khoảng thời gian 2001 - 2010), nhưng bạn sẽ mất tất cả các tính năng động có thể có trong phân tích của bạn khi xem xét bộ dữ liệu bảng chi tiết. Tập hợp mặt cắt ngang quy mô lớn có thể trở nên thú vị hơn nữa: bạn, đại khái, lấy những thứ đơn giản (AR bộ nhớ ngắn (1)) trung bình chúng trên dân số khá lớn và có được tác nhân bộ nhớ dài "đại diện" không giống với vi mô đơn vị (thêm một viên đá cho khái niệm đại lý). Vì vậy, tổng hợp ~ mất thông tin ~ các thuộc tính khác nhau của các đối tượng và bạn muốn kiểm soát mức độ mất mát này và / hoặc các thuộc tính mới. Theo tôi, tốt hơn là nên có dữ liệu vi mô chính xác ở tần số cao nhất có thể, nhưng ...
Về mặt kỹ thuật tạo ra bất kỳ phân tích hồi quy nào bạn cần nhiều chỗ hơn (mức độ tự do) để ít nhiều tin tưởng rằng (ít nhất) về mặt thống kê kết quả của bạn không phải là rác, mặc dù chúng vẫn có thể là lý thuyết và rác :) Vì vậy, tôi đặt ngang nhau trọng số cho câu hỏi 1 và 2 (thường chọn dữ liệu hàng quý cho phân tích vĩ mô). Trả lời câu hỏi phụ thứ 3, tất cả những gì bạn quyết định trong các ứng dụng thực tế, điều quan trọng hơn với bạn: dữ liệu chính xác hơn hoặc mức độ tự do. Nếu bạn tính đến giả định đã đề cập, dữ liệu chi tiết hơn (hoặc tần số cao hơn) sẽ tốt hơn.
Có lẽ câu trả lời sẽ được chỉnh sửa sau khi thảo luận nếu có.