Làm thế nào để bạn chọn một đơn vị phân tích (mức độ tổng hợp) trong một chuỗi thời gian?


13

Nếu bạn có thể đo một chuỗi thời gian quan sát ở bất kỳ mức độ chính xác nào về thời gian và mục tiêu nghiên cứu của bạn là xác định mối quan hệ giữa X và Y, thì có bất kỳ lý do thực nghiệm nào để chọn mức độ tổng hợp cụ thể so với mức độ khác hay không sự lựa chọn chỉ đơn giản là dựa trên lý thuyết và / hoặc những hạn chế thực tế?

Tôi có ba câu hỏi phụ cho câu hỏi chính này:

  1. Có bất kỳ biến thể không ngẫu nhiên nào trong X hoặc Y trong một mức độ lớn hơn đủ để chọn một mức tổng hợp nhỏ hơn (trong đó không ngẫu nhiên là bất kỳ mô hình thời gian nào của các quan sát)?

  2. Có sự khác biệt nào trong mối quan hệ giữa X và Y ở mức độ tổng hợp nhỏ hơn đủ để lý giải đơn vị phân tích nhỏ hơn không? Nếu một số biến thể được chấp nhận, làm thế nào để một người quyết định bao nhiêu biến thể là quá nhiều?

  3. Mọi người có thể trích dẫn các lập luận mà họ cảm thấy hấp dẫn / được xác định rõ ràng cho một đơn vị phân tích so với đơn vị phân tích khác, vì lý do thực nghiệm hoặc vì lý do lý thuyết?

Tôi nhận thức rõ về vấn đề đơn vị diện tích có thể thay đổi trong phân tích không gian ( Openshaw 1984 ). Tôi không tự nhận mình là chuyên gia về vật liệu, nhưng tất cả những gì tôi nghĩ cho đến nay là một đơn vị phân tích nhỏ hơn luôn tốt hơn, vì người ta ít có khả năng phạm tội ngụy biện sinh thái ( Robinson 1950 ). Nếu ai đó có một tài liệu tham khảo hoặc câu trả lời thích hợp trực tiếp liên quan đến các đơn vị địa lý tổng hợp, tôi cũng sẽ đánh giá cao câu trả lời đó.

Câu trả lời:


9

Giới thiệu

Tôi quan tâm đến chủ đề này khoảng 7 năm và dẫn đến luận án tiến sĩ Chuỗi thời gian: tổng hợp, phân tổ và bộ nhớ dài , trong đó chú ý đến một câu hỏi cụ thể về vấn đề phân tổ cắt ngang cho sơ đồ AR (1).

Dữ liệu

Làm việc với các cách tiếp cận khác nhau để tổng hợp câu hỏi đầu tiên bạn cần làm rõ là loại dữ liệu nào bạn xử lý (dự đoán của tôi là không gian, ly kỳ nhất). Trong thực tế, bạn có thể xem xét tổng hợp thời gian (xem Silvestrini, A. và Veridas, D. (2008) ), mặt cắt ngang (Tôi yêu bài viết của Granger, CWJ (1990) ) hoặc cả thời gian và không gian (tổng hợp không gian được khảo sát độc đáo trong Giacomini, R. và Granger, CWJ (2004) ).

Đáp án (dài dòng)

Bây giờ, trả lời câu hỏi của bạn, tôi đặt một số trực giác thô trước. Vì các vấn đề tôi gặp trong thực tế thường dựa trên dữ liệu không chính xác (giả định của Andy

bạn có thể đo một chuỗi thời gian quan sát ở bất kỳ mức độ chính xác nào về thời gian

Có vẻ quá mạnh đối với kinh tế lượng vĩ mô, nhưng tốt cho kinh tế lượng và tài chính vi mô hoặc bất kỳ lĩnh vực thử nghiệm nào, bạn có kiểm soát độ chính xác khá tốt không) Tôi phải nhớ rằng chuỗi thời gian hàng tháng của tôi kém chính xác hơn so với khi tôi làm việc với dữ liệu hàng năm. Bên cạnh chuỗi thời gian thường xuyên hơn ít nhất là trong kinh tế vĩ mô có mô hình theo mùa , điều đó có thể dẫn đến giả mạokết quả (các phần theo mùa không tương quan với chuỗi), vì vậy bạn cần điều chỉnh theo mùa dữ liệu của mình - một nguồn chính xác nhỏ hơn cho dữ liệu tần số cao hơn. Làm việc với dữ liệu cắt ngang cho thấy mức độ phân tổ cao mang lại nhiều vấn đề hơn với rất nhiều vấn đề có thể xảy ra. Chẳng hạn, một hộ gia đình cụ thể trong bảng dữ liệu có thể mua xe một lần trong 5-10 năm, nhưng tổng cầu về xe mới (đã qua sử dụng) sẽ mượt mà hơn nhiều (ngay cả đối với một thị trấn nhỏ hoặc khu vực).

Tập hợp điểm yếu nhất luôn dẫn đến việc mất thông tin, bạn có thể có GDP được sản xuất bởi mặt cắt ngang của các quốc gia EU trong cả thập kỷ (khoảng thời gian 2001 - 2010), nhưng bạn sẽ mất tất cả các tính năng động có thể có trong phân tích của bạn khi xem xét bộ dữ liệu bảng chi tiết. Tập hợp mặt cắt ngang quy mô lớn có thể trở nên thú vị hơn nữa: bạn, đại khái, lấy những thứ đơn giản (AR bộ nhớ ngắn (1)) trung bình chúng trên dân số khá lớn và có được tác nhân bộ nhớ dài "đại diện" không giống với vi mô đơn vị (thêm một viên đá cho khái niệm đại lý). Vì vậy, tổng hợp ~ mất thông tin ~ các thuộc tính khác nhau của các đối tượng và bạn muốn kiểm soát mức độ mất mát này và / hoặc các thuộc tính mới. Theo tôi, tốt hơn là nên có dữ liệu vi mô chính xác ở tần số cao nhất có thể, nhưng ...

Về mặt kỹ thuật tạo ra bất kỳ phân tích hồi quy nào bạn cần nhiều chỗ hơn (mức độ tự do) để ít nhiều tin tưởng rằng (ít nhất) về mặt thống kê kết quả của bạn không phải là rác, mặc dù chúng vẫn có thể là lý thuyết và rác :) Vì vậy, tôi đặt ngang nhau trọng số cho câu hỏi 1 và 2 (thường chọn dữ liệu hàng quý cho phân tích vĩ mô). Trả lời câu hỏi phụ thứ 3, tất cả những gì bạn quyết định trong các ứng dụng thực tế, điều quan trọng hơn với bạn: dữ liệu chính xác hơn hoặc mức độ tự do. Nếu bạn tính đến giả định đã đề cập, dữ liệu chi tiết hơn (hoặc tần số cao hơn) sẽ tốt hơn.

Có lẽ câu trả lời sẽ được chỉnh sửa sau khi thảo luận nếu có.


Cảm ơn bạn đã phản hồi. Tôi sẽ mất ít nhất vài ngày để xử lý các tài liệu bạn đã trình bày. Tôi cũng muốn nói rằng luận văn của bạn rất hay và sau khi đọc phần giới thiệu của bạn, tôi mong được đọc phần còn lại.
Andy W
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.