Tại sao việc sử dụng dữ liệu cắt ngang để suy luận / dự đoán các thay đổi theo chiều dọc là một điều xấu?


11

Tôi đang tìm kiếm một bài báo mà tôi hy vọng tồn tại, nhưng không biết nếu nó có. Nó có thể là một tập hợp các nghiên cứu trường hợp và / hoặc một lập luận từ lý thuyết xác suất, về lý do tại sao sử dụng dữ liệu cắt ngang để suy luận / dự đoán các thay đổi theo chiều dọc có thể là một điều xấu (nghĩa là không nhất thiết phải như vậy, nhưng có thể).

Tôi đã nhìn thấy sai lầm theo một vài cách lớn: suy luận đã được đưa ra bởi vì những người giàu hơn ở Anh đi du lịch nhiều hơn, khi xã hội ngày càng giàu hơn, toàn bộ dân số sẽ đi du lịch nhiều hơn. Suy luận đó hóa ra không đúng sự thật trong một thời gian dài - hơn một thập kỷ. Và một mô hình tương tự với việc sử dụng điện trong nước: dữ liệu cắt ngang ngụ ý sự gia tăng lớn với thu nhập, điều đó không biểu hiện theo thời gian.

Có một số điều đang diễn ra, bao gồm các hiệu ứng đoàn hệ và các ràng buộc về phía cung.

Sẽ rất hữu ích khi có một tài liệu tham khảo duy nhất biên soạn các nghiên cứu trường hợp như thế; và / hoặc sử dụng lý thuyết xác suất để minh họa tại sao việc sử dụng dữ liệu cắt ngang để suy luận / dự đoán các thay đổi theo chiều dọc có thể rất sai lệch.

Liệu một bài báo như vậy tồn tại, và nếu vậy, nó là gì?


2
Tôi tin rằng các nhà kinh tế sẽ nghĩ về những hiện tượng này như là một loại hiệu ứng cân bằng chung. Số liệu thống kê mọi người gọi đây là vi phạm Giả định giá trị điều trị đơn vị ổn định. Tôi nghĩ rằng vấn đề bảng điều khiển và mặt cắt ngang là một chút cá trích đỏ.
Dimitriy V. Masterov 27/2/2015

Câu trả lời:


2

Bạn trả lời một phần câu hỏi của riêng bạn bằng cách yêu cầu thay đổi "theo chiều dọc". Dữ liệu mặt cắt ngang được gọi vì chúng chụp nhanh đúng lúc, theo nghĩa đen là mặt cắt ngang cắt ra khỏi một xã hội phát triển theo thời gian với nhiều mối quan hệ. Do đó, suy luận tốt nhất bạn có thể hy vọng sẽ làm là theo giả định rằng bất cứ điều gì bạn đang nghiên cứu là bất biến thời gian, hoặc ít nhất đã kết thúc sự tiến hóa của nó.

Mặt khác, dữ liệu bạn đang tìm kiếm là dữ liệu theo chiều dọc hoặc dữ liệu bảng điều khiển cho Nhà kinh tế.

Một tài liệu tham khảo tốt giải thích hầu hết các phương pháp nhưng cũng nêu bật hai ví dụ nổi bật từ Kinh tế học ở đây . Ví dụ 2.1 có tỷ lệ đầu tư của công ty.

yi,t=αyi,t1+xi,tγ+ηi+vi,t.

α

Bây giờ, hãy tắt sự phụ thuộc thời gian trong giây lát nhưng hãy nhớ rằng phương trình này có thể có khả năng là mô hình thực sự.

tηis

ηi

Bây giờ, đây là sự khác biệt chính giữa dữ liệu mặt cắt và bảng điều khiển. Thực tế là bạn có thể loại bỏ hiệu ứng bất biến theo thời gian bởi vì bạn có biến thể thời gian đó cho phép bạn loại bỏ một số sai lệch nhất định mà ước tính mặt cắt ngang không cho phép bạn phát hiện. Do đó, trước khi bạn dự tính một thay đổi chính sách như thuế cao hơn khi đi du lịch vì bạn mong đợi mọi người đi du lịch và bạn muốn có thêm doanh thu của chính phủ, sẽ hữu ích hơn khi thấy hiện tượng này trong một vài năm để bạn có thể chắc chắn rằng mình không nắm bắt sự không đồng nhất không quan sát được trong mẫu của bạn mà bạn hiểu là xu hướng di chuyển.

Để ước tính các mô hình này, tốt nhất là đi qua tài liệu tham khảo. Nhưng hãy cẩn thận: các giả định khác nhau về hành vi của mọi người sẽ làm cho các thủ tục ước tính khác nhau được chấp nhận hay không.

Tôi hi vọng cái này giúp được!


1

Nghe có vẻ rất giống với định nghĩa của một quá trình phi ergodic (các biện pháp đối với việc thực hiện không bằng các biện pháp theo thời gian). Đáng buồn thay, rất ít hiện tượng trong thế giới thực thú vị là ergodic. Tôi đoán đây có thể là một trường hợp để lấy mẫu và suy luận ở quy mô nhỏ hơn, trong đó các đơn giản hóa nhất định có thể được thực hiện. Tôi đang suy nghĩ về các ví dụ về quy mô không gian hoặc thời gian nhỏ, trong đó hành vi hỗn loạn không được quan sát để các yếu tố dự đoán có thể được tuyến tính hóa. Nhưng tôi chỉ lan man ở đây .. Tôi sợ tôi cũng không thể giúp bạn với tài liệu cụ thể về chủ đề này. Xin lỗi: / Tuy nhiên, câu hỏi thú vị

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.