Khi nào cần bao gồm độ trễ của biến phụ thuộc trong mô hình hồi quy và độ trễ nào?


14

Dữ liệu chúng tôi muốn sử dụng làm biến phụ thuộc trông như thế này (đó là dữ liệu đếm). Chúng tôi sợ rằng vì nó có thành phần tuần hoàn và cấu trúc xu hướng, hồi quy hóa ra lại bị sai lệch.

nhập mô tả hình ảnh ở đây

Chúng tôi sẽ sử dụng hồi quy nhị thức âm trong trường hợp nó giúp. Dữ liệu là một bảng cân bằng, một hình nộm cho mỗi cá nhân (tiểu bang). Hình ảnh hiển thị hiển thị tổng của biến phụ thuộc cho tất cả các trạng thái nhưng hầu hết các trạng thái một mình có hành vi tương tự. Chúng tôi đang xem xét một mô hình hiệu ứng cố định. Các biến phụ thuộc không tương quan mạnh với nhau, một phần của nghiên cứu là tìm ra mối quan hệ bất ngờ giữa các biến này, vì vậy một mối quan hệ yếu thực sự là một điều gì đó tốt.

  1. Các nguy cơ chính xác của việc không bao gồm một biến lag của biến phụ thuộc là gì?
  2. Nếu cần bao gồm một thì có một bài kiểm tra để biết cái nào.?

Triển khai đang được thực hiện trong R.

Lưu ý : Tôi đã đọc bài đăng này nhưng nó không giúp ích cho vấn đề của chúng tôi.

Câu trả lời:


14

Một mô hình bảng điều khiển động có thể có ý nghĩa nếu bạn có một mô hình trả đũa bằng mắt cho các vụ giết người. Ví dụ, nếu tỷ lệ giết người chủ yếu do các mối thù của các băng đảng gây ra, thì các vụ giết người tại thời điểm có thể là một chức năng của những cái chết ở t - 1 , hoặc độ trễ khác. tt1

Tôi sẽ trả lời câu hỏi của bạn ra khỏi trật tự. Giả sử DGP là

yit=δyit1+xitβ+μi+vit,

trong đó các lỗi v độc lập với nhau và giữa chúng. Bạn đang quan tâm đến việc thực hiện khảo nghiệm về việc liệu δ = 0 (câu hỏi 2).μvδ=0

Nếu bạn sử dụng OLS, thật dễ dàng để thấy rằng và phần đầu của lỗi có tương quan, mà làm cho OLS thiên vị và không phù hợp, thậm chí khi không có mối tương quan nối tiếp trong v . Chúng tôi cần một cái gì đó phức tạp hơn để làm bài kiểm tra.yit1v

Điều tiếp theo bạn có thể thử là công cụ ước tính hiệu ứng cố định với phép biến đổi bên trong, trong đó bạn biến đổi dữ liệu bằng cách trừ đi trung bình của mỗi đơn vị , ˉ y i , từ mỗi lần quan sát. Đây lau ra μ , nhưng ước lượng này bị Nickell thiên vị , mà thiên vị không mất đi khi số quan sát N phát triển, vì vậy nó không phù hợp cho lớn N và nhỏ T tấm. Tuy nhiên, như T phát triển, bạn sẽ có được tính nhất quán của δβ . Judson và Owen (1999) thực hiện một số mô phỏng với N = 20 ,yy¯iμNNTTδβ T = 5 , 10 , 20 , 30 và tìm thấy sự thiên vị được tăng trong δ và giảm trong T . Tuy nhiên, ngay cả đối với T = 30 , độ lệch có thể bằng 20 % giá trị hệ số thực. Đó là tin xấu gấu! Vì vậy, tùy thuộc vào kích thước của bảng điều khiển của bạn, bạn có thể muốn tránh công cụ ước tính FE. Nếu δ > 0 , độ lệch là âm, do đó độ bền của y bị đánh giá thấp. Nếu hồi quy có tương quan với sự tụt hậu, các β cũng sẽ bị sai lệch.N=20,100T=5,10,20,30δTT=3020%δ>0yβ

Một cách tiếp cận FE đơn giản khác là phân biệt dữ liệu trước tiên để loại bỏ hiệu ứng cố định và sử dụng cho công cụ cho Δ y i t - 1 = y i t - 1 - y i t - 2 . Bạn cũng sử dụng x i t - x i t - 1 làm công cụ cho chính nó. Anderson và Hsiao (1981) là tài liệu tham khảo kinh điển. Công cụ ước tính này phù hợp (miễn là các X giải thích được xác định trước vàyit2Δyit1=yit1yit2xitxit1X bản gốcthuật ngữ lỗi không tương quan huyết thanh), nhưng không hoàn toàn hiệu quả vì nó không sử dụng tất cả các điều kiện thời điểm có sẵn và không sử dụng thực tế là thuật ngữ lỗi hiện được phân biệt. Đây có lẽ sẽ là lựa chọn đầu tiên của tôi. Nếu bạn nghĩ rằng tuân theo quy trình AR (1), có thể sử dụng độ trễ thứ ba và thứ tư của y thay thế.vy

Arellano và Bond (1991) rút ra một phương pháp ước tính tổng quát về các khoảnh khắc (GMM) hiệu quả hơn, đã được mở rộng kể từ đó, làm giảm bớt một số giả định. Chương 8 của cuốn sách bảng điều khiển của Baltagi là một khảo sát tốt về tài liệu này, mặc dù nó không liên quan đến lựa chọn độ trễ như tôi có thể nói. Đây là số liệu hiện đại, nhưng đòi hỏi kỹ thuật cao hơn.

Tôi nghĩ rằng plmgói trong R có một số trong số này được tích hợp sẵn. Các mô hình bảng động đã có trong Stata kể từ phiên bản 10 và SAS ít nhất có phiên bản GMM . Không ai trong số này là mô hình dữ liệu đếm, nhưng đó có thể không phải là vấn đề lớn tùy thuộc vào dữ liệu của bạn. Tuy nhiên, đây là một ví dụ về mô hình bảng điều khiển Poisson động GMM ở Stata.

yβ


Vì vậy, bạn sử dụng các cấp độ như một công cụ khi bạn có một loạt khác biệt, và sự khác biệt khi bạn có một loạt các cấp độ ?
Andy W

iΔyt2=yt2yt3yt2Δyt1=yt1yt2
Dimitriy V. Masterov
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.