Xác định nguyên nhân và splines bị phạt


8

Tôi vừa nhận được một lời từ chối từ một tạp chí kinh tế. Trong số các lý do được trích dẫn để từ chối là:

lợi ích của việc sử dụng phương pháp bán tham số không được đưa ra rõ ràng so với các kỹ thuật đơn giản thay thế với việc xác định rõ ràng các mối quan hệ nhân quả

Chắc chắn là tôi có thể đã làm tốt hơn việc thúc đẩy phương pháp luận cho một nhóm các nhà kinh tế, những người thường gắn bó với OLS. Nhưng tôi đã vi phạm "nhận dạng sạch" chưa? Hãy phán xét cho chính mình và cho tôi biết những gì bạn nghĩ:

Phương trình ước lượng chính của tôi là là liên tục, và là nhị phân. Tôi có thể giả định một cách chính đáng rằng Điều đó có nghĩa là hệ số trên không thiên vị có điều kiện đối với các biến giả ở cấp độ cá nhân ("hiệu ứng cố định" trong kinh tế lượng nói). Khi tôi bao gồm liên tục biến , tôi chỉ đơn giản là nhìn không đồng nhất trong hiệu quả điều trị ước tính trên gradient của . Vì vậy, hiệu quả nhân quả trung bình của điều trị Z X T E [ ϵ | α , T ] = 0 T Z Z

yit=αi+β1Tit+f(ZitZit×TitZit×Tit×Xt)+β2Xt+ϵit
ZXT
E[ϵ|α,T]=0
TZZTlà trung bình của cho các cấp độ khác nhau mà tôi quan sát được.Zβ^1+f^Z×TZ

Mô hình được xác định bằng các spline bậc hai bị phạt (ví dụ: Ruppert et al. 2003). Cụ thể:

y=β0+Xβ+1p(Zp)γ+j=1#varsk=1#knotsjδjk((Zjκjk)p×(Zj>κjk))+ϵ

Điều này được giải quyết bằng

[β^γ^δ^]=(CC+λ2pD)1Cy

trong đó bao gồm các điều khoản tham số và các điều khoản thắt nút và trong đó hình phạt sườn núi chỉ áp dụng cho các điều khoản nút thắt và được chọn để giảm thiểu AIC. (Tôi không thể thực hiện công lý đầy đủ cho phương pháp luận này - xem Ruppert et al hoặc sách giáo khoa của Simon Wood trên GAM).λCλ

Tất nhiên, tôi sử dụng các bán mẫu này bởi vì tôi không muốn áp đặt các hình thức chức năng vô căn cứ vào dữ liệu của mình. Làm như vậy sẽ hoàn toàn thiên vị các ước tính của tôi nhiều như việc áp đặt một logarit phù hợp với hàm hình sin sẽ làm sai lệch các ước tính của tôi. Nhưng có một cái gì đó vốn có trong các spline bị phạt như tôi đã mô tả chúng vốn sẽ đưa ra tuyên bố sau đây không đúng sự thật?

E[β^1]=β1 iff E[ϵ|α,T]=0

2
Tôi không đủ điều kiện để trả lời câu hỏi cuối cùng của bạn (mặc dù có vẻ đáng ngờ), nhưng có lẽ để giải quyết các mối quan tâm của Tạp chí, bạn cũng nên đưa mô hình OLS vào bài viết của mình và cho thấy rằng nó hoạt động kém bởi một số liệu?
thebigdog

Bạn đã không vi phạm "nhận dạng sạch." Không có gì vốn có làm cho mô hình bán tham số ít có khả năng đạt được nhận dạng sạch. Thật vậy, mô hình của bạn bao gồm một mô hình tuyến tính.

@generic_user bạn đã bao giờ nhận được một giải pháp cho điều này? Nếu vậy, bạn có thể trả lời câu hỏi của bạn? Nếu không, bạn có thể cung cấp một định nghĩa về nhận dạng sạch? Tôi có một số quan điểm về việc xuất bản các phân tích điều chỉnh spline có thể có hoặc không phù hợp với trường hợp này.
AdamO

Đến bữa tiệc muộn, nhưng tôi nghĩ bạn đang lo lắng về điều sai trái ở đây. Các giới thiệu đang nói rằng họ không thích rằng bạn đã thêm sự phức tạp mà không chứng minh rằng nó hữu ích. Một ví dụ cho thấy chế độ thất bại của các phương pháp đơn giản của họ sẽ giúp thúc đẩy sự phức tạp thêm mà bạn đang giới thiệu. Có thể kỹ sư (hoặc thậm chí tốt hơn là tìm một ví dụ trong thế giới thực) về nơi cần các spline để xác định đúng mối quan hệ nhân quả.
Paul

Nếu điều này được xuất bản như một số điểm bạn có thể vui lòng đề cập đến tên của bài báo? Có vẻ như một ứng dụng thú vị.
usεr11852

Câu trả lời:


1

"Xác định sạch" các tham số hồi quy không phải là một khái niệm đã được thiết lập. Tôi tin rằng ý kiến ​​của người đánh giá là bạn nên chỉ định một tham số có thể hiểu được, có thể kiểm tra được, có tính chiều hướng thấp và phân tích được cung cấp để phát hiện để có thể thu được ước tính không thiên vị với hiệu quả tương đối tốt.

Mong muốn "nhận dạng sạch" không ngụ ý OLS là công cụ phù hợp duy nhất cho công việc. OLS, tuy nhiên, là một công cụ âm thanh lý thuyết và thực tế để chỉ định và ước tính các tham số dưới nhiều cài đặt khác nhau. Mong muốn "nhận dạng sạch" cũng không loại trừ suy luận bán đảo. Như một lưu ý, spline mở rộng mô hình OLS bằng cách tạo (a) biểu diễn phức (s) của hiệp phương sai. Suy luận bán tổng hợp liên quan đến mô hình linh hoạt để loại bỏ ảnh hưởng của thống kê phụ trợ, nhưng trong mô hình của bạn, có vẻ như phơi sáng chính được xử lý theo kiểu như vậy.

Tôi nghĩ rằng các nhà phê bình nêu lên hai mối quan tâm rõ ràng. Đầu tiên là lý do để xử phạt. Phương pháp hồi quy hình phạt có giá trị để dự đoán. Chúng hiếm khi được sử dụng để suy luận. Các phương pháp hình phạt như hồi quy sườn núi bị sai lệch, và rất khó để mô tả hoặc đánh giá sai lệch. Mục tiêu của việc giảm thiểu AIC là để có được những dự đoán tốt nhất, không phải là suy luận hợp lệ. Mối quan tâm rõ ràng thứ hai là liệu spline thậm chí có cần thiết để mô hình hóa phơi sáng chính hay không. Đúng như bạn nói rằng một spline có khả năng mô hình hóa các dạng hàm phi tuyến phức tạp. Tuy nhiên, một spline đơn giản hóa rất ít. Đó là một biểu diễn chiều cao phức tạp, với các điểm nút và điều chỉnh có thể là nguồn gốc của sự thiên vị của nhà nghiên cứu và các đồng biến gần như không thể giải thích được cho bất kỳ ai ngoại trừ các nhà thống kê được đào tạo cao. Nhiều xu hướng có ý nghĩa thống kê được mô hình chính xác bởi các spline có các xấp xỉ tuyến tính cơ bản không có ý nghĩa thống kê cũng như thực tế.

Nếu dạng chức năng của phơi sáng chính bị sai, bạn có thể sử dụng các lỗi tiêu chuẩn Huber White để có được suy luận nhất quán và không thiên vị cho độ dốc bình phương nhỏ nhất như là một xấp xỉ bậc nhất cho bất kỳ xu hướng phi tuyến tính nào. Splines có thể được sử dụng để mô hình các biến chính xác, trên đó bạn không suy luận dựa trên dữ liệu, khi có một thiết kế phức tạp cho dữ liệu. Điều này phục vụ để phù hợp hiệu quả và giảm sự thay đổi khi có sự không đồng nhất phức tạp trong dữ liệu.

Tôi nghĩ rằng các ý kiến ​​của người đánh giá có thể được giải quyết bằng cách lắp một mô hình tuyến tính cho việc tiếp xúc và tiến hành suy luận với các lỗi của Huber White Sandwich. Nếu suy luận chủ yếu đồng ý với suy luận spline, hãy bình luận về mô hình spline trong chừng mực vì nó thể hiện xu hướng cong giữa tiếp xúc và phản ứng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.