Tôi hiện đang làm việc để cố gắng thực hiện một phương pháp được sử dụng trong một bài báo phổ biến có tiêu đề "Tôi chỉ cần hai triệu hồi quy". Ý tưởng cơ bản đằng sau nó là có một số trường hợp nhất định trong đó không rõ ràng những điều khiển nào nên được đưa vào mô hình. Một điều mà bạn có thể làm trong trường hợp như vậy là rút ngẫu nhiên các điều khiển, chạy hàng triệu hồi quy khác nhau và sau đó xem biến số quan tâm của bạn đã phản ứng như thế nào. Nếu nó thường có cùng một dấu hiệu trong tất cả các thông số kỹ thuật thì chúng ta có thể xem xét nó mạnh hơn một biến có dấu luôn thay đổi.
Hầu hết các bài báo là rất rõ ràng. Tuy nhiên, bài báo có trọng số tất cả các hồi quy khác nhau theo cách sau: Khả năng tích hợp của thông số kỹ thuật đã cho được chia cho tổng của tất cả các khả năng tích hợp cho tất cả các thông số kỹ thuật.
Rắc rối mà tôi gặp phải là tôi không chắc khả năng tích hợp liên quan đến hồi quy OLS mà tôi muốn chạy như thế nào (trong Stata). Các chủ đề của Google như "khả năng tích hợp stata" đã đi vào ngõ cụt khi tôi tiếp tục chạy vào những thứ như hồi quy logistic hiệu ứng hỗn hợp. Tôi thú nhận rằng những mô hình này quá phức tạp để tôi có thể nắm bắt.
Công việc hiện tại của tôi là có những phương án trọng số khác nhau được sử dụng trong tài liệu mà tôi hiểu (loại). Ví dụ, có thể tính trọng số của từng hồi quy dựa trên chỉ số tỷ lệ khả năng. Thậm chí còn có một gói R sử dụng lri làm trọng lượng. Mặc dù vậy, tự nhiên, tôi cũng muốn thực hiện cái ban đầu.
Có lời khuyên nào không?
Liên kết giấy: http://down.cenet.org.cn/upfile 432/2009112141315178.pdf