Tôi có một bộ dữ liệu với 8000 cụm và 4 triệu quan sát. Thật không may, phần mềm thống kê của tôi, Stata, chạy khá chậm khi sử dụng chức năng dữ liệu bảng điều khiển của nó để hồi quy logistic:, xtlogit
ngay cả với mẫu phụ 10%.
Tuy nhiên, khi sử dụng logit
kết quả chức năng nonpanel xuất hiện sớm hơn nhiều. Do đó, tôi có thể được hưởng lợi từ việc sử dụng logit
trên dữ liệu đã sửa đổi chiếm các hiệu ứng cố định.
Tôi tin rằng quy trình này được tạo ra "thủ tục hiệu ứng cố định Mundlak" (Mundlak, Y. 1978. Tập hợp dữ liệu chuỗi thời gian và mặt cắt ngang. Kinh tế lượng, 46 (1), 69-85.)
Tôi tìm thấy một lời giải thích trực quan về thủ tục này trong một bài báo của Antonakis, J., Bendahan, S., Jacquart, P., & Lalive, R. (2010). Về việc đưa ra tuyên bố nhân quả: Một đánh giá và khuyến nghị. Quý lãnh đạo, 21 (6). 1086-1120. Tôi trích dẫn:
Một cách để khắc phục vấn đề về các hiệu ứng bị bỏ qua và vẫn bao gồm các biến Cấp 2 là bao gồm các phương tiện cụm của tất cả các hiệp phương trình 1 trong mô hình ước tính (Mundlak, 1978). Các phương tiện cụm có thể được bao gồm dưới dạng hồi quy hoặc bị trừ (nghĩa là định tâm trung bình cụm) từ hiệp phương trình cấp 1. Các phương tiện cụm là bất biến trong cụm (và khác nhau giữa các cụm) và cho phép ước tính nhất quán các tham số Cấp 1 giống như đã bao gồm các hiệu ứng xed (xem Rabe-Hesketh & Skrondal, 2008).
Do đó, định tâm cụm có vẻ lý tưởng và thiết thực để giải quyết vấn đề tính toán của tôi. Tuy nhiên, những bài báo này dường như hướng đến hồi quy tuyến tính (OLS).
Có phải phương pháp định tâm trung bình cụm này cũng được áp dụng để "sao chép" hồi quy logistic nhị phân hiệu ứng cố định?
Một câu hỏi kỹ thuật hơn sẽ dẫn đến cùng một câu trả lời sẽ là: xtlogit depvar indepvars, fe
với tập dữ liệu A bằng logit depvar indepvars
với tập dữ liệu B khi tập dữ liệu B là phiên bản trung tâm cụm của tập dữ liệu A?
Một khó khăn thêm tôi tìm thấy trong cụm trung tâm có nghĩa là làm thế nào để đối phó với người giả. Bởi vì các hình nộm là 0 hoặc 1, chúng có giống nhau trong hồi quy hiệu ứng ngẫu nhiên và cố định không? Họ không nên là "trung tâm"?