Đây là một biến thể của mô hình lựa chọn trong kinh tế lượng. Tính hợp lệ của các ước tính chỉ sử dụng mẫu đã chọn ở đây tùy thuộc vào điều kiện
. Ở đây là tình trạng bệnh của .Pr(Yi=1∣Xi,Di=1)=Pr(Yi=1∣Xi,Di=0)Dii
Để biết thêm chi tiết, hãy xác định các ký hiệu sau:
và ; đề cập đến sự kiện mà có trong mẫu. Hơn nữa, giả sử độc lập với vì đơn giản.π1=Pr(Di=1)π0=Pr(Di=0)Si=1iDiXi
Xác suất của cho một đơn vị trong mẫu là
theo định luật lặp đi lặp lại. Giả sử có điều kiện về tình trạng bệnh và các hiệp phương sai khác , kết quả
không phụ thuộc vào . Kết quả là
Yi=1i
Pr(Yi=1∣Xi,Si=1)===E(Yi∣Xi,Si=1)E{E(Yi∣Xi,Di,Si=1)∣Xi,Si=1}Pr(Di=1∣Si=1)Pr(Yi=1∣Xi,Di=1,Si=1)+Pr(Di=0∣Si=1)Pr(Yi=1∣Xi,Di=0,Si=1),
DiXiYiSiPr(Yi=1∣Xi,Si=1)=Pr(Di=1∣Si=1)Pr(Yi=1∣Xi,Di=1)+Pr(Di=0∣Si=1)Pr(Yi=1∣Xi,Di=0).
Dễ dàng thấy rằng
Ở đây và như được xác định sơ đồ lấy mẫu của bạn. Như vậy
Pr(Di=1∣Si=1)=π1pi1π1pi1+π0pi0 and Pr(Di=0∣Si=1)=π0pi0π1pi1+π0pi0.
pi1pi0Pr(Yi=1∣Xi,Si=1)=π1pi1π1pi1+π0pi0Pr(Yi=1∣Xi,Di=1)+π0pi0π1pi1+π0pi0Pr(Yi=1∣Xi,Di=0).
Nếu , chúng ta có
và bạn có thể bỏ qua vấn đề chọn mẫu. Mặt khác, nếu ,
nói chung. Trong trường hợp cụ thể, hãy xem xét mô hình logit,
Pr(Yi=1∣Xi,Di=1)=Pr(Yi=1∣Xi,Di=0)Pr(Yi=1∣Xi,Si=1)=Pr(Yi=1∣Xi),
Pr(Yi=1∣Xi,Di=1)≠Pr(Yi=1∣Xi,Di=0)Pr(Yi=1∣Xi,Si=1)≠Pr(Yi=1∣Xi)
Pr(Yi=1∣Xi,Di=1)=eX′iα1+eX′iα and Pr(Yi=1∣Xi,Di=0)=eX′iβ1+eX′iβ.
Ngay cả khi và không đổi trên , phân phối kết quả sẽ không giữ được sự hình thành logit. Quan trọng hơn, sự giao thoa của các tham số sẽ hoàn toàn khác nhau. Hy vọng rằng, các lập luận trên giúp làm rõ vấn đề của bạn một chút.
pi1pi0i
đưa làm biến giải thích bổ sung và ước tính mô hình dựa trên . Để chứng minh tính hợp lệ của việc sử dụng , chúng tôi cần chứng minh rằng , tương đương với điều kiện là một thống kê đầy đủ của . Không có thêm thông tin về quy trình lấy mẫu của bạn, tôi không chắc nó có đúng không. Hãy sử dụng một ký hiệu trừu tượng. Biến quan sát có thể được xem là hàm ngẫu nhiên của và các biến ngẫu nhiên khác, giả sửDiPr(Yi∣Xi,Di)Pr(Yi∣Xi,Di)Pr(Yi∣Xi,Di,Si=1)=Pr(Yi∣Xi,Di)DiSiSiDiZi . Suy ra . Nếu
độc lập với điều kiện trên và , chúng ta có
theo định nghĩa độc lập. Tuy nhiên, nếu không độc lập với sau khi điều hòa trên và ,
trực quan chứa một số thông tin liên quan về
, và nói chung không mong đợi rằngSi=S(Di,Zi)ZiYiXiDiPr(Yi∣Xi,Di,S(Di,Zi))=Pr(Yi∣Xi,Di)ZiYiXiDiZiYiPr(Yi∣Xi,Di,S(Di,Zi))=Pr(Yi∣Xi,Di) . Do đó, trong trường hợp 'tuy nhiên', sự thiếu hiểu biết về lựa chọn mẫu có thể gây hiểu nhầm cho suy luận. Tôi không quen thuộc lắm với tài liệu chọn mẫu trong kinh tế lượng. Tôi muốn giới thiệu Chương 16 của Microeconometrics: methods and applications' by Cameron
and Trivedi (especially the Roy model in that chapter). Also G. S.
Maddala's classic book
các biến số phụ thuộc và định tính trong kinh tế lượng 'là một cách xử lý có hệ thống các vấn đề về lựa chọn mẫu và kết quả riêng biệt.