Hãy xem xét các mô hình hồi quy logistic nhị phân đơn giản, với một biến phụ thuộc nhị phân và chỉ một hằng số và một regressor nhị phân .
trong đó là cdf logistic, .T
Pr(Yi=1∣Ti=1)=Λ(α+βTi)
ΛΛ(u)=[1+exp{−u}]−1
Ở dạng logit, chúng ta có
ln(Pr(Yi=1∣Ti=1)1−Pr(Yi=1∣Ti=1))=α+βTi
Bạn có một mẫu có kích thước . Biểu thị số quan sát nơi và những nơi , và . Xem xét các xác suất có điều kiện ước tính sau đây:nn1Ti=1n0Ti=0n1+n0=n
Pr^(Y=1∣T=1)≡P^1|1=1n1∑Ti=1yi
Pr^(Y=1∣T=0)≡P^1|0=1n0∑Ti=0yi
Sau đó, mô hình rất cơ bản này cung cấp các giải pháp dạng đóng cho công cụ ước tính ML:
α^=ln(P^1|01−P^1|0),β^=ln(P^1|11−P^1|1)−ln(P^1|01−P^1|0)
THIÊN KIẾN
Mặc dù và là các công cụ ước tính không thiên vị của các xác suất tương ứng, các MLE bị sai lệch, vì hàm logarit phi tuyến tính xảy ra theo cách mô phỏng những gì xảy ra với các mô hình phức tạp hơn , với mức độ phi tuyến tính cao hơn.P^1|1P^1|0
Nhưng không có triệu chứng, sự thiên vị biến mất vì các ước tính xác suất là phù hợp. Chèn trực tiếp toán tử bên trong giá trị mong đợi và logarit, chúng ta có
lim
limn→∞E[α^]=E[ln(limn→∞P^1|01−P^1|0)]=E[ln(P1|01−P1|0)]=α
và tương tự cho . β
MATRIX VLEANCE-COVariANCE MATRIX CỦA MLE
Trong trường hợp đơn giản ở trên cung cấp các biểu thức dạng đóng cho công cụ ước tính, ít nhất về nguyên tắc, người ta có thể tiếp tục và rút ra phân phối mẫu hữu hạn chính xác của nó và sau đó tính toán ma trận hiệp phương sai mẫu hữu hạn chính xác của nó . Nhưng nói chung, MLE không có giải pháp dạng đóng. Sau đó, chúng tôi sử dụng một ước tính nhất quán của ma trận hiệp phương sai tiệm cận, thực sự (âm tính) nghịch đảo của Hessian của hàm khả năng log của mẫu, được đánh giá tại MLE. Và không có "sự lựa chọn tùy ý" nào ở đây cả, nhưng nó xuất phát từ lý thuyết tiệm cận và các đặc tính tiệm cận của MLE (tính nhất quán và tính không triệu chứng), cho chúng ta biết rằng, đối với ,
θ0=(α,β)
n−−√(θ^−θ0)→dN(0,−(E[H])−1)
trong đó là người Hessian. Khoảng và cho các mẫu hữu hạn (lớn), điều này dẫn chúng ta đếnH
Var(θ^)≈−1n(E[H])−1≈−1n(1nH^)−1=−H^−1