Trường hợp "sai lệch suy giảm" có thể được trình bày rõ ràng hơn nếu chúng ta kiểm tra mô hình "probit" - nhưng kết quả cũng mang đến hồi quy logistic.
Bên dưới các mô hình xác suất có điều kiện (Logistic (logit), "probit" và "xác suất tuyến tính"), chúng ta có thể định nghĩa mô hình hồi quy tuyến tính tiềm ẩn (không quan sát được):
y*= Xβ+ bạn
Trong đó là một biến không quan sát được liên tục (và là ma trận hồi quy). Thuật ngữ lỗi được giả định là độc lập với các biến hồi quy và tuân theo phân phối có mật độ đối xứng quanh 0 và trong trường hợp của chúng tôi, phân phối chuẩn . X F U ( u ) = Φ ( u )y*XFBạn( u ) = Φ ( u )
Chúng tôi giả định rằng những gì chúng tôi quan sát, tức là biến nhị phân , là một hàm Chỉ thị của :y *yy*
y= 1nếuy*> 0 ,y= 0nếuy*≤ 0
Sau đó, chúng tôi hỏi "xác suất mà sẽ lấy giá trị cho các biến hồi quy là bao nhiêu?" (tức là chúng ta đang xem xét một xác suất có điều kiện). Đây là1y1
P( y= 1 ∣ X) = P( y*> 0 ∣ X) = P( Xβ+ u > 0 ∣ X) = P( u > - Xβ∣ X)= 1 - Φ ( - X β) = Φ ( Xβ)
đẳng thức cuối cùng do tính chất "phản xạ" của hàm phân phối tích lũy tiêu chuẩn, xuất phát từ tính đối xứng của hàm mật độ quanh 0. Lưu ý rằng mặc dù chúng tôi đã giả sử rằng độc lập với , nhưng điều hòa trên là cần thiết để coi số lượng là không ngẫu nhiên.X X X βbạnXXXβ
Nếu chúng tôi giả sử rằng , thì chúng tôi có được mô hình lý thuyếtXβ= b0+ b1X1+ b2X2
P( y= 1 ∣ X) = Φ ( b0+ b1X1+ b2X2)(1)
Bây giờ, độc lập với và bị loại trừ khỏi đặc tả của hồi quy cơ bản. Vì vậy, chúng tôi chỉ địnhX 1X2X1
X 2 X 2 ~ N ( μ 2 , σ 2 2 )
y∗=b0+b1X1+ϵ
Giả sử thêm rằng cũng là biến ngẫu nhiên bình thường . Nhưng điều này có nghĩa là
X2X2∼N(μ2,σ22)
ϵ=u+b2X2∼N(b2μ2,1+b22σ22)
do sự đóng cửa dưới sự bổ sung của phân phối bình thường (và giả định độc lập). Áp dụng logic tương tự như trước đây, ở đây chúng ta có
P(y=1∣X1)=P(y∗>0∣X1)=P(b0+b1X1+ϵ>0∣X1)=P(ϵ>−b0−b1X1∣X1)
Chuẩn hóa biến chúng ta cóϵ
P(y=1∣X1)=1−P⎛⎝⎜ϵ−b2μ21+b22σ22−−−−−−−√≤−(b0+b2μ2)1+b22σ22−−−−−−−√−b11+b22σ22−−−−−−−√X1∣X1⎞⎠⎟
⇒P(y=1∣X1)=Φ⎛⎝⎜(b0+b2μ2)1+b22σ22−−−−−−−√+b11+b22σ22−−−−−−−√X1⎞⎠⎟(2)
và người ta có thể so sánh các mô hình và .(1)(2)
Biểu thức lý thuyết ở trên, cho chúng ta biết nơi ước tính khả năng tối đa của chúng ta về sẽ hội tụ, vì nó vẫn là một công cụ ước lượng nhất quán, theo nghĩa là nó sẽ hội tụ đến đại lượng lý thuyết thực sự tồn tại trong mô hình (và tất nhiên, không phải trong ý nghĩa rằng nó sẽ tìm thấy "sự thật" trong mọi trường hợp):b1
b^1→pb11+b22σ22−−−−−−−√⟹|b^1|<|b1|
đó là kết quả "thiên về không".
Chúng tôi đã sử dụng mô hình probit chứ không phải logit (hồi quy logistic), bởi vì chỉ theo quy tắc, chúng tôi mới có thể rút ra được phân phối của . Phân phối logistic không được đóng dưới bổ sung. Điều này có nghĩa là nếu chúng ta bỏ qua một biến có liên quan trong hồi quy logistic, chúng ta cũng tạo ra lỗi chính tả phân phối, vì thuật ngữ lỗi (hiện bao gồm biến bị bỏ qua) không còn tuân theo phân phối logistic. Nhưng điều này không thay đổi kết quả thiên vị (xem chú thích 6 trong bài báo được liên kết bởi OP).ϵ