Pearson VS Deviance Residuals trong hồi quy logistic


16

Tôi biết rằng Pearson Residuals được tiêu chuẩn hóa thu được theo cách xác suất truyền thống:

ri=yiπiπi(1πi)

và Deviance Residuals có được thông qua một cách thống kê hơn (sự đóng góp của từng điểm vào khả năng):

di=si2[yilogπi^+(1yi)log(1πi)]

trong đó = 1 nếu y i = 1 và s i = -1 nếu y i = 0.siyisiyi

Bạn có thể giải thích cho tôi, bằng trực giác, làm thế nào để giải thích công thức cho phần dư sai lệch?

Hơn nữa, nếu tôi muốn chọn cái nào, cái nào phù hợp hơn và tại sao?

BTW, một số tài liệu tham khảo cho rằng chúng tôi lấy được số dư sai lệch dựa trên thuật ngữ

12ri2

nơi được đề cập ở trên.ri


Mọi suy nghĩ sẽ được đánh giá cao
Jack Shi

1
Khi bạn nói "một số tài liệu tham khảo" ... tài liệu tham khảo nào và làm thế nào để họ làm điều đó?
Glen_b -Reinstate Monica

Câu trả lời:


10

Hồi quy logistic tìm cách tối đa hóa chức năng khả năng đăng nhập

LL=kln(Pi)+rln(1Pi)

PiY^=1kY=1rY=0

Biểu thức đó bằng

LL=(kdi2+rdi2)/2

bởi vì phần dư của trường hợp được xác định là:

dTôi= ={-2ln(PTôi)nếu YTôi= =1--2ln(1-PTôi)nếu YTôi= =0

Do đó, hồi quy logistic nhị phân tìm kiếm trực tiếp để giảm thiểu tổng số dư sai lệch bình phương. Đó là phần dư sai lệch được ngụ ý trong thuật toán ML của hồi quy.

Thống kê Chi-sq của mô hình phù hợp là 2(LLmô hình đầy đủ-LLmô hình giảm), trong đó mô hình đầy đủ chứa các yếu tố dự đoán và mô hình rút gọn không có.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.