Phần dư trong hồi quy logistic có nghĩa là gì?


62

Khi trả lời câu hỏi này, John Christie cho rằng nên đánh giá sự phù hợp của mô hình hồi quy logistic bằng cách đánh giá phần dư. Tôi quen thuộc với cách diễn giải các phần dư trong OLS, chúng có cùng tỷ lệ với DV và rất rõ ràng sự khác biệt giữa y và y được mô hình dự đoán. Tuy nhiên, đối với hồi quy logistic, trước đây tôi thường chỉ kiểm tra các ước tính về mức độ phù hợp của mô hình, ví dụ AIC, vì tôi không chắc chắn phần còn lại có ý nghĩa gì đối với hồi quy logistic. Sau khi xem xét các tệp trợ giúp của R một chút, tôi thấy rằng trong R có năm loại dư glm có sẵn , c("deviance", "pearson", "working","response", "partial"). Tệp trợ giúp đề cập đến:

Tôi không có một bản sao đó. Có một cách ngắn để mô tả làm thế nào để giải thích từng loại này? Trong bối cảnh logistic, tổng số dư bình phương sẽ cung cấp một thước đo có ý nghĩa về mức độ phù hợp của mô hình hay là một tiêu chí tốt hơn với Tiêu chí Thông tin?


2
Có những yếu tố cho câu hỏi này vẫn chưa được trả lời, ví dụ như bản chất của "pearson", "làm việc", "phản hồi" và "một phần", nhưng bây giờ tôi sẽ chấp nhận câu trả lời của Thylacoleo.
russellpierce

Tôi tìm thấy binnedplothàm trong nhánh gói R cung cấp một lô dư rất hữu ích. Nó được mô tả độc đáo trên p.97-101 của Gelman và Hill 2007 .
liên hợp chiến binh

1
ni=1

Vâng - thật đáng buồn khi tôi thường sử dụng một Bernoulli DV.
russellpierce

Câu trả lời:


32

p=logit1(Xβ)X

logit1(Xβ)

Thực hiện hồi quy logistic giống như tìm giá trị beta sao cho tổng số dư sai lệch bình phương được giảm thiểu.

Điều này có thể được minh họa bằng một cốt truyện, nhưng tôi không biết làm thế nào để tải lên một cốt truyện.


1
Hình ảnh Reg: Sử dụng một trong những trang web lưu trữ hình ảnh miễn phí (tìm kiếm google), tải cốt truyện lên trang web đó và liên kết nó ở đây.

Tôi đã sửa một lỗi trong câu trả lời ban đầu của mình. Lần đầu tiên tôi viết p = logit (X beta). Trong thực tế, xác suất dự đoán là logit nghịch đảo của tổ hợp tuyến tính, p = inv-logit (X beta). Trong R, điều này được tính là p <-plogit (X beta), là p = exp (X beta) / (1 + exp (X * beta)).
Thylacoleo

1
Gói R plogitđến từ đâu? Không rõ ràng nếu bạn đang xác định nó ở đây hoặc nhận nó từ một nơi khác.
Amyunimus

1
@Amyunimus plogitở R (số liệu thống kê), không yêu cầu gói (ít nhất là không còn nữa)
russellpierce

7

Trên Pearsons dư,

Phần dư Pearson là sự khác biệt giữa xác suất được quan sát và ước tính chia cho độ lệch chuẩn nhị thức của xác suất ước tính. Do đó tiêu chuẩn hóa các phần dư. Đối với các mẫu lớn, phần dư được chuẩn hóa phải có phân phối chuẩn.

Từ Menard, Scott (2002). Áp dụng phân tích hồi quy logistic, tái bản lần 2. Ngàn Bàu, CA: Ấn phẩm hiền triết. Sê-ri: Các ứng dụng định lượng trong Khoa học xã hội, Số 106. Lần xuất bản đầu tiên, 1995. Xem Chương 4.4


8
nini<5

5

Phần dư làm việc là phần dư trong lần lặp cuối cùng của bất kỳ phương pháp bình phương nhỏ nhất có trọng số lặp . Tôi nghĩ đó có nghĩa là phần dư khi chúng tôi nghĩ rằng đó là lần lặp cuối cùng của việc chạy mô hình của chúng tôi. Điều đó có thể làm nảy sinh cuộc thảo luận rằng chạy mô hình là một bài tập lặp.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.