Kiểm tra sự quá mức trong hồi quy logistic


8

R in Action (Kabacoff, 2011) gợi ý thói quen sau đây để kiểm tra sự quá mức trong hồi quy logistic:

Phù hợp với hồi quy logistic bằng phân phối nhị thức:

model_binom <- glm(Species=="versicolor" ~ Sepal.Width,
                   family=binomial(), data=iris)

Phù hợp với hồi quy logistic bằng phân phối quasibinomial:

model_overdispersed <- glm(Species=="versicolor" ~ Sepal.Width, 
                           family=quasibinomial(), data=iris)

Sử dụng chi bình phương để kiểm tra sự quá mức:

pchisq(summary(model_overdispersed)$dispersion * model_binom$df.residual, 
       model_binom$df.residual, lower = F)
# [1] 0.7949171

Ai đó có thể giải thích làm thế nào và tại sao phân phối chi bình phương đang được sử dụng để kiểm tra sự quá mức ở đây? Giá trị p là 0,79 - làm thế nào điều này cho thấy sự quá mức không phải là vấn đề trong mô hình phân phối nhị thức?


2
Thật khó để không phù hợp với phân phối Bernoulli trừ khi bạn có các quan sát tương quan. Những gì về sự phù hợp mà bạn nghi ngờ là không đủ?
Frank Mitchell

Bằng các quan sát tương quan, bạn có nghĩa là mỗi thử nghiệm Bernoulli không độc lập?
luciano

1
Có, ví dụ như tương quan nối tiếp hoặc trong cụm; thử nghiệm không độc lập.
Frank Mitchell

Câu trả lời:


4

Cách tiếp cận được mô tả đòi hỏi tính toán không cần thiết. Thống kê kiểm tra chỉ là

sum(residuals(model_binom, type = "deviance")^2)

Điều này hoàn toàn chính xác với thống kê kiểm tra Pearson vì không phù hợp, do đó nó có phân phối chi bình phương.χ2

Quá mức như vậy không áp dụng cho dữ liệu Bernoulli. Giá trị lớn của có thể cho thấy thiếu đồng biến hoặc quyền hạn hoặc các điều khoản tương tác hoặc dữ liệu nên được nhóm lại. Giá trị p là 0,79 cho thấy thử nghiệm không tìm thấy bất kỳ vấn đề nào.χ2


4
Không nên sửa đổi câu trả lời ở trên như sau? sum(residuals(model_binom, type = "deviance")^2)/model_binom$df.residual
Steve VW
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.