R in Action (Kabacoff, 2011) gợi ý thói quen sau đây để kiểm tra sự quá mức trong hồi quy logistic:
Phù hợp với hồi quy logistic bằng phân phối nhị thức:
model_binom <- glm(Species=="versicolor" ~ Sepal.Width,
family=binomial(), data=iris)
Phù hợp với hồi quy logistic bằng phân phối quasibinomial:
model_overdispersed <- glm(Species=="versicolor" ~ Sepal.Width,
family=quasibinomial(), data=iris)
Sử dụng chi bình phương để kiểm tra sự quá mức:
pchisq(summary(model_overdispersed)$dispersion * model_binom$df.residual,
model_binom$df.residual, lower = F)
# [1] 0.7949171
Ai đó có thể giải thích làm thế nào và tại sao phân phối chi bình phương đang được sử dụng để kiểm tra sự quá mức ở đây? Giá trị p là 0,79 - làm thế nào điều này cho thấy sự quá mức không phải là vấn đề trong mô hình phân phối nhị thức?