Tôi có những dữ liệu này:
set.seed(1)
predictor <- rnorm(20)
set.seed(1)
counts <- c(sample(1:1000, 20))
df <- data.frame(counts, predictor)
Tôi đã chạy một hồi quy poisson
poisson_counts <- glm(counts ~ predictor, data = df, family = "poisson")
Và một hồi quy nhị thức âm:
require(MASS)
nb_counts <- glm.nb(counts ~ predictor, data = df)
Sau đó, tôi tính toán cho các số liệu thống kê phân tán cho hồi quy poisson:
sum(residuals(poisson_counts, type="pearson")^2)/df.residual(poisson_counts)
# [1] 145.4905
Và hồi quy nhị thức âm:
sum(residuals(nb_counts, type="pearson")^2)/df.residual(nb_counts)
# [1] 0.7650289
Có ai có thể giải thích, KHÔNG CÓ THIẾT BỊ SỬ DỤNG, tại sao thống kê phân tán cho hồi quy nhị thức âm nhỏ hơn đáng kể so với thống kê phân tán cho hồi quy poisson?