Tôi đã xây dựng một mô hình glm trong R và đã thử nghiệm nó bằng cách sử dụng một nhóm thử nghiệm và đào tạo để tự tin rằng nó hoạt động tốt. Kết quả từ R là:
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -2.781e+00 1.677e-02 -165.789 < 2e-16 ***
Coeff_A 1.663e-05 5.438e-06 3.059 0.00222 **
log(Coeff_B) 8.925e-01 1.023e-02 87.245 < 2e-16 ***
log(Coeff_C) -3.978e-01 7.695e-03 -51.689 < 2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for quasibinomial family taken to be 0.9995149)
Null deviance: 256600 on 671266 degrees of freedom
Residual deviance: 237230 on 671263 degrees of freedom
AIC: NA
Tất cả các giá trị p cho các hệ số đều nhỏ như mong đợi.
Nhìn vào câu hỏi này ( Giải thích dư lượng và sai lệch Null trong GLM R ), tôi sẽ có thể tính toán nếu giả thuyết null giữ bằng phương trình sau:
p-value = 1 - pchisq(deviance, degrees of freedom)
Dán cái này vào cho:
1 - pchisq(256600, 671266)
[1] 1
Vì vậy, tôi có đúng khi nghĩ rằng giả thuyết null không thể bị bác bỏ ở đây, mặc dù các giá trị p cho tất cả các hệ số rất nhỏ hoặc tôi đã hiểu sai làm thế nào để tính toán điều này?
1-pchisq(256600 - 237230, df=(671266 - 671263))
?