Kiểm tra mô hình GLM bằng cách sử dụng null và độ lệch mô hình


11

Tôi đã xây dựng một mô hình glm trong R và đã thử nghiệm nó bằng cách sử dụng một nhóm thử nghiệm và đào tạo để tự tin rằng nó hoạt động tốt. Kết quả từ R là:

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

Tất cả các giá trị p cho các hệ số đều nhỏ như mong đợi.

Nhìn vào câu hỏi này ( Giải thích dư lượng và sai lệch Null trong GLM R ), tôi sẽ có thể tính toán nếu giả thuyết null giữ bằng phương trình sau:

p-value = 1 - pchisq(deviance, degrees of freedom)

Dán cái này vào cho:

1 - pchisq(256600, 671266)
[1] 1

Vì vậy, tôi có đúng khi nghĩ rằng giả thuyết null không thể bị bác bỏ ở đây, mặc dù các giá trị p cho tất cả các hệ số rất nhỏ hoặc tôi đã hiểu sai làm thế nào để tính toán điều này?

Câu trả lời:


17

Có một sự hiểu lầm ở đây. Sự khác biệt giữa độ lệch null và độ lệch của mô hình được phân phối dưới dạng bình phương với mức độ tự do bằng với trừ df null của mô hình. Đối với mô hình của bạn, đó sẽ là:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

pchisq()lower.tail = FALSE1


1
Giả thuyết nào chính xác là bạn đang thử nghiệm với tuyên bố 1-pchisq(256600 - 237230, df=(671266 - 671263))?
jII

4
@jesterII, bạn đang kiểm tra xem sự sai lệch có thay đổi nhiều hơn mức có thể xảy ra không? Tức là, bạn đang thử nghiệm nếu toàn bộ mô hình tốt hơn mô hình null. Nó tương tự như thử nghiệm F toàn cầu trong mô hình tuyến tính.
gung - Phục hồi Monica

Giả thuyết null là "toàn bộ mô hình tốt hơn mô hình null" và bạn đã bác bỏ giả thuyết null, điều đó có nghĩa là mô hình kém?
jII

3
@jesterII, không có giả thuyết null nào là: 'toàn bộ mô hình không tốt hơn mô hình null'. Vì điều này đã bị từ chối, chúng tôi kết luận rằng dữ liệu không phù hợp với mô hình null. NB, điều này không nhất thiết có nghĩa là mô hình của chúng tôi là 'tốt' hoặc 'chính xác'.
gung - Phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.