So sánh hai mô hình sử dụng hàm anova () trong R


32

Từ tài liệu cho anova():

Khi được cung cấp một chuỗi các đối tượng, 'anova' sẽ kiểm tra các mô hình với nhau theo thứ tự được chỉ định ...

Việc kiểm tra các mô hình với nhau có nghĩa là gì? Và tại sao thứ tự quan trọng?

Đây là một ví dụ từ hướng dẫn GenABEL :

    >  modelAdd = lm(qt~as.numeric(snp1))
    >  modelDom = lm(qt~I(as.numeric(snp1)>=2))
    >  modelRec = lm(qt~I(as.numeric(snp1)>=3))
     anova(modelAdd, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ as.numeric(snp1)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2320                      
    2   2371 2320  1    0.0489     0.82
     anova(modelDom, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 2)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2322                      
    2   2371 2320  1      1.77     0.18
     anova(modelRec, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 3)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)  
    1   2372 2324                        
    2   2371 2320  1      3.53    0.057 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1 

Làm thế nào để tôi giải thích đầu ra này?

Câu trả lời:


31

Khi bạn sử dụng anova(lm.1,lm.2,test="Chisq"), nó thực hiện kiểm tra Chi bình phương để so sánh lm.1lm.2(nghĩa là kiểm tra xem việc giảm tổng bình phương còn lại có ý nghĩa thống kê hay không). Lưu ý rằng điều này chỉ có ý nghĩa nếu lm.1lm.2là các mô hình lồng nhau.

Ví dụ: trong anova đầu tiên mà bạn đã sử dụng, giá trị p của thử nghiệm là 0,82. Điều đó có nghĩa là mô hình được trang bị "modelAdd" không khác biệt đáng kể so với modelGen ở mức . Tuy nhiên, bằng cách sử dụng giá trị p trong anova thứ 3, mô hình "modelRec" là mô hình mẫu khác biệt đáng kể "modelGen" tại .α= =0,05α= =0,1

Kiểm tra ANOVA cho mô hình tuyến tính phù hợp là tốt.


1
Nhưng điều đó có ngụ ý gì về việc liệu một trong hai có tốt hơn không? Cảm ơn!
qed

5
Nó phụ thuộc vào cách bạn định nghĩa thuật ngữ "tốt hơn". Nếu bạn định nghĩa nó là mô hình cung cấp tổng bình phương còn lại ít hơn, thì câu trả lời là có. Điều này là do, thử nghiệm này so sánh việc giảm tổng bình phương còn lại.
Stat

3
Mặt khác, nếu hai mô hình không khác biệt đáng kể, liệu người ta có thể lập luận rằng mô hình đơn giản hơn là "tốt hơn"? Tôi đang suy nghĩ về parcimony ở đây.
Sininho

1
Điều gì xảy ra nếu anova (mod1, mod2, test = "LRT") điều này tạo ra sự khác biệt gì?
ElleryL
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.