So sánh hai mô hình sử dụng hàm anova () trong R

Từ tài liệu cho anova():

Khi được cung cấp một chuỗi các đối tượng, 'anova' sẽ kiểm tra các mô hình với nhau theo thứ tự được chỉ định ...

Việc kiểm tra các mô hình với nhau có nghĩa là gì? Và tại sao thứ tự quan trọng?

    >  modelAdd = lm(qt~as.numeric(snp1))
    >  modelDom = lm(qt~I(as.numeric(snp1)>=2))
    >  modelRec = lm(qt~I(as.numeric(snp1)>=3))
     anova(modelAdd, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ as.numeric(snp1)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2320                      
    2   2371 2320  1    0.0489     0.82
     anova(modelDom, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 2)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)
    1   2372 2322                      
    2   2371 2320  1      1.77     0.18
     anova(modelRec, modelGen, test="Chisq")
    Analysis of Variance Table

    Model 1: qt ~ I(as.numeric(snp1) >= 3)
    Model 2: qt ~ snp1
      Res.Df  RSS Df Sum of Sq Pr(>Chi)  
    1   2372 2324                        
    2   2371 2320  1      3.53    0.057 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Làm thế nào để tôi giải thích đầu ra này?

r anova

— qed
nguồn

Khi bạn sử dụng anova(lm.1,lm.2,test="Chisq"), nó thực hiện kiểm tra Chi bình phương để so sánh lm.1và lm.2(nghĩa là kiểm tra xem việc giảm tổng bình phương còn lại có ý nghĩa thống kê hay không). Lưu ý rằng điều này chỉ có ý nghĩa nếu lm.1và lm.2là các mô hình lồng nhau.

Ví dụ: trong anova đầu tiên mà bạn đã sử dụng, giá trị p của thử nghiệm là 0,82. Điều đó có nghĩa là mô hình được trang bị "modelAdd" không khác biệt đáng kể so với modelGen ở mức . Tuy nhiên, bằng cách sử dụng giá trị p trong anova thứ 3, mô hình "modelRec" là mô hình mẫu khác biệt đáng kể "modelGen" tại . $\alpha=0.05$ $\alpha=0.1$

Kiểm tra ANOVA cho mô hình tuyến tính phù hợp là tốt.

— Thống kê
nguồn

Nhưng điều đó có ngụ ý gì về việc liệu một trong hai có tốt hơn không? Cảm ơn!

— qed

Nó phụ thuộc vào cách bạn định nghĩa thuật ngữ "tốt hơn". Nếu bạn định nghĩa nó là mô hình cung cấp tổng bình phương còn lại ít hơn, thì câu trả lời là có. Điều này là do, thử nghiệm này so sánh việc giảm tổng bình phương còn lại.

— Stat

Mặt khác, nếu hai mô hình không khác biệt đáng kể, liệu người ta có thể lập luận rằng mô hình đơn giản hơn là "tốt hơn"? Tôi đang suy nghĩ về parcimony ở đây.

— Sininho

Điều gì xảy ra nếu anova (mod1, mod2, test = "LRT") điều này tạo ra sự khác biệt gì?

— ElleryL