Sự khác biệt về giá trị p được báo cáo giữa lm và aov trong R


12

Điều gì giải thích sự khác biệt về giá trị p trong các cuộc gọi aovvà sau đây lm? Là sự khác biệt chỉ do các loại tính toán tổng bình phương khác nhau?

set.seed(10)
data=rnorm(12)
f1=rep(c(1,2),6)
f2=c(rep(1,6),rep(2,6))
summary(aov(data~f1*f2))
summary(lm(data~f1*f2))$coeff

Câu trả lời:


13

summary(aov)sử dụng cái gọi là tổng hợp loại I (tuần tự). summary(lm)sử dụng cái gọi là tổng loại III, không phải là tuần tự. Xem câu trả lời của gung để biết chi tiết.


lm(data ~ factor(f1) * factor(2))aov()t

t= =ψ^-ψ0σ^c'(X'X)-1c

c'(X'X)-1cβcF


1
Tôi nghĩ rằng câu đầu tiên của câu trả lời này là sai. Sự khác biệt dường như chính xác là do các loại bình phương khác nhau: cụ thể là loại I so với loại II / III. Loại I là tuần tự, đó là những gì lmbáo cáo, trong khi Loại II / III thì không. Điều này được giải thích khá chi tiết trong câu trả lời của @ gung mà bạn đã liên kết.
amip nói rằng Phục hồi lại

@amoeba Bạn đề nghị gì để sửa câu trả lời?
caracal

Tôi đã chỉnh sửa đoạn đầu tiên, xem bạn có ổn với bản chỉnh sửa đó không, và thoải mái thay đổi nó theo ý muốn.
amip nói rằng Phục hồi Monica

2
set.seed(10)
data=rnorm(12)
f1=rep(c(1,2),6)
f2=c(rep(1,6),rep(2,6))
summary(aov(data~f1*f2))
            Df Sum Sq Mean Sq F value Pr(>F)
f1           1  0.535  0.5347   0.597  0.462
f2           1  0.002  0.0018   0.002  0.966
f1:f2        1  0.121  0.1208   0.135  0.723
Residuals    8  7.169  0.8962               
summary(lm(data~f1*f2))$coeff
               Estimate Std. Error    t value  Pr(>|t|)
(Intercept)  0.05222024   2.732756  0.0191090 0.9852221
f1          -0.17992329   1.728346 -0.1041014 0.9196514
f2          -0.62637109   1.728346 -0.3624106 0.7264325
f1:f2        0.40139439   1.093102  0.3672066 0.7229887

Đây là hai mã khác nhau. từ mô hình Lm bạn cần các hệ số. trong khi từ mô hình aov bạn chỉ lập bảng các nguồn biến thể. Hãy thử mã

anova(lm(data~f1*f2))
Analysis of Variance Table

Response: data
          Df Sum Sq Mean Sq F value Pr(>F)
f1         1 0.5347 0.53468  0.5966 0.4621
f2         1 0.0018 0.00177  0.0020 0.9657
f1:f2      1 0.1208 0.12084  0.1348 0.7230
Residuals  8 7.1692 0.89615   

Điều này đưa ra bảng tổng hợp các nguồn biến thể dẫn đến cùng một kết quả.


2
Điều này dường như không trả lời câu hỏi, mà hỏi tại sao giá trị p cho f1f2khác nhau trong hai bản tóm tắt của bảng trên cùng của bạn. Có vẻ như bạn đang chỉ cho thấy summary(aov(...))anova(lm(...))trong Rcó đầu ra tương tự.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.