Câu hỏi chính của tôi là làm thế nào để giải thích đầu ra (hệ số, F, P) khi tiến hành ANOVA loại I (tuần tự)?
Vấn đề nghiên cứu cụ thể của tôi phức tạp hơn một chút, vì vậy tôi sẽ chia ví dụ của mình thành nhiều phần. Đầu tiên, nếu tôi quan tâm đến ảnh hưởng của mật độ nhện (X1) đối với sự phát triển của cây (Y1) và tôi đã trồng cây con trong vỏ bọc và mật độ nhện thao tác, thì tôi có thể phân tích dữ liệu bằng ANOVA đơn giản hoặc hồi quy tuyến tính. Sau đó, sẽ không có vấn đề gì nếu tôi sử dụng Sum I, II hoặc III Sum of Squares (SS) cho ANOVA của tôi. Trong trường hợp của tôi, tôi có 4 lần lặp lại 5 mức mật độ, vì vậy tôi có thể sử dụng mật độ như một yếu tố hoặc như một biến liên tục. Trong trường hợp này, tôi thích giải thích nó như một biến độc lập (dự đoán) liên tục. Trong RI có thể chạy như sau:
lm1 <- lm(y1 ~ density, data = Ena)
summary(lm1)
anova(lm1)
Chạy chức năng anova sẽ có ý nghĩa để so sánh sau này hy vọng, vì vậy xin vui lòng bỏ qua sự kỳ lạ của nó ở đây. Đầu ra là:
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4279 0.08058 .
Residuals 18 2.53920 0.14107
Bây giờ, giả sử tôi nghi ngờ rằng mức độ khởi đầu của nitơ vô cơ trong đất, mà tôi không thể kiểm soát, cũng có thể ảnh hưởng đáng kể đến sự phát triển của cây. Tôi không đặc biệt quan tâm đến hiệu ứng này nhưng có khả năng tính đến sự thay đổi mà nó gây ra. Thực sự, mối quan tâm hàng đầu của tôi là ảnh hưởng của mật độ nhện (giả thuyết: mật độ nhện tăng làm tăng sự phát triển của cây - có lẽ thông qua việc giảm côn trùng ăn cỏ nhưng tôi chỉ thử nghiệm tác dụng chứ không phải cơ chế). Tôi có thể thêm tác dụng của N vô cơ vào phân tích của mình.
Vì câu hỏi của tôi, hãy giả vờ rằng tôi kiểm tra mật độ tương tác * vô cơ và nó không đáng kể để tôi loại bỏ nó khỏi phân tích và chạy các hiệu ứng chính sau:
> lm2 <- lm(y1 ~ density + inorganicN, data = Ena)
> anova(lm2)
Analysis of Variance Table
Response: y1
Df Sum Sq Mean Sq F value Pr(>F)
density 1 0.48357 0.48357 3.4113 0.08223 .
inorganicN 1 0.12936 0.12936 0.9126 0.35282
Residuals 17 2.40983 0.14175
Bây giờ, điều này tạo ra sự khác biệt cho dù tôi sử dụng SS loại I hay loại II (tôi biết một số người phản đối các thuật ngữ Loại I & II, v.v. nhưng với sự phổ biến của SAS thì dễ sử dụng). R anova {stats} sử dụng Loại I theo mặc định. Tôi có thể tính toán mật độ SS, F và P loại II bằng cách đảo ngược thứ tự các hiệu ứng chính của mình hoặc tôi có thể sử dụng gói "xe hơi" của Tiến sĩ John Fox (đồng hành với hồi quy được áp dụng). Tôi thích phương pháp sau vì nó dễ dàng hơn cho các vấn đề phức tạp hơn.
library(car)
Anova(lm2)
Sum Sq Df F value Pr(>F)
density 0.58425 1 4.1216 0.05829 .
inorganicN 0.12936 1 0.9126 0.35282
Residuals 2.40983 17
Sự hiểu biết của tôi là các giả thuyết loại II sẽ là "Không có hiệu ứng tuyến tính của x1 trên y1 do hiệu ứng của (giữ hằng số?) X2" và tương tự đối với x2 đã cho x1. Tôi đoán đây là nơi tôi bị lẫn lộn. Giả thuyết đang được ANOVA thử nghiệm bằng phương pháp loại I (tuần tự) ở trên so với giả thuyết sử dụng phương pháp loại II là gì?
Trong thực tế, dữ liệu của tôi phức tạp hơn một chút vì tôi đã đo được nhiều số liệu về sự tăng trưởng của thực vật cũng như động lực dinh dưỡng và sự phân hủy rác. Phân tích thực tế của tôi là một cái gì đó như:
Y <- cbind(y1 + y2 + y3 + y4 + y5)
# Type II
mlm1 <- lm(Y ~ density + nitrate + Npred, data = Ena)
Manova(mlm1)
Type II MANOVA Tests: Pillai test statistic
Df test stat approx F num Df den Df Pr(>F)
density 1 0.34397 1 5 12 0.34269
nitrate 1 0.99994 40337 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
# Type I
maov1 <- manova(Y ~ density + nitrate + Npred, data = Ena)
summary(maov1)
Df Pillai approx F num Df den Df Pr(>F)
density 1 0.99950 4762 5 12 < 2e-16 ***
nitrate 1 0.99995 46248 5 12 < 2e-16 ***
Npred 1 0.65582 5 5 12 0.01445 *
Residuals 16