Xem xét các biện pháp lặp lại ANOVA (RM-ANOVA) với một yếu tố bên trong đối tượng A
và một số phép đo cho mỗi đối tượng cho mỗi cấp độ A
.
Nó liên quan chặt chẽ với ANOVA hai chiều với hai yếu tố: A
và subject
. Họ sử dụng phân hủy giống hệt nhau của tổng bình phương thành bốn phần: A
, subject
, A⋅subject
, và residual
. Tuy nhiên, ANOVA hai chiều kiểm tra tác động của A bằng cách so sánh SS của A với SS dư, trong khi RM-ANOVA kiểm tra tác động của A bằng cách so sánh SS của A với SS tương tác của chủ thể A .
Tại sao lại có sự khác biệt?
- Sự khác biệt này có tự động tuân theo cấu trúc đo lường lặp lại của dữ liệu hay là một số quy ước?
- Sự khác biệt này giữa ANOVA hai chiều và RM-ANOVA có tương ứng với việc thử nghiệm hai null khác nhau không? Nếu vậy, chính xác chúng là gì và tại sao chúng ta sẽ sử dụng các null khác nhau trong hai trường hợp này?
- Thử nghiệm ANOVA hai chiều có thể được hiểu là thử nghiệm F giữa hai mô hình lồng nhau: mô hình đầy đủ và mô hình không có A. Có thể hiểu RM-ANOVA theo cách tương tự không?
(Nếu chỉ có một phép đo cho mỗi chủ đề cho mỗi cấp độ của A, sau đó sự phân biệt loại biến mất vì A chủ đề và biến thể còn lại không thể được gỡ: Có một chiều biện pháp lặp đi lặp lại ANOVA tương đương với một hai chiều ANOVA? )
Trình diễn
Tôi sẽ sử dụng dữ liệu đồ chơi d2
được tạo trong http://dwoll.de/rexrepos/posts/anovaMixed.html . Trang web tương tự hiển thị cú pháp chính xác cho RM-ANOVA.
# Discarding between-subject factors and leaving only one within-subject factor
d = d2[d2$Xb1=='CG' & d2$Xb2 == 'f', c(1,4,6)]
(Xem phiên bản có thể tái tạo tại đây trên pastebin .) Dữ liệu trông như thế:
id Xw1 Y
1 s1 A 28.6
2 s1 A 96.6
3 s1 A 64.8
4 s1 B 107.5
5 s1 B 77.3
6 s1 B 120.9
7 s1 C 141.2
8 s1 C 124.1
9 s1 C 88.0
10 s2 A 86.7
...
Đây là ANOVA hai chiều: summary(aov(Y ~ Xw1*id, d))
Df Sum Sq Mean Sq F value Pr(>F)
Xw1 2 95274 47637 16.789 3.73e-07 ***
id 19 31359 1650 0.582 0.913
Xw1:id 38 71151 1872 0.660 0.929
Residuals 120 340490 2837
Đây là RM-ANOVA: summary(aov(Y ~ Xw1 + Error(id/Xw1), d))
Error: id
Df Sum Sq Mean Sq F value Pr(>F)
Residuals 19 31359 1650
Error: id:Xw1
Df Sum Sq Mean Sq F value Pr(>F)
Xw1 2 95274 47637 25.44 9.73e-08 ***
Residuals 38 71151 1872
Error: Within
Df Sum Sq Mean Sq F value Pr(>F)
Residuals 120 340490 2837
Lưu ý phân tách SS giống hệt nhau, nhưng kiểm tra ANOVA hai chiều Xw1
so với phần dư, trong khi kiểm tra RM-ANOVA Xw1
chống lại sự Xw1:id
tương tác.
Tại sao?
Câu hỏi này liên quan đến Cách viết thuật ngữ lỗi trong các biện pháp lặp lại ANOVA trong R: Error (chủ đề) so với Error (chủ đề / thời gian) . Nếu chúng ta thử sử dụng Error(id)
thay vì Error(id/Xw1)
trong ví dụ trên, thì Xw1
sẽ được kiểm tra chống lại Xw1:id
sự tương tác gộp lại với biến thể dư.
. / cốt truyện / biến chủ đề id
.)
subject
hiệu quả (và tất cả các tương tác của nó!) Là ngẫu nhiên, trong khi 2-way ANOVA xử lý nó như đã sửa. Tôi phải suy nghĩ nhiều hơn về nó để tìm ra tất cả các chi tiết.