Ý tôi là bất kỳ lý do nào ngoài sự thuận tiện để có thể hoàn thành phân tích trong một quy trình duy nhất.
Ý tôi là bất kỳ lý do nào ngoài sự thuận tiện để có thể hoàn thành phân tích trong một quy trình duy nhất.
Câu trả lời:
Vâng, vì nhiều lý do!
1) Nghịch lý Simpsons . Trừ khi thiết kế được cân bằng, nếu một trong các biến ảnh hưởng đến kết quả, bạn không thể đánh giá đúng hướng của hiệu ứng của cái kia mà không điều chỉnh cho lần đầu tiên (cụ thể là xem sơ đồ đầu tiên tại liên kết - được sao chép dưới đây **). Điều này minh họa vấn đề - hiệu ứng trong nhóm đang tăng (hai vạch màu), nhưng nếu bạn bỏ qua nhóm màu đỏ-xanh, bạn sẽ có hiệu ứng giảm (đường đứt nét, màu xám) - hoàn toàn là dấu hiệu sai!
Mặc dù điều đó cho thấy một tình huống với một biến liên tục và một nhóm, những điều tương tự có thể xảy ra khi các hiệu ứng chính hai chiều không cân bằng ANOVA được coi là hai mô hình một chiều.
2) Chúng ta hãy giả sử có một thiết kế hoàn toàn cân bằng. Sau đó, bạn vẫn muốn làm điều đó, bởi vì nếu bạn bỏ qua biến thứ hai trong khi nhìn vào biến thứ nhất (giả sử cả hai đều có tác động) thì hiệu ứng của thứ hai sẽ đi vào thuật ngữ nhiễu , thổi phồng nó ... và vì vậy thiên vị tất cả tiêu chuẩn của bạn lỗi trở lên. Trong trường hợp đó, các hiệu ứng quan trọng - và quan trọng - có thể trông giống như tiếng ồn.
Xem xét các dữ liệu sau đây, một phản ứng liên tục và hai yếu tố phân loại danh nghĩa:
y x1 x2
1 2.33 A 1
2 1.90 B 1
3 4.77 C 1
4 3.48 A 2
5 1.34 B 2
6 4.16 C 2
7 5.88 A 3
8 2.56 B 3
9 5.97 C 3
10 5.10 A 4
11 2.62 B 4
12 6.21 C 4
13 6.54 A 5
14 6.01 B 5
15 9.62 C 5
Hai cách hiệu ứng chính anova rất có ý nghĩa (vì nó cân bằng, thứ tự không thành vấn đề):
Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.644 13.3220 24.284 0.0004000
x2 4 38.889 9.7222 17.722 0.0004859
Residuals 8 4.389 0.5486
Nhưng cá thể một chiều anovas không đáng kể ở mức 5%:
(1) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x1 2 26.687 13.3436 3.6967 0.05613
Residuals 12 43.315 3.6096
(2) Analysis of Variance Table
Response: y
Df Sum Sq Mean Sq F value Pr(>F)
x2 4 38.889 9.7222 3.1329 0.06511
Residuals 10 31.033 3.1033
Lưu ý trong mỗi trường hợp rằng bình phương trung bình của yếu tố không thay đổi ... nhưng bình phương trung bình còn lại tăng đáng kể (từ 0,55 đến hơn 3 trong mỗi trường hợp). Đó là hiệu ứng của việc bỏ đi một biến quan trọng.
** (sơ đồ trên được tạo bởi người dùng Wikipedia Schutz , nhưng được đặt trong phạm vi công cộng; trong khi phân bổ không bắt buộc đối với các mục trong miền công cộng, tôi cảm thấy nó xứng đáng được công nhận)
Đúng. Nếu hai biến độc lập có liên quan và / hoặc ANOVA không cân bằng, thì ANOVA hai chiều cho bạn thấy tác động của từng biến kiểm soát đối với biến còn lại.