Nếu tôi không quan tâm đến sự tương tác, có lý do nào để chạy ANOVA hai chiều thay vì hai ANOVA một chiều không?

9

Ý tôi là bất kỳ lý do nào ngoài sự thuận tiện để có thể hoàn thành phân tích trong một quy trình duy nhất.

anova

— user1205901 - Phục hồi Monica
nguồn

1

Đây là điều: nếu có một sự tương tác thì sẽ không có nghĩa là "không quan tâm đến nó", bởi vì bạn không thể giải thích một cách có ý nghĩa các hiệu ứng chính nếu có tương tác. Vì vậy, ngoài câu trả lời dưới đây, tôi mong bạn hãy xem xét lại những gì bạn đang làm.

— Erik

19

Vâng, vì nhiều lý do!

1) Nghịch lý Simpsons . Trừ khi thiết kế được cân bằng, nếu một trong các biến ảnh hưởng đến kết quả, bạn không thể đánh giá đúng hướng của hiệu ứng của cái kia mà không điều chỉnh cho lần đầu tiên (cụ thể là xem sơ đồ đầu tiên tại liên kết - được sao chép dưới đây **). Điều này minh họa vấn đề - hiệu ứng trong nhóm đang tăng (hai vạch màu), nhưng nếu bạn bỏ qua nhóm màu đỏ-xanh, bạn sẽ có hiệu ứng giảm (đường đứt nét, màu xám) - hoàn toàn là dấu hiệu sai!

nhập mô tả hình ảnh ở đây

Mặc dù điều đó cho thấy một tình huống với một biến liên tục và một nhóm, những điều tương tự có thể xảy ra khi các hiệu ứng chính hai chiều không cân bằng ANOVA được coi là hai mô hình một chiều.

2) Chúng ta hãy giả sử có một thiết kế hoàn toàn cân bằng. Sau đó, bạn vẫn muốn làm điều đó, bởi vì nếu bạn bỏ qua biến thứ hai trong khi nhìn vào biến thứ nhất (giả sử cả hai đều có tác động) thì hiệu ứng của thứ hai sẽ đi vào thuật ngữ nhiễu , thổi phồng nó ... và vì vậy thiên vị tất cả tiêu chuẩn của bạn lỗi trở lên. Trong trường hợp đó, các hiệu ứng quan trọng - và quan trọng - có thể trông giống như tiếng ồn.

Xem xét các dữ liệu sau đây, một phản ứng liên tục và hai yếu tố phân loại danh nghĩa:

      y x1 x2
1  2.33  A  1
2  1.90  B  1
3  4.77  C  1
4  3.48  A  2
5  1.34  B  2
6  4.16  C  2
7  5.88  A  3
8  2.56  B  3
9  5.97  C  3
10 5.10  A  4
11 2.62  B  4
12 6.21  C  4
13 6.54  A  5
14 6.01  B  5
15 9.62  C  5

Hai cách hiệu ứng chính anova rất có ý nghĩa (vì nó cân bằng, thứ tự không thành vấn đề):

Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value    Pr(>F)    
x1         2 26.644 13.3220  24.284 0.0004000 
x2         4 38.889  9.7222  17.722 0.0004859 
Residuals  8  4.389  0.5486

Nhưng cá thể một chiều anovas không đáng kể ở mức 5%:

(1) Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value  Pr(>F)  
x1         2 26.687 13.3436  3.6967 0.05613 
Residuals 12 43.315  3.6096                  

(2) Analysis of Variance Table
Response: y
          Df Sum Sq Mean Sq F value  Pr(>F)  
x2         4 38.889  9.7222  3.1329 0.06511 
Residuals 10 31.033  3.1033

Lưu ý trong mỗi trường hợp rằng bình phương trung bình của yếu tố không thay đổi ... nhưng bình phương trung bình còn lại tăng đáng kể (từ 0,55 đến hơn 3 trong mỗi trường hợp). Đó là hiệu ứng của việc bỏ đi một biến quan trọng.

** ^{(sơ đồ trên được tạo bởi người dùng Wikipedia Schutz , nhưng được đặt trong phạm vi công cộng; trong khi phân bổ không bắt buộc đối với các mục trong miền công cộng, tôi cảm thấy nó xứng đáng được công nhận)}

— Glen_b -Reinstate Monica
nguồn

6

Đúng. Nếu hai biến độc lập có liên quan và / hoặc ANOVA không cân bằng, thì ANOVA hai chiều cho bạn thấy tác động của từng biến kiểm soát đối với biến còn lại.

— Peter Flom
nguồn