Câu hỏi này rõ ràng xuất phát từ một nghiên cứu với thiết kế hai chiều không cân bằng, được phân tích trong R với aov()
chức năng; trang này cung cấp một ví dụ gần đây và chi tiết hơn về vấn đề này.
Câu trả lời chung cho câu hỏi này, cũng như rất nhiều, là: "Nó phụ thuộc." Ở đây nó phụ thuộc vào việc thiết kế có cân bằng hay không, và nếu không, hương vị của ANOVA được chọn.
Đầu tiên, nó phụ thuộc vào việc thiết kế có cân bằng hay không. Trong thế giới tốt nhất trong tất cả các thế giới có thể, với số lượng trường hợp bằng nhau trong tất cả các ô của thiết kế giai thừa, sẽ không có sự khác biệt do thứ tự nhập các yếu tố vào mô hình, bất kể ANOVA được thực hiện như thế nào. , rõ ràng từ một đoàn hệ lâm sàng hồi cứu, dường như đến từ một thế giới thực, nơi không tìm thấy sự cân bằng như vậy. Vì vậy, thứ tự có thể có vấn đề.
Thứ hai, nó phụ thuộc vào cách ANOVA được thực hiện, đây là một vấn đề gây tranh cãi. Các loại ANOVA cho các thiết kế không cân bằng khác nhau theo thứ tự đánh giá các hiệu ứng và tương tác chính. Đánh giá các tương tác là nền tảng của ANOVA hai chiều và bậc cao hơn, do đó, có tranh chấp về cách tốt nhất để tiến hành. Xem trang Xác thực chéo này để biết một lời giải thích và thảo luận. Xem Chi tiết và Cảnh báo cho chức năng Anova()
(có chữ "A") trong hướng dẫn sử dụng car
gói để có chế độ xem khác.
Thứ tự của các yếu tố không thành vấn đề trong các thiết kế không cân bằng theo mặc định aov()
trong R, sử dụng cái được gọi là thử nghiệm loại I. Đây là các phân bổ tuần tự của phương sai cho các yếu tố theo thứ tự nhập vào mô hình, như câu hỏi hiện tại được hình dung. Thứ tự không quan trọng với các thử nghiệm loại II hoặc loại III được cung cấp bởi Anova()
chức năng trong car
gói trong R. Tuy nhiên, các lựa chọn thay thế này có những nhược điểm tiềm năng riêng được ghi nhận trong các liên kết trên.
Cuối cùng, hãy xem xét mối quan hệ với nhiều hồi quy tuyến tính như lm()
trong R, về cơ bản là cùng một kiểu mô hình nếu bạn bao gồm các thuật ngữ tương tác. Thứ tự nhập của các biến lm()
không quan trọng về các hệ số hồi quy và giá trị p được báo cáo bởi summary(lm())
, trong đó một yếu tố phân loại cấp k được mã hóa là các biến giả nhị phân (k-1) và hệ số hồi quy được báo cáo cho mỗi hình nộm .
Tuy nhiên, có thể bọc lm()
đầu ra bằng anova()
(chữ thường "a," từ stats
gói R ) hoặc Anova()
tóm tắt ảnh hưởng của từng yếu tố trên tất cả các cấp độ của nó, như người ta mong đợi trong ANOVA cổ điển. Sau đó, thứ tự của các yếu tố sẽ quan trọng anova()
như đối với aov()
, và sẽ không quan trọng với Anova()
. Tương tự, các tranh chấp về loại ANOVA sẽ sử dụng sẽ trở lại. Vì vậy, sẽ không an toàn khi giả định sự độc lập theo thứ tự của yếu tố nhập với tất cả các lm()
mô hình sử dụng xuôi dòng .
* Có số lượng quan sát bằng nhau trong tất cả các ô là đủ nhưng, theo tôi hiểu, không cần thiết cho thứ tự các yếu tố không liên quan. Các loại cân bằng ít đòi hỏi hơn có thể cho phép độc lập trật tự.