Lần đầu tiên tôi gặp ANOVA khi tôi còn là sinh viên Thạc sĩ tại Oxford năm 1978. Cách tiếp cận hiện đại, bằng cách dạy các biến liên tục và phân loại cùng nhau trong mô hình hồi quy bội, khiến các nhà thống kê trẻ khó hiểu điều gì đang xảy ra. Vì vậy, nó có thể hữu ích để trở lại thời gian đơn giản hơn.
Ở dạng ban đầu, ANOVA là một bài tập về số học, theo đó bạn chia tổng số bình phương thành các phần liên quan đến phương pháp điều trị, khối, tương tác, bất cứ điều gì. Trong một thiết lập cân bằng, các tổng bình phương có ý nghĩa trực quan (như SSB và SST) cộng với tổng số bình phương đã điều chỉnh. Tất cả những điều này hoạt động là nhờ Định lý của Cochran . Sử dụng Cochran, bạn có thể tìm ra các giá trị dự kiến của các thuật ngữ này theo các giả thuyết null thông thường và thống kê F chảy từ đó.
Như một phần thưởng, một khi bạn bắt đầu nghĩ về Cochran và các tổng bình phương, sẽ rất hợp lý khi tiếp tục cắt và cắt nhỏ các trị số của các ô vuông bằng cách sử dụng các tương phản trực giao. Mỗi mục trong bảng ANOVA nên có một cách giải thích về mối quan tâm đối với nhà thống kê và đưa ra một giả thuyết có thể kiểm chứng.
Gần đây tôi đã viết một câu trả lời cho thấy sự khác biệt giữa các phương pháp MOM và ML. Câu hỏi bật ước tính mô hình hiệu ứng ngẫu nhiên. Tại thời điểm này, phương pháp ANOVA truyền thống hoàn toàn là công ty phụ tùng với ước tính khả năng tối đa và các ước tính về hiệu ứng không còn giống nhau. Khi thiết kế không cân bằng, bạn cũng không nhận được số liệu thống kê F giống nhau.
σ2pσ2σ2+ N σ2pnσ2b^. ANOVA mang lại một phương pháp ước lượng khoảnh khắc cho phương sai hiệu ứng ngẫu nhiên. Bây giờ, chúng ta có xu hướng giải quyết các vấn đề như vậy với các mô hình hiệu ứng hỗn hợp và các thành phần phương sai thu được thông qua ước tính khả năng tối đa hoặc REML.
ANOVA như vậy không phải là một phương pháp thủ tục khoảnh khắc. Nó bật chia tách tổng bình phương (hay nói chung hơn là một dạng phản ứng bậc hai) thành các thành phần mang lại các giả thuyết có ý nghĩa. Nó phụ thuộc mạnh mẽ vào tính quy tắc vì chúng tôi muốn các tổng bình phương có các phân phối chi bình phương cho các thử nghiệm F hoạt động.
Khung khả năng tối đa là tổng quát hơn và áp dụng cho các tình huống như mô hình tuyến tính tổng quát nơi các tổng bình phương không áp dụng. Một số phần mềm (như R) mời sự nhầm lẫn bằng cách chỉ định các phương pháp anova để kiểm tra tỷ lệ khả năng với các phân phối chi bình phương không triệu chứng. Người ta có thể biện minh cho việc sử dụng thuật ngữ "anova", nhưng nói đúng ra, lý thuyết đằng sau nó là khác nhau.