Sẽ rất thú vị khi đánh giá cao sự khác biệt nằm ở loại biến và đáng chú ý hơn là các loại biến giải thích . Trong ANOVA điển hình, chúng tôi có một biến phân loại với các nhóm khác nhau và chúng tôi cố gắng xác định xem phép đo của một biến liên tục có khác nhau giữa các nhóm hay không. Mặt khác, OLS có xu hướng được coi là chủ yếu là một nỗ lực đánh giá mối quan hệ giữa biến hồi quy hoặc biến trả lời liên tục và một hoặc nhiều biến hồi quy hoặc biến giải thích . Theo nghĩa này, hồi quy có thể được xem như là một kỹ thuật khác, cho vay để dự đoán các giá trị dựa trên đường hồi quy.
Tuy nhiên , sự khác biệt này không thể hiện sự mở rộng của ANOVA với phần còn lại của phân tích súp bảng chữ cái phương sai (ANCOVA, MANOVA, MANCOVA); hoặc bao gồm các biến được mã hóa giả trong hồi quy OLS. Tôi không rõ về các mốc lịch sử cụ thể, nhưng dường như cả hai kỹ thuật đã phát triển các điều chỉnh song song để giải quyết các mô hình ngày càng phức tạp.
Ví dụ, chúng ta có thể thấy rằng sự khác biệt giữa ANCOVA so với OLS với các biến giả (hoặc phân loại) (trong cả hai trường hợp có tương tác) đều là mỹ phẩm. Xin thứ lỗi cho sự ra đi của tôi từ giới hạn trong tiêu đề câu hỏi của bạn, liên quan đến nhiều hồi quy tuyến tính.
Trong cả hai trường hợp, mô hình về cơ bản giống hệt với điểm trong R , lm
hàm được sử dụng để thực hiện ANCOVA . Tuy nhiên, nó có thể được trình bày khác nhau liên quan đến việc bao gồm một phần chặn tương ứng với mức (hoặc nhóm) đầu tiên của biến nhân tố (hoặc phân loại) trong mô hình hồi quy.
Trong một mô hình cân bằng ( các nhóm có kích thước bằng nhau , ) và chỉ một biến số (để đơn giản hóa việc trình bày ma trận), có thể gặp ma trận mô hình trong ANCOVA như một số biến thể của:n 1 , 2 , ⋯tôin1 , 2 , ⋯tôi
X= ⎡⎣⎢1n10001n20001n3xn1000xn2000xn3⎤⎦⎥
cho nhóm biến nhân tố, được biểu thị dưới dạng ma trận khối.3
Điều này tương ứng với mô hình tuyến tính:
α i β
y= αtôi+ β1xn1+ β2xn2+ β3xn3+ εtôi
với tương đương với nhóm khác nhau có nghĩa là trong ANOVA mô hình, trong khi các khác nhau là các sườn của hiệp phương sai cho mỗi một trong các nhóm.
αtôiβ
Việc trình bày cùng một mô hình trong trường hồi quy, và cụ thể trong R, xem xét một đánh chặn tổng thể, tương ứng với một trong các nhóm và ma trận mô hình có thể được trình bày như sau:
X= ⎡⎣⎢⎢⎢⋮J3 n , 1⋮01n20001n3⋮x⋮0000xn2000xn3⎤⎦⎥⎥⎥
của phương trình OLS:
y= β0+ μtôi+ β1xn1+ β2xn2+ β3xn3+ εtôi
.
Trong mô hình này, phần chặn tổng thể được sửa đổi ở mỗi cấp độ nhóm theo và các nhóm cũng có độ dốc khác nhau.μ iβ0μtôi
Như bạn có thể thấy từ các ma trận mô hình, bài thuyết trình tin vào danh tính thực tế giữa hồi quy và phân tích phương sai.
Tôi thích loại xác minh điều này với một số dòng mã và dữ liệu yêu thích của tôi thiết lập mtcars
trong R . Tôi đang sử dụng lm
cho ANCOVA theo giấy của Ben Bolker tại đây .
mtcars$cyl <- as.factor(mtcars$cyl) # Cylinders variable into factor w 3 levels
D <- mtcars # The data set will be called D.
D <- D[order(D$cyl, decreasing = FALSE),] # Ordering obs. for block matrices.
model.matrix(lm(mpg ~ wt * cyl, D)) # This is the model matrix for ANCOVA
Về phần câu hỏi về cách sử dụng phương pháp nào (hồi quy với R!) Bạn có thể thấy thú vị với lời bình luận trực tuyến này mà tôi đã gặp trong khi viết bài đăng này.