Đưa ra ba biến số y
và x
liên tục dương, và z
phân loại, tôi có hai mô hình ứng cử viên được đưa ra bởi:
fit.me <- lmer( y ~ 1 + x + ( 1 + x | factor(z) ) )
và
fit.fe <- lm( y ~ 1 + x )
Tôi hy vọng so sánh các mô hình này để xác định mô hình nào là phù hợp hơn. Dường như với tôi rằng trong một số ý nghĩa fit.fe
được lồng trong fit.me
. Thông thường, khi kịch bản chung này được giữ, một phép thử chi bình phương có thể được thực hiện. Trong R
, chúng ta có thể thực hiện kiểm tra này bằng lệnh sau,
anova(fit.fe,fit.me)
Khi cả hai mô hình đều chứa các hiệu ứng ngẫu nhiên (được tạo bởi lmer
từ lme4
gói), anova()
lệnh sẽ hoạt động tốt. Do các tham số biên, thông thường nên kiểm tra thống kê Chi-Square kết quả thông qua mô phỏng, tuy nhiên, chúng ta vẫn có thể sử dụng thống kê trong quy trình mô phỏng.
Khi cả hai mô hình chỉ chứa các hiệu ứng cố định, cách tiếp cận này --- và, anova()
lệnh liên quan --- hoạt động tốt.
Tuy nhiên, khi một mô hình chứa các hiệu ứng ngẫu nhiên và mô hình rút gọn chỉ chứa các hiệu ứng cố định, như trong kịch bản trên, anova()
lệnh không hoạt động.
Cụ thể hơn, tôi nhận được lỗi sau:
> anova(fit.fe, fit.me)
Error: $ operator not defined for this S4 class
Có điều gì sai khi sử dụng phương pháp Chi-Square từ phía trên (với mô phỏng) không? Hay đây đơn giản chỉ là vấn đề anova()
không biết cách xử lý các mô hình tuyến tính được tạo bởi các hàm khác nhau?
Nói cách khác, nó có thích hợp để tạo thủ công thống kê Chi-Square có nguồn gốc từ các mô hình không? Nếu vậy, mức độ tự do thích hợp để so sánh các mô hình này là gì? Theo tính toán của tôi:
Chúng tôi đang ước tính hai tham số trong mô hình hiệu ứng cố định (độ dốc và giao thoa) và hai tham số nữa (tham số phương sai cho độ dốc ngẫu nhiên và chặn ngẫu nhiên) trong mô hình hiệu ứng hỗn hợp. Thông thường, tham số chặn không được tính theo mức độ tính toán tự do, do đó ngụ ý rằng và ; đã nói rằng tôi không chắc liệu các tham số phương sai cho các tham số hiệu ứng ngẫu nhiên có nên được đưa vào mức độ tính toán tự do hay không; các ước tính phương sai cho các tham số hiệu ứng cố định không được xem xét , nhưng tôi tin rằng đó là do các ước tính tham số cho các hiệu ứng cố định được coi là hằng số chưa biết trong khi chúng được coi là các biến ngẫu nhiên không thể biết đượccho các hiệu ứng hỗn hợp. Tôi sẽ đánh giá cao một số hỗ trợ về vấn đề này.
Cuối cùng, có ai có R
giải pháp ( dựa trên cơ sở) phù hợp hơn để so sánh các mô hình này không?
lm()
bằnggls()
từnlme
gói vàlmer()
vớilme()
(một lần nữa từnlme
gói), mọi thứ sẽ hoạt động tốt. Nhưng lưu ý rằng bạn sẽ có được một bài kiểm tra bảo thủ (giá trị p quá lớn ), vì các tham số cho mô hình đơn giản hơn nằm trên ranh giới của không gian tham số. Và thực sự lựa chọn có bao gồm các hiệu ứng ngẫu nhiên nên dựa trên lý thuyết (ví dụ: kế hoạch lấy mẫu), không dựa trên kiểm tra thống kê.