Tôi hiện đang chạy một số mô hình tuyến tính hiệu ứng hỗn hợp.
Tôi đang sử dụng gói "lme4" trong R.
Mô hình của tôi có dạng:
model <- lmer(response ~ predictor1 + predictor2 + (1 | random effect))
Trước khi chạy các mô hình của mình, tôi đã kiểm tra tính đa hình có thể có giữa các yếu tố dự đoán.
Tôi đã làm điều này bằng cách:
Tạo một khung dữ liệu của các yếu tố dự đoán
dummy_df <- data.frame(predictor1, predictor2)
Sử dụng hàm "cor" để tính toán tương quan Pearson giữa các yếu tố dự đoán.
correl_dummy_df <- round(cor(dummy_df, use = "pair"), 2)
Nếu "tương ứng_dummy_df" lớn hơn 0,80, thì tôi đã quyết định rằng dự đoán1 và dự đoán2 có mối tương quan quá cao và chúng không được đưa vào các mô hình của tôi.
Khi thực hiện một số bài đọc, sẽ xuất hiện nhiều cách khách quan hơn để kiểm tra tính đa hình.
Có ai có lời khuyên nào về điều này?
"Yếu tố lạm phát phương sai (VIF)" có vẻ như là một phương pháp hợp lệ.
VIF có thể được tính bằng cách sử dụng chức năng "corvif" trong gói AED (không phải cran). Gói này có thể được tìm thấy tại http://www.highstat.com/book2.htm . Gói hỗ trợ cuốn sách sau:
Zuur, AF, Ieno, EN, Walker, N., Saveliev, AA & Smith, GM 2009. Các mô hình hiệu ứng hỗn hợp và các phần mở rộng trong hệ sinh thái với R, phiên bản 1. Springer, New York.
Có vẻ như một quy tắc chung là nếu VIF> 5, thì tính đa hình cao giữa các yếu tố dự đoán.
Là sử dụng VIF mạnh hơn tương quan Pearson đơn giản?
Cập nhật
Tôi tìm thấy một blog thú vị tại:
http://hlplab.wordpress.com/2011/02/24/diagnose-collinearity-in-lme4/
Blogger cung cấp một số mã hữu ích để tính toán VIF cho các mô hình từ gói lme4.
Tôi đã kiểm tra mã và nó hoạt động rất tốt. Trong phân tích tiếp theo của tôi, tôi đã thấy rằng tính đa hình không phải là vấn đề đối với các mô hình của tôi (tất cả các giá trị VIF <3). Điều này thật thú vị, trước đây tôi đã tìm thấy mối tương quan Pearson cao giữa một số dự đoán.
http://highstat.com/Books/BGS/GAMM/RCodeP2/HighstatLibV6.R
AED
Gói đã bị ngưng ; thay vào đó, chỉsource("http://www.highstat.com/Book2/HighstatLibV6.R")
chocorvif
chức năng. (2) Hy vọng sẽ cung cấp một câu trả lời thực sự, nhưng (a) Tôi tin rằng VIF tính đến tính đa hình (ví dụ: bạn có thể có ba yếu tố dự đoán, không có yếu tố nào có mối tương quan cặp đôi mạnh mẽ, nhưng sự kết hợp tuyến tính của A và B có tương quan mạnh với C ) và (b) Tôi có sự bảo lưu mạnh mẽ về sự khôn ngoan của việc bỏ các điều khoản cộng tuyến; xem Graham Ecology 2003, doi: 10.1890 / 02-3114