Tôi chạy vào chính xác cùng một câu hỏi và cố gắng vượt qua. Xem câu trả lời chi tiết của tôi dưới đây.
Trước hết, tôi tìm thấy 4 tùy chọn tạo ra các giá trị VIF tương tự trong R:
• corvif
lệnh từ gói AED,
• vif
lệnh từ gói xe hơi,
• vif
lệnh từ gói rms,
• vif
lệnh từ gói DAAG.
Sử dụng các lệnh này trên một tập hợp các yếu tố dự đoán không bao gồm bất kỳ yếu tố / biến phân loại hoặc thuật ngữ đa thức nào là hướng về phía trước. Tất cả ba lệnh tạo ra cùng một đầu ra số mặc dù corvif
lệnh từ gói AED ghi nhãn kết quả là GVIF.
Tuy nhiên, thông thường, GVIF chỉ phát huy tác dụng cho các yếu tố và biến đa thức. Các biến đòi hỏi nhiều hơn 1 hệ số và do đó hơn 1 độ tự do thường được đánh giá bằng GVIF. Đối với các điều khoản một hệ số VIF bằng GVIF.
Do đó, bạn có thể áp dụng các quy tắc chuẩn về việc liệu cộng tuyến có thể là một vấn đề hay không, chẳng hạn như ngưỡng 3, 5 hoặc 10. Tuy nhiên, một số thận trọng có thể (nên) được áp dụng (xem: http://www.nkd-group.com/ghdash/mba555/PDF/VIF%20article.pdf ).
Trong trường hợp thuật ngữ đa hệ số, ví dụ như các yếu tố dự đoán phân loại, 4 gói sản xuất các đầu ra khác nhau. Các vif
lệnh từ các gói rms và DAAG tạo ra các giá trị VIF, trong khi hai lệnh còn lại tạo ra các giá trị GVIF.
Trước tiên chúng ta hãy xem các giá trị VIF từ các gói rms và DAAG:
TNAP ICE RegB RegC RegD RegE
1.994 2.195 3.074 3.435 2.907 2.680
TNAP và ICE là các yếu tố dự đoán liên tục và Reg là một biến phân loại được trình bày bởi người giả RegB cho RegE. Trong trường hợp này, RegA là đường cơ sở. Tất cả các giá trị VIF khá vừa phải và thường không có gì phải lo lắng. Vấn đề với kết quả này là, nó bị ảnh hưởng bởi đường cơ sở của biến phân loại. Để chắc chắn không có giá trị VIF trên mức chấp nhận được, cần phải làm lại phân tích này cho mọi cấp độ của biến phân loại là đường cơ sở. Trong trường hợp này năm lần.
Áp dụng corvif
lệnh từ gói AED hoặc vif
lệnh từ gói xe hơi, các giá trị GVIF được tạo ra:
| GVIF | Df | GVIF^(1/2Df) |
TNAP | 1.993964 | 1 | 1.412078 |
ICE | 2.195035 | 1 | 1.481565 |
Reg | 55.511089 | 5 | 1.494301 |
GVIF được tính cho các bộ hồi quy có liên quan, chẳng hạn như một bộ hồi quy giả. Đối với hai biến liên tục TNAP và ICE, đây giống như các giá trị VIF trước đó. Đối với biến phân loại Reg, giờ đây chúng ta nhận được một giá trị GVIF rất cao, mặc dù các giá trị VIF cho các mức duy nhất của biến phân loại đều ở mức vừa phải (như được hiển thị ở trên).
GVIF(1/(2×Df))GVIF(1/(2×Df))giá trị của biến phân loại là một thước đo tương tự để giảm độ chính xác của ước lượng của các hệ số do tính cộng tuyến (ngay cả khi chưa sẵn sàng để trích dẫn, hãy xem http://socserv2.socsci.mcmaster.ca/jfox/ con / linear- mô hình-vấn đề.pdf ).
GVIF(1/(2×Df))GVIF(1/(2×Df))
GVIF(1/(2×Df))GVIF(1/(2×Df))GVIF2(1/(2×Df))<2