Yếu tố lạm phát đúng tôi nên sử dụng:


30

Tôi đang cố gắng để giải thích các yếu tố lạm phát đúng bằng cách sử dụng vifchức năng trong gói R car. Các bản in chức năng vừa là một khái quát hóa và cũng GVIF 1 / ( 2 df ) . Theo tệp trợ giúp , giá trị sau nàyVIFGVIF1/(2df)

Để điều chỉnh kích thước của ellipsoid độ tin cậy, hàm cũng in GVIF ^ [1 / (2 * df)] trong đó df là mức độ tự do liên quan đến thuật ngữ.

Tôi không hiểu ý nghĩa của lời giải thích này trong tập tin trợ giúp, vì vậy tôi không chắc chắn nếu tôi nên sử dụng hoặc GVIF 1 / ( 2 df ) . Đối với mô hình của tôi hai giá trị này là rất khác nhau (tối đa GVIF là ~ 60 ; tối đa GVIF 1 / ( 2 df ) là ~ 3 ).GVIFGVIF1/(2df)GVIF60GVIF1/(2df)3

Ai đó có thể vui lòng giải thích cho tôi nên sử dụng loại nào và điều gì có nghĩa là bằng cách điều chỉnh kích thước của độ tin cậy ellipsoid?

Câu trả lời:


25

Georges Monette và tôi đã giới thiệu GVIF trong bài báo "Chẩn đoán cộng tác tổng quát", JASA 87: 178-183, 1992 ( liên kết ). Như chúng tôi đã giải thích, GVIF đại diện cho tỷ lệ bình phương của hypervolume của ellipsoid độ tin cậy chung cho một tập hợp các hệ số với ellipsoid "không tưởng" sẽ có được nếu các biến hồi quy trong tập hợp con này không tương thích với các biến hồi quy trong tập con này. Trong trường hợp của một hệ số duy nhất, điều này chuyên về VIF thông thường. Để làm cho GVIF có thể so sánh giữa các kích thước, chúng tôi đã đề xuất sử dụng GVIF ^ (1 / (2 * Df)), trong đó Df là số lượng hệ số trong tập hợp con. Trên thực tế, điều này làm giảm GVIF thành thước đo tuyến tính và đối với VIF, trong đó Df = 1, tỷ lệ thuận với lạm phát do cộng tuyến trong khoảng tin cậy cho hệ số.


3
Chào mừng đến với trang web của chúng tôi! Chúng tôi sẽ rất vinh dự nếu bạn đăng ký tài khoản của mình và ghé thăm một lần trong một thời gian. Một lưu ý nhỏ về việc dọn phòng: Bạn không cần phải ký các bài đăng của mình, số nhận dạng của bạn, với một liên kết đến trang người dùng của bạn, sẽ tự động được thêm vào mỗi câu trả lời bạn đưa ra.
gung - Phục hồi Monica

24

Tôi chạy vào chính xác cùng một câu hỏi và cố gắng vượt qua. Xem câu trả lời chi tiết của tôi dưới đây.

Trước hết, tôi tìm thấy 4 tùy chọn tạo ra các giá trị VIF tương tự trong R:

corviflệnh từ gói AED,

viflệnh từ gói xe hơi,

viflệnh từ gói rms,

viflệnh từ gói DAAG.

Sử dụng các lệnh này trên một tập hợp các yếu tố dự đoán không bao gồm bất kỳ yếu tố / biến phân loại hoặc thuật ngữ đa thức nào là hướng về phía trước. Tất cả ba lệnh tạo ra cùng một đầu ra số mặc dù corviflệnh từ gói AED ghi nhãn kết quả là GVIF.

Tuy nhiên, thông thường, GVIF chỉ phát huy tác dụng cho các yếu tố và biến đa thức. Các biến đòi hỏi nhiều hơn 1 hệ số và do đó hơn 1 độ tự do thường được đánh giá bằng GVIF. Đối với các điều khoản một hệ số VIF bằng GVIF.

Do đó, bạn có thể áp dụng các quy tắc chuẩn về việc liệu cộng tuyến có thể là một vấn đề hay không, chẳng hạn như ngưỡng 3, 5 hoặc 10. Tuy nhiên, một số thận trọng có thể (nên) được áp dụng (xem: http://www.nkd-group.com/ghdash/mba555/PDF/VIF%20article.pdf ).

Trong trường hợp thuật ngữ đa hệ số, ví dụ như các yếu tố dự đoán phân loại, 4 gói sản xuất các đầu ra khác nhau. Các viflệnh từ các gói rms và DAAG tạo ra các giá trị VIF, trong khi hai lệnh còn lại tạo ra các giá trị GVIF.

Trước tiên chúng ta hãy xem các giá trị VIF từ các gói rms và DAAG:

TNAP     ICE     RegB    RegC    RegD    RegE

1.994    2.195   3.074   3.435   2.907   2.680

TNAP và ICE là các yếu tố dự đoán liên tục và Reg là một biến phân loại được trình bày bởi người giả RegB cho RegE. Trong trường hợp này, RegA là đường cơ sở. Tất cả các giá trị VIF khá vừa phải và thường không có gì phải lo lắng. Vấn đề với kết quả này là, nó bị ảnh hưởng bởi đường cơ sở của biến phân loại. Để chắc chắn không có giá trị VIF trên mức chấp nhận được, cần phải làm lại phân tích này cho mọi cấp độ của biến phân loại là đường cơ sở. Trong trường hợp này năm lần.

Áp dụng corviflệnh từ gói AED hoặc viflệnh từ gói xe hơi, các giá trị GVIF được tạo ra:

     |  GVIF     | Df | GVIF^(1/2Df) |  

TNAP | 1.993964  | 1  | 1.412078     |
ICE  | 2.195035  | 1  | 1.481565     | 
Reg  | 55.511089 | 5  | 1.494301     |

GVIF được tính cho các bộ hồi quy có liên quan, chẳng hạn như một bộ hồi quy giả. Đối với hai biến liên tục TNAP và ICE, đây giống như các giá trị VIF trước đó. Đối với biến phân loại Reg, giờ đây chúng ta nhận được một giá trị GVIF rất cao, mặc dù các giá trị VIF cho các mức duy nhất của biến phân loại đều ở mức vừa phải (như được hiển thị ở trên).

GVIF(1/(2×Df))GVIF(1/(2×Df))giá trị của biến phân loại là một thước đo tương tự để giảm độ chính xác của ước lượng của các hệ số do tính cộng tuyến (ngay cả khi chưa sẵn sàng để trích dẫn, hãy xem http://socserv2.socsci.mcmaster.ca/jfox/ con / linear- mô hình-vấn đề.pdf ).

GVIF(1/(2×Df))GVIF(1/(2×Df))

GVIF(1/(2×Df))GVIF(1/(2×Df))GVIF2(1/(2×Df))<2


Chào mừng đến với trang web, @JanPhilippS. Đây dường như là một câu hỏi mới giống như một câu trả lời cho câu hỏi của OP. Vui lòng chỉ sử dụng trường "Câu trả lời của bạn" để cung cấp câu trả lời. Nếu bạn có câu hỏi của riêng mình, hãy nhấp vào [ASK QUESTION]đầu và hỏi nó ở đó, sau đó chúng tôi có thể giúp bạn đúng cách. Vì bạn là người mới ở đây, bạn có thể muốn thực hiện chuyến tham quan của chúng tôi , nơi chứa thông tin cho người dùng mới.
gung - Phục hồi Monica

2
Vâng, nó không thực sự là một câu hỏi mới. Thay vào đó là một câu trả lời chi tiết.
Jan Philipp S

1
@JanPhilippS, cảm ơn các liên kết đến các nguồn để đọc thêm. Tôi nghĩ rằng bài viết của bạn có vẻ như một câu trả lời chất lượng cho phép một số phản ánh về tình trạng.
timothy.s.lau

6

Fox & Monette (trích dẫn ban đầu cho GVIF, GVIF ^ 1 / 2df) đề nghị đưa GVIF lên sức mạnh của 1 / 2df làm cho giá trị của GVIF có thể so sánh giữa các tham số khác nhau. "Thật khó chịu khi lấy căn bậc hai của yếu tố lạm phát phương sai thông thường" (từ An R và S-Plus đồng hành đến hồi quy ứng dụng của John Fox). Vì vậy, có, bình phương nó và áp dụng "quy tắc ngón tay cái" thông thường của VIF có vẻ hợp lý.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.