Belsley, Kuh, và Welsch là các văn bản để đi đến cho các loại hình câu hỏi. Chúng bao gồm thảo luận rộng rãi về chẩn đoán cũ trong một phần có tên "Quan điểm lịch sử". Liên quan đến VIF họ viết
... Nếu chúng ta giả định dữ liệu đã được tập trung và quy mô để có đơn vị chiều dài, mối tương quan ma trận chỉ đơn giản là . ...R X ′ XXRX'X
Chúng tôi đang xem xét . Các phần tử đường chéo của , , thường được gọi là các yếu tố lạm phát phương sai, và giá trị chẩn đoán của chúng xuất phát từ mối quan hệ trong đó là hệ số tương quan bội của hồi quy trên các biến giải thích còn lại. Rõ ràng VIF cao biểu thị gần thống nhất và do đó chỉ ra cộng tuyến. Do đó, biện pháp này được sử dụng như một dấu hiệu chung của cộng tuyến. Điểm yếu của nó, giống như điểm yếu củaR−1=(X′X)−1R−1 VIF i VIF i = 1riiVIFi R 2 i XiR 2 i R
VIFi=11−R2i
R2iXiR2iR, nằm ở chỗ không có khả năng phân biệt giữa một số phụ thuộc cùng tồn tại và thiếu ranh giới có ý nghĩa để phân biệt giữa các giá trị của VIF có thể được coi là cao và các giá trị có thể được coi là thấp.
Thay vì phân tích (hoặc ), BKW đề xuất cẩn thận, kiểm tra kiểm soát của Số ít giá trị gia tăng phân hủy của . Họ thúc đẩy nó bằng cách chứng minh rằng tỷ lệ của các giá trị số nhỏ nhất và nhỏ nhất là số điều kiện của và chỉ ra cách số điều kiện cung cấp (đôi khi chặt chẽ) về sự lan truyền của các lỗi tính toán trong tính toán các ước tính hồi quy. Họ tiếp tục cố gắng phân tách gần đúng các phương sai của ước tính tham số thành các thành phần được liên kết với các giá trị số ít. Sức mạnh của sự phân hủy này nằm ở khả năng của nó (trong nhiều trường hợp) để bộc lộ bản chấtR - 1 X X β iRR−1XXβ^i của cộng tuyến, thay vì chỉ cho thấy sự hiện diện của nó.
Bất cứ ai đã xây dựng mô hình hồi quy với hàng trăm biến sẽ đánh giá cao tính năng này! Đó là một điều để phần mềm nói "dữ liệu của bạn là cộng tuyến, tôi không thể tiến hành" hoặc thậm chí để nói "dữ liệu của bạn là thông đồng, tôi đang đưa ra các biến sau." Nó hoàn toàn là một điều hữu ích hơn nhiều để có thể nói "nhóm biến đang gây ra sự không ổn định trong tính toán: xem biến nào bạn có thể làm mà không cần hoặc xem xét thực hiện phân tích thành phần chính để giảm số lượng của chúng. "Xi1,…,Xik
Cuối cùng, BKW khuyên bạn nên chẩn đoán cộng tuyến bằng phương tiện
... điều kiện kép sau đây:
- Một giá trị số ít được đánh giá là có chỉ số điều kiện cao và được liên kết với
- Tỷ lệ phân rã phương sai cao cho hai hoặc nhiều phương sai hệ số hồi quy ước tính.
Số lượng các chỉ số điều kiện được coi là lớn (giả sử, lớn hơn ) trong (1) xác định số lượng phụ thuộc gần giữa các cột của ma trận dữ liệu và cường độ của các chỉ số điều kiện cao này cung cấp thước đo độ kín của chúng. " Hơn nữa, việc xác định (2) tỷ lệ phân rã phương sai lớn (giả sử lớn hơn ) liên quan đến từng chỉ số điều kiện cao xác định các biến thiên có liên quan đến sự phụ thuộc gần tương ứng và cường độ của các tỷ lệ này kết hợp với mức cao chỉ số điều kiện cung cấp thước đo mức độ ước tính hồi quy tương ứng đã bị suy giảm do sự hiện diện của cộng tuyến.X 0,530X0.5