Tại sao R trả về NA dưới dạng hệ số lm ()?


32

Tôi đang điều chỉnh lm()mô hình cho một tập dữ liệu bao gồm các chỉ số cho quý tài chính (Q1, Q2, Q3, biến Q4 thành mặc định). Sử dụng lm(Y~., data = data) Tôi nhận được một NAhệ số cho Q3 và một cảnh báo rằng một biến đã bị loại trừ do các điểm kỳ dị.

Tôi có cần thêm cột Q4 không?

Câu trả lời:


39

NA là một hệ số trong hồi quy chỉ ra rằng biến trong câu hỏi có liên quan tuyến tính với các biến khác. Trong trường hợp của bạn, điều này có nghĩa là đối với một số a , b , c . Nếu đây là trường hợp, thì không có giải pháp duy nhất nào cho hồi quy mà không bỏ một trong các biến. Thêm Q 4 sẽ chỉ làm cho vấn đề tồi tệ hơn.Q3= =một×Q1+b×Q2+cmột,b,cQ4


1
Tôi đồng ý ... dường như có một vấn đề với các định nghĩa biến giả.
Đaminh Comtois

14
p>n

2
p>nchỉ là một trường hợp đặc biệt của colinearity - nếu có ít quan sát hơn dự đoán, colinearity là một định sẵn. Mặc dù bạn đúng về các điều khoản tương tác, mặc dù tôi khá chắc chắn rằng đó không phải là điều đang xảy ra ở đây.
Martin O'Leary

Các biến không liên quan tuyến tính, vì Q3 = 1 iff Q1 = Q2 = 0. Hơn nữa, việc sử dụng stepAIC () và buộc mô hình phải bao gồm cả ba biến đó không gây ra vấn đề gì. Ngoài ra, tôi có khoảng 3 lần số lượng quan sát cho các biến. Dự đoán tốt nhất của tôi là có colinearity giữa Q3 và một số biến khác, mà tôi đoán là một biến không được bao gồm bởi stepAIC.
Fraijo
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.