Các quy trình lựa chọn biến dựa trên dữ liệu phổ biến (ví dụ: tiến, lùi, từng bước, tất cả các tập hợp con) có xu hướng tạo ra các mô hình với các thuộc tính không mong muốn, bao gồm:
- Các hệ số sai lệch so với không.
- Các lỗi tiêu chuẩn quá nhỏ và khoảng tin cậy quá hẹp.
- Kiểm tra thống kê và giá trị p không có ý nghĩa được quảng cáo.
- Ước tính phù hợp với mô hình đó là quá lạc quan.
- Bao gồm các điều khoản có thể là vô nghĩa (ví dụ: loại trừ các điều khoản theo thứ tự thấp hơn).
Tuy nhiên, thủ tục lựa chọn biến vẫn tồn tại. Với các vấn đề với lựa chọn biến, tại sao các thủ tục này là cần thiết? Điều gì thúc đẩy họ sử dụng?
Một số đề xuất để bắt đầu cuộc thảo luận ....
- Mong muốn cho hệ số hồi quy có thể giải thích? (Sai lầm trong một mô hình có nhiều IV?)
- Loại bỏ phương sai được giới thiệu bởi các biến không liên quan?
- Loại bỏ hiệp phương sai / dự phòng không cần thiết giữa các biến độc lập?
- Giảm số lượng ước tính tham số (các vấn đề về công suất, cỡ mẫu)
Có những người khác? Là các vấn đề được giải quyết bằng các kỹ thuật lựa chọn biến nhiều hay ít quan trọng hơn các vấn đề quy trình lựa chọn biến được đưa ra? Khi nào nên sử dụng chúng? Khi nào chúng không nên được sử dụng?