Có một số lựa chọn thay thế cho Hồi quy Stepwise . Sử dụng nhiều nhất tôi đã thấy là:
- Ý kiến chuyên gia để quyết định các biến cần đưa vào mô hình.
- Hồi quy một phần vuông nhỏ nhất . Về cơ bản, bạn nhận được các biến tiềm ẩn và thực hiện hồi quy với chúng. Bạn cũng có thể tự làm PCA và sau đó sử dụng các biến chính.
- Toán tử co rút tuyệt đối và chọn lọc (LASSO).
Cả PLS Regression và LASSO đều được triển khai trong các gói R như
PLS : http://cran.r-project.org/web/packages/pls/ và
LARS : http://cran.r-project.org/web/packages/lars/index.html
Nếu bạn chỉ muốn khám phá mối quan hệ giữa biến phụ thuộc của bạn và các biến độc lập (ví dụ: bạn không cần kiểm tra ý nghĩa thống kê), tôi cũng sẽ đề xuất các phương pháp Machine Learning như Rừng ngẫu nhiên hoặc Cây phân loại / Cây hồi quy . Rừng ngẫu nhiên cũng có thể xấp xỉ các mối quan hệ phi tuyến tính phức tạp giữa các biến phụ thuộc và biến độc lập của bạn, điều này có thể không được tiết lộ bằng các kỹ thuật tuyến tính (như hồi quy tuyến tính ).
Điểm khởi đầu tốt cho Machine Learning có thể là chế độ xem tác vụ Machine Learning trên CRAN:
Chế độ xem tác vụ của Machine Learning : http://cran.r-project.org/web/view/MachineLearning.html