Mùa lễ đã cho tôi cơ hội cuộn tròn bên đống lửa với The Elements of Statistics Learning . Xuất phát từ quan điểm kinh tế lượng (thường xuyên), tôi gặp khó khăn trong việc sử dụng các phương pháp thu nhỏ như hồi quy sườn, lasso và hồi quy góc nhỏ nhất (LAR). Thông thường, tôi quan tâm đến ước tính tham số bản thân và đạt được tính không thiên vị hoặc ít nhất là tính nhất quán. Phương pháp thu nhỏ không làm điều đó.
Dường như với tôi, các phương pháp này được sử dụng khi nhà thống kê lo lắng rằng hàm hồi quy trở nên quá nhạy với các yếu tố dự đoán, nó coi các yếu tố dự đoán là quan trọng hơn (được đo bằng độ lớn của các hệ số) so với thực tế. Nói cách khác, quá mức.
Tuy nhiên, OLS thường cung cấp các ước tính không thiên vị và nhất quán. (Chú thích) Tôi luôn xem vấn đề quá mức không đưa ra các ước tính quá lớn, mà là các khoảng tin cậy quá nhỏ vì quá trình lựa chọn không được tính đến ( ESL đề cập đến điểm sau này).
Ước tính hệ số không thiên vị / nhất quán dẫn đến dự đoán không thiên vị / nhất quán về kết quả. Các phương pháp thu nhỏ đẩy các dự đoán gần với kết quả trung bình hơn OLS, dường như để lại thông tin trên bàn.
Để nhắc lại, tôi không thấy vấn đề gì mà các phương pháp thu nhỏ đang cố gắng giải quyết. Tui bỏ lỡ điều gì vậy?
Lưu ý: Chúng tôi cần điều kiện xếp hạng cột đầy đủ để xác định các hệ số. Giả định trung bình / không có điều kiện trung bình cho các lỗi và giả định kỳ vọng có điều kiện tuyến tính xác định cách giải thích mà chúng ta có thể đưa ra cho các hệ số, nhưng chúng ta có được ước tính không thiên vị hoặc nhất quán về một điều gì đó ngay cả khi những giả định này không đúng.