Hồi quy độ ước tính các tham số trong mô hình tuyến tính \ mathbf y = \ mathbf X \ boldsymbol \ beta bởi \ hat {\ boldsymbol \ beta} _ \ lambda = (\ mathbf X ^ \ top \ mathbf X + \ lambda \ mathbf I) ^ {- 1} \ mathbf X ^ \ top \ mathbf y, trong đó \ lambda là một tham số chính quy. Điều nổi tiếng là nó thường hoạt động tốt hơn hồi quy OLS (với \ lambda = 0 ) khi có nhiều yếu tố dự đoán tương quan.β λ = ( X ⊤ X + λ tôi ) - 1 X ⊤ y , λ λ = 0
Một định lý tồn tại cho hồi quy sườn núi nói rằng luôn tồn tại một tham số sao cho lỗi bình phương trung bình của nhỏ hơn nhiều so với lỗi bình phương trung bình của OLS ước tính . Nói cách khác, giá trị tối ưu của luôn luôn khác không. Điều này rõ ràng đã được chứng minh lần đầu tiên ở Hoerl và Kennard, 1970 và được lặp lại trong nhiều ghi chú bài giảng mà tôi tìm thấy trên mạng (ví dụ ở đây và ở đây ). Câu hỏi của tôi là về các giả định của định lý này:
Có bất kỳ giả định nào về ma trận hiệp phương sai không?
Có bất kỳ giả định nào về chiều của không?
Cụ thể, định lý này có còn đúng không nếu các yếu tố dự đoán là trực giao (tức là là đường chéo) hoặc thậm chí nếu ? Và nó có còn đúng không nếu chỉ có một hoặc hai yếu tố dự đoán (giả sử, một yếu tố dự đoán và đánh chặn)?
Nếu định lý không đưa ra các giả định như vậy và vẫn đúng ngay cả trong các trường hợp này, thì tại sao hồi quy sườn núi thường chỉ được đề xuất trong trường hợp các yếu tố dự đoán tương quan và không bao giờ (?) Được đề xuất cho hồi quy đơn giản (không phải là nhiều)?
Điều này có liên quan đến câu hỏi của tôi về quan điểm hợp nhất về co ngót: mối quan hệ (nếu có) giữa nghịch lý của Stein, hồi quy sườn và hiệu ứng ngẫu nhiên trong các mô hình hỗn hợp là gì? , nhưng không có câu trả lời nào làm rõ điểm này cho đến bây giờ.