Tôi dường như đang hiểu nhầm một tuyên bố về các phương pháp hồi quy tuyến tính mà tôi đã thấy ở nhiều nơi. Các tham số của vấn đề là:
Đầu vào:
mẫu dữ liệu của số lượng mỗi đại lượng bao gồm số lượng "phản hồi" y_i và p "dự đoán" số lượng x_ {ij}
Kết quả mong muốn là "sự phù hợp tuyến tính tốt" dự đoán đáp ứng dựa trên các yếu tố dự đoán trong đó mức độ phù hợp tốt có sự khác biệt nhỏ giữa dự đoán và phản ứng quan sát (trong số các tiêu chí khác).
Đầu ra: hệ số trong đó là "phù hợp tốt" để dự đoán số lượng phản hồi từ số lượng dự đoán.
Tôi bối rối về cách tiếp cận "hồi quy sườn" cho vấn đề này. Trong "Các yếu tố của học thống kê" của Hastie, Tibshirani và Friedman trang 63 hồi quy sườn núi được xây dựng theo hai cách.
Đầu tiên là vấn đề tối ưu hóa bị ràng buộc :
p Σ j
Thứ hai là vấn đề tối ưu hóa bị phạt : cho một số tham số dương . λ
Văn bản nói rằng các công thức này là tương đương và có "sự tương ứng 1-1 giữa các tham số và ". Tôi đã thấy yêu cầu này (và những yêu cầu tương tự) ở một số nơi ngoài cuốn sách này. Tôi nghĩ rằng tôi đang thiếu một cái gì đó bởi vì tôi không thấy các công thức tương đương như thế nào khi tôi hiểu nó.t
Hãy xem xét trường hợp và với , và , . Chọn tham số , công thức bị ràng buộc trở thành:p = 1 y 1 = 0 x 1 , 1 = 0 y 2 = 1t = 2
mở rộng đến
Để giải quyết vấn đề này, hãy tìm giải pháp trong đó các đạo hàm riêng liên quan đến và bằng 0: với giải pháp và . Lưu ý rằng theo yêu cầu.β 1 4 β 0 + 2 β 1 - 2 = 0 2 β 0 + 2 β 1 - 2 = 0 β 0 = 0 β 1 = 1 β 2 0 + β 2 1 ≤ t
Làm thế nào dẫn xuất này liên quan đến công thức khác? Theo giải thích, có một số giá trị của tương ứng duy nhất với nếu chúng ta tối ưu hóa công thức bị phạt của vấn đề, chúng ta sẽ rút ra cùng một và . Trong trường hợp này, hình thức bị phạt trở thành mở rộng thành Để giải quyết vấn đề này, hãy tìm giải pháp trong đó các đạo hàm riêng kính trọngt β 0 β 1 một r g m i n β 0 , β 1 β 0 β 1 - 2 β 0 +một r g m i n β bước sóng + 2 β 2 0 + 2
Tóm lại, tôi hoàn toàn bối rối bởi hai bài thuyết trình và tôi không hiểu chúng tương ứng với nhau như thế nào. Tôi không hiểu làm thế nào bạn có thể tối ưu hóa một hình thức và nhận được cùng một giải pháp cho hình thức khác hoặc làm thế nào có liên quan đến . Đây chỉ là một ví dụ của loại thư tín này - có những cách khác cho các cách tiếp cận khác như lasso - và tôi không hiểu bất kỳ trong số chúng.t
Ai đó làm ơn giúp tôi với.