Trong hồi quy sườn núi, hàm mục tiêu để được giảm thiểu là:
Điều này có thể được tối ưu hóa bằng phương pháp số nhân Lagrange không? Hay là sự khác biệt thẳng?
Trong hồi quy sườn núi, hàm mục tiêu để được giảm thiểu là:
Điều này có thể được tối ưu hóa bằng phương pháp số nhân Lagrange không? Hay là sự khác biệt thẳng?
Câu trả lời:
Có hai công thức cho vấn đề sườn núi. Điều thứ nhất là
tùy thuộc vào
Công thức này cho thấy ràng buộc kích thước trên các hệ số hồi quy. Lưu ý những gì ràng buộc này ngụ ý; chúng ta đang buộc các hệ số phải nằm trong một quả bóng xung quanh nguồn gốc với bán kính .
Công thức thứ hai chính xác là vấn đề của bạn
có thể được xem như là công thức nhân số lớn. Lưu ý rằng đây là một tham số điều chỉnh và giá trị lớn hơn của nó sẽ dẫn đến co rút lớn hơn. Bạn có thể tiến hành để phân biệt các biểu hiện liên quan đến với β và có được ước lượng sườn núi nổi tiếng
Hai công thức là hoàn toàn tương đương , vì có sự tương ứng một-một giữa và λ .
Hãy để tôi giải thích một chút về điều đó. Hãy tưởng tượng rằng bạn đang ở trong trường hợp trực giao lý tưởng, . Đây là một tình huống rất đơn giản và không thực tế nhưng chúng ta có thể điều tra người ước tính chặt chẽ hơn một chút để chịu đựng tôi. Xem xét những gì xảy ra với phương trình (1). Công cụ ước tính sườn núi giảm xuống
như trong trường hợp trực giao, công cụ ước lượng OLS được cho bởi . Nhìn vào thành phần này bây giờ chúng ta có được
Lưu ý rằng bây giờ độ co là không đổi cho tất cả các hệ số. Điều này có thể không giữ trong trường hợp tổng quát và thực sự nó có thể được chỉ ra rằng shrinkages sẽ rất khác nhau nếu có degeneracies trong ma trận.
Nhưng hãy trở lại vấn đề tối ưu hóa bị ràng buộc. Theo lý thuyết KKT , một điều kiện cần thiết cho sự tối ưu là
do đó, hoặc hoặc Σ beta 2 R , j - s = 0 (trong trường hợp này chúng ta nói rằng các hạn chế có tính ràng buộc). Nếu λ = 0 thì không có hình phạt và chúng tôi đang trở lại trong tình hình OLS thông thường. Giả sử sau đó ràng buộc là ràng buộc và chúng ta đang ở trong tình huống thứ hai. Sử dụng công thức trong (2), sau đó chúng ta có
từ đâu chúng ta có được
mối quan hệ một đối một trước đây đã tuyên bố. Tôi hy vọng điều này là khó khăn hơn để thiết lập trong trường hợp không trực giao nhưng kết quả mang lại bất kể.
Nhìn lại (2) mặc dù và bạn sẽ thấy chúng ta vẫn đang thiếu . Để có được giá trị tối ưu cho nó, bạn có thể sử dụng xác thực chéo hoặc nhìn vào dấu vết sườn núi. Phương pháp thứ hai liên quan đến việc xây dựng một chuỗi λ in (0,1) và xem cách các ước tính thay đổi. Sau đó, bạn chọn λ ổn định chúng. Phương pháp này đã được đề xuất trong phần thứ hai của các tài liệu tham khảo dưới đây và là phương pháp cũ nhất.
Người giới thiệu
Hoerl, Arthur E. và Robert W. Kennard. "Hồi quy độ dốc: Ước tính thiên vị cho các vấn đề phi chính thống." Kỹ thuật 12.1 (1970): 55-67.
Hoerl, Arthur E. và Robert W. Kennard. "Hồi quy độ dốc: ứng dụng cho các vấn đề phi chính thống." Kỹ thuật 12.1 (1970): 69-82.
Cuốn sách của tôi Regression Modeling Chiến lược đào sâu vào việc sử dụng hiệu quả AIC cho việc lựa chọn . Điều này xuất phát từ khả năng log phạt và mức độ hiệu quả của tự do, sau này trở thành một chức năng của bao nhiêu chênh lệch của β được giảm bằng cách xử phạt. Một bài trình bày về điều này là ở đây . R gói phát hiện bước sóng tối ưu hóa hiệu quả AIC, và cũng cho phép nhiều tham số hình phạt (ví dụ, một cho tác dụng chính tuyến tính, một cho các hiệu ứng phi tuyến chính, một cho hiệu ứng tương tác tuyến tính, và một cho các hiệu ứng tương tác phi tuyến).rms
pentrace
Tôi không làm điều đó một cách phân tích, mà là bằng số. Tôi thường vẽ RMSE so với như vậy:
Hình 1. RMSE và hằng số λ hoặc alpha.