Tôi đang có một số vấn đề với việc tạo ra giải pháp cho hồi quy sườn núi.
Tôi biết giải pháp hồi quy mà không có thuật ngữ chính quy:
Tôi đang có một số vấn đề với việc tạo ra giải pháp cho hồi quy sườn núi.
Tôi biết giải pháp hồi quy mà không có thuật ngữ chính quy:
Câu trả lời:
Nó đủ để sửa đổi chức năng mất bằng cách thêm hình phạt. Theo thuật ngữ ma trận, hàm mất bậc hai ban đầu trở thành
Hãy xây dựng dựa trên những gì chúng ta biết, đó là bất cứ khi nào ma trận mô hình là , thì -vector phản hồi là và tham số -vector là , hàm mục tiêu
(là tổng bình phương của phần dư) được thu nhỏ khi giải các phương trình Bình thường
Hồi quy độ dốc thêm một thuật ngữ khác vào hàm mục tiêu (thường là sau khi chuẩn hóa tất cả các biến để đặt chúng trên một nền tảng chung), yêu cầu giảm thiểu
đối với một số hằng số không âm . Nó là tổng bình phương của phần dư cộng với bội số tổng bình phương của các hệ số (làm cho nó rõ ràng rằng nó có mức tối thiểu toàn cầu). Vì , nó có căn bậc hai dương .
Hãy xem xét các ma trận tăng cường với hàng tương ứng với lần so với ma trận sắc :
Khi vector là tương tự như mở rộng với số không vào cuối để , sản phẩm ma trận trong hàm mục tiêu bổ sung điều khoản bổ sung có dạng đến mục tiêu ban đầu. vì thế
Từ dạng biểu thức tay trái, ngay lập tức các phương trình Bình thường là
Vì chúng ta nối các số 0 ở cuối , phía bên tay phải giống với . Ở phía bên trái được thêm vào ban đầu . Do đó các phương trình Bình thường mới đơn giản hóa thành
Bên cạnh đó là về mặt kinh tế về mặt khái niệm - không cần các thao tác mới để có được kết quả này - nó cũng có tính kinh tế về mặt tính toán: phần mềm của bạn để thực hiện bình phương tối thiểu thông thường cũng sẽ thực hiện hồi quy sườn mà không có bất kỳ thay đổi nào. (Tuy nhiên, có thể hữu ích trong các vấn đề lớn khi sử dụng phần mềm được thiết kế cho mục đích này, vì nó sẽ khai thác cấu trúc đặc biệt của để thu được kết quả một cách hiệu quả trong khoảng thời gian dày đặc của , cho phép bạn khám phá cách các câu trả lời khác nhau với .)
Một vẻ đẹp khác của cách nhìn này là cách nó có thể giúp chúng ta hiểu hồi quy sườn núi. Khi chúng ta muốn thực sự hiểu hồi quy, hầu như luôn luôn nghĩ về nó về mặt hình học: các cột của tạo thành các vectơ trong một không gian vectơ thực có kích thước . Bằng cách nối với , do đó kéo dài chúng từ -vector thành -vector, chúng tôi đang nhúng vào một không gian lớn hơn bằng cách bao gồm "Tưởng tượng", hướng trực giao lẫn nhau. Cột đầu tiên củađược cung cấp một thành phần tưởng tượng nhỏ có kích thước , do đó kéo dài nó và di chuyển nó ra khỏi không gian được tạo bởi các cột ban đầu . Các cột thứ hai, thứ ba, ..., được kéo dài tương tự và di chuyển ra khỏi không gian ban đầu với cùng một lượng - nhưng tất cả theo các hướng mới khác nhau. Do đó, bất kỳ sự cộng tác nào có trong các cột ban đầu sẽ ngay lập tức được giải quyết. Hơn nữa, càng lớn, các vectơ mới này càng tiếp cận với từnghướng tưởng tượng: chúng ngày càng trở nên trực giao hơn. Do đó, giải pháp của các phương trình Bình thường sẽ ngay lập tức trở nên khả thi và nó sẽ nhanh chóng ổn định về mặt số khi tăng từ .
Mô tả về quy trình này cho thấy một số phương pháp tiếp cận mới lạ và sáng tạo để giải quyết các vấn đề mà Regression Ridge được thiết kế để xử lý. Ví dụ, bằng cách sử dụng bất kỳ phương tiện nào (chẳng hạn như phân rã phương sai được mô tả bởi Belsley, Kuh và Welsch trong cuốn sách năm 1980 về Chẩn đoán hồi quy , Chương 3), bạn có thể xác định các nhóm con của các cột gần như của , trong đó mỗi nhóm phụ gần như trực giao với bất kỳ khác. Bạn chỉ cần nối nhiều hàng với (và số 0 cho ) vì có các phần tử trong nhóm lớn nhất, dành một thứ nguyên "tưởng tượng" mới để di chuyển từng phần tử của một nhóm ra khỏi anh chị em của nó: bạn không cần tưởng tượng kích thước để làm điều này.
Gần đây tôi đã vấp phải câu hỏi tương tự trong bối cảnh của P-Splines và vì khái niệm này giống nhau nên tôi muốn đưa ra một câu trả lời chi tiết hơn về đạo hàm của công cụ ước tính sườn núi.
Chúng tôi bắt đầu với một chức năng tiêu chí bị phạt khác với chức năng tiêu chí OLS cổ điển bởi thời hạn xử phạt của nó trong bản tóm tắt cuối cùng:
Ở đâu
Chúng ta có thể viết lại tiêu chí này trong ký hiệu ma trận và tiếp tục phá vỡ nó:
với là ma trận danh tính
Bây giờ chúng tôi tìm kiếm giúp giảm thiểu tiêu chí của chúng tôi. Trong số những người khác, chúng tôi sử dụng quy tắc phân biệt ma trận mà chúng ta có thể áp dụng ở đây dưới dạng :
Có một vài điều quan trọng còn thiếu trong các câu trả lời được đưa ra.
Giải pháp cho bắt nguồn từ điều kiện cần thiết thứ nhất: mang lại . Nhưng điều này đã đủ chưa? Nghĩa là, giải pháp chỉ ở mức tối thiểu toàn cầu nếu hoàn toàn lồi. Điều này có thể được hiển thị là đúng.
Một cách khác để xem xét vấn đề là xem sự tương đương giữa và bị ràng buộc với . OLS là viết tắt của bình phương tối thiểu bình thường. Từ phối cảnh này, chỉ là hàm Lagrangian được sử dụng để tìm cực tiểu toàn cầu của hàm mục tiêu lồi bị ràng buộc với hàm lồi .
Một lời giải thích tốt về những điểm này và dẫn xuất của có thể được tìm thấy trong các ghi chú bài giảng hay này: http://math.bu.edu/people/cgineste/ classes / ma575 / p / w14_1.pdf