Ridge Regression có thể được thể hiện dưới dạng y = ( X ' X + một Tôi d ) - 1 X x nơi y được nhãn dự đoán, tôi d các d × d xác định ma trận, x đối tượng chúng ta đang cố gắng tìm một nhãn cho, và x là n × d ma trận của n đối tượng x i = ( x i , 1 , . . .
Chúng ta có thể kernelise này như
nơi là n × n ma trận của các chức năng hạt nhân K
và các n × 1 vector cột chức năng hạt nhân K
Câu hỏi:
(a) nếu có nhiều đối tượng hơn kích thước thì có nghĩa là không sử dụng hạt nhân không? Ví dụ chúng ta hãy X là một 50 × 3 ma trận sau đó X ' X sẽ là một 3 × 3 và chúng tôi sẽ kết thúc đảo ngược một 3 × 3 ma trận thay vì 50 × 50 ma trận chúng ta sẽ phải nghịch đã được chúng tôi sử dụng hạt nhân. Điều này có nghĩa rằng nếu d ≤ n chúng ta không nên sử dụng hạt nhân?
(b) hạt nhân đơn giản nhất có thể được sử dụng? Dường như các hạt nhân trong hồi quy sườn được sử dụng để phủ nhận các ảnh hưởng của chiều và không sử dụng các thuộc tính nhất định của không gian tính năng (không giống như các máy vectơ hỗ trợ). Mặc dù, hạt nhân có thể thay đổi khoảng cách giữa các vật thể, vậy có loại hạt nhân phổ biến nào được sử dụng trong hồi quy sườn không?
(c) độ phức tạp thời gian của hồi quy sườn và / hoặc hồi quy sườn núi là gì?