Có, Chính quy có thể được sử dụng trong tất cả các phương pháp tuyến tính, bao gồm cả hồi quy và phân loại. Tôi muốn cho bạn thấy rằng không có quá nhiều sự khác biệt giữa hồi quy và phân loại: sự khác biệt duy nhất là hàm mất mát.
Cụ thể, có ba thành phần chính của phương pháp tuyến tính, Hàm mất, Chính quy, Thuật toán . Trong đó hàm mất cộng với chính quy là hàm mục tiêu trong bài toán ở dạng tối ưu hóa và thuật toán là cách để giải quyết nó (hàm mục tiêu là lồi, chúng ta sẽ không thảo luận trong bài này).
Trong cài đặt hàm mất, chúng ta có thể có tổn thất khác nhau trong cả trường hợp hồi quy và phân loại. Ví dụ, bình phương nhỏ nhất và mất độ lệch tuyệt đối ít nhất có thể được sử dụng cho hồi quy. Và đại diện toán học của họ là và L ( y , y ) = | Y - y | . (Chức năng L ( ⋅ ) được xác định trên hai vô hướng, y là giá trị thực địa vàL(y^,y)=(y^−y)2L(y^,y)=|y^−y|L(⋅)y được dự đoán giá trị.)y^
Mặt khác, mất logistic và mất bản lề có thể được sử dụng để phân loại. Cơ quan đại diện toán học của họ là và L ( y , y ) = ( 1 - y y ) + . (Ở đây, y là nhãn thực địa trong { - 1 , 1 } và yL(y^,y)=log(1+exp(−y^y))L(y^,y)=(1−y^y)+y{−1,1}y^được dự đoán "điểm số". Định nghĩa của y là một chút bất thường, xin vui lòng xem phần nhận xét.)y^
Trong cài đặt chính quy, bạn đã đề cập về chính quy hóa L1 và L2, cũng có các hình thức khác, sẽ không được thảo luận trong bài viết này.
Do đó, ở mức độ cao, một phương pháp tuyến tính là
minimizew ∑x,yL(w⊤x,y)+λh(w)
Nếu bạn thay thế hàm Mất từ cài đặt hồi quy thành mất logistic, bạn sẽ có hồi quy logistic bằng chính quy.
Ví dụ, trong hồi quy sườn, vấn đề tối ưu hóa là
minimizew ∑x,y(w⊤x−y)2+λw⊤w
Nếu bạn thay thế hàm mất bằng mất logistic, vấn đề sẽ trở thành
minimizew ∑x,ylog(1+exp(−w⊤x⋅y))+λw⊤w
Ở đây bạn có hồi quy logistic với chính quy L2.
Đây là cách nó trông giống như trong một bộ dữ liệu nhị phân tổng hợp đồ chơi. Hình bên trái là dữ liệu với mô hình tuyến tính (ranh giới quyết định). Hình bên phải là đường viền hàm mục tiêu (trục x và y đại diện cho các giá trị cho 2 tham số.). Tập dữ liệu được tạo từ hai Gaussian và chúng ta khớp với mô hình hồi quy logistic mà không bị chặn, do đó chỉ có hai tham số chúng ta có thể hình dung trong hình bên phải.
Các đường màu xanh là hồi quy logistic mà không cần chính quy và các đường màu đen là hồi quy logistic với chính quy L2. Các điểm màu xanh và đen trong hình bên phải là các tham số tối ưu cho hàm mục tiêu.
Trong thí nghiệm này, chúng tôi đặt một lớn , vì vậy bạn có thể thấy hai hệ số là gần 0 . Ngoài ra, từ đường viền, chúng ta có thể quan sát thuật ngữ chính quy bị chi phối và toàn bộ chức năng giống như một bát bậc hai.λ0
Đây là một ví dụ khác với chính quy L1.
Lưu ý rằng, mục đích của thí nghiệm này là cố gắng chỉ ra cách hoạt động của chính quy hóa trong hồi quy logistic, nhưng không tranh luận mô hình chính quy là tốt hơn.
Dưới đây là một số hình ảnh động về chính quy hóa L1 và L2 và cách nó ảnh hưởng đến mục tiêu mất logistic. Trong mỗi khung hình, danh hiệu cho thấy các loại quy tắc và , cốt truyện là hàm mục tiêu (logistic mất + regularization) đường viền. Chúng tôi tăng tham số quy tắc λ trong mỗi khung hình và các giải pháp tối ưu sẽ giảm xuống mức 0 khung hình.λλ0
Một số ý kiến ký hiệu. và x là các vectơ cột, y là vô hướng. Vì vậy, các mô hình tuyến tính y = f ( x ) = w ⊤ x . Nếu chúng tôi muốn bao gồm thuật ngữ chặn, chúng tôi có thể nối thêm 1 dưới dạng cột vào dữ liệu.wxyy^=f(x)=w⊤x1
yy∈{−1,1}
y^=w⊤xy^yy^=w⊤x{−1,1}y^
y∈{0,1}
Các mã có thể được tìm thấy trong câu trả lời khác của tôi ở đây.
Có bất kỳ lời giải thích trực quan về lý do tại sao hồi quy logistic sẽ không hoạt động cho trường hợp tách hoàn hảo? Và tại sao thêm chính quy sẽ sửa chữa nó?