Câu hỏi của tôi liên quan đến chính quy trong hồi quy tuyến tính và hồi quy logistic. Tôi hiện đang làm tuần thứ 3 của khóa học Machine Learning của Andrew Ng trên Coursera. Tôi hiểu làm thế nào quá mức có thể là một vấn đề phổ biến và tôi có một số trực giác về cách thường xuyên có thể làm giảm quá mức. Câu hỏi của tôi là chúng ta có thể cải thiện các mô hình của mình bằng cách thường xuyên các tham số khác nhau theo những cách khác nhau không?
Thí dụ:
Giả sử chúng tôi đang cố gắng phù hợp với . Câu hỏi này là về lý do tại sao chúng tôi xử phạt các giá trị cao theo cùng cách xử phạt các giá trị cao .
Nếu chúng tôi không biết gì về cách các tính năng của chúng tôi được xây dựng, sẽ rất hợp lý khi xử lý tất cả chúng theo cùng một cách khi chúng tôi thực hiện chính quy: giá trị cao sẽ mang lại nhiều "hình phạt" cao giá trị .
Nhưng hãy nói rằng chúng tôi có thêm thông tin: giả sử chúng tôi chỉ có 2 tính năng ban đầu: và . Một dòng nằm dưới tập huấn luyện của chúng tôi và chúng tôi muốn có một ranh giới quyết định có hình dạng nguệch ngoạc hơn, vì vậy chúng tôi đã xây dựng và . Bây giờ chúng ta có thể có các mô hình phức tạp hơn, nhưng chúng càng phức tạp, chúng ta càng có nguy cơ vượt quá mô hình của chúng ta vào dữ liệu đào tạo. Vì vậy, chúng tôi muốn đạt được sự cân bằng giữa giảm thiểu chức năng chi phí và giảm thiểu độ phức tạp của mô hình. Chà, các tham số thể hiện số mũ cao hơn ( , ) đang làm tăng đáng kể độ phức tạp của mô hình của chúng tôi. Vì vậy, chúng ta không nên phạt nhiều hơn cho ,giá trị nào hơn chúng ta phạt cho các giá trị ?