Tôi đã tham gia một khóa học máy tại trường đại học của tôi. Trong một trong những câu hỏi, câu hỏi này đã được hỏi.
Mô hình 1:
Mô hình 2:Những mô hình trên sẽ phù hợp với dữ liệu tốt hơn? (giả sử dữ liệu có thể được mô hình hóa bằng hồi quy tuyến tính)
Câu trả lời đúng (theo giáo sư) là cả hai mô hình sẽ hoạt động tốt như nhau. Tuy nhiên tôi tin rằng mô hình đầu tiên sẽ phù hợp hơn.
Đây là lý do đằng sau câu trả lời của tôi. Mô hình thứ hai, có thể được viết lại như , sẽ không giống như mô hình đầu tiên. Thực tế, là một parabol và do đó có giá trị tối thiểu ( trong trường hợp này). Bây giờ vì điều này, phạm vi trong mô hình thứ nhất lớn hơn phạm vi của trong mô hình thứ hai. Do đó, nếu dữ liệu phù hợp nhất có độ dốc nhỏ hơn , mô hình thứ hai sẽ hoạt động rất kém so với mô hình đầu tiên. Tuy nhiên, trong trường hợp độ dốc của sự phù hợp tốt nhất lớn hơn , cả hai mô hình sẽ hoạt động tốt như nhau.
Vì vậy, cái đầu tiên tốt hơn, hay cả hai đều giống hệt nhau?