Tôi đã tạo ra đường cong học tập này và tôi muốn biết liệu mô hình SVM của tôi có bị sai lệch hay sai lệch không? Làm thế nào tôi có thể kết luận rằng từ biểu đồ này?
Tôi đã tạo ra đường cong học tập này và tôi muốn biết liệu mô hình SVM của tôi có bị sai lệch hay sai lệch không? Làm thế nào tôi có thể kết luận rằng từ biểu đồ này?
Câu trả lời:
Đầu tiên, chúng ta nên tập trung vào phía bên phải của cốt truyện, nơi có đủ dữ liệu để đánh giá.
Nếu hai đường cong "gần nhau" và cả hai đều có điểm thấp. Mô hình bị một vấn đề phù hợp (Xu hướng cao)
Nếu đường cong đào tạo có điểm số tốt hơn nhiều nhưng đường cong thử nghiệm có điểm thấp hơn, nghĩa là có khoảng cách lớn giữa hai đường cong. Sau đó, mô hình bị một vấn đề phù hợp quá mức (Phương sai cao)
Từ cốt truyện, thật khó để nói rằng mô hình có tốt hay không. Có thể bạn có một "vấn đề dễ dàng" thực sự, một mô hình tốt có thể đạt được 90%. Mặt khác, có thể bạn có một "vấn đề khó khăn" thực sự là điều tốt nhất chúng ta có thể làm là đạt được 70%. (Lưu ý rằng, bạn có thể không mong đợi mình sẽ có một mô hình hoàn hảo, giả sử điểm số là 1. Bạn có thể đạt được bao nhiêu tùy thuộc vào mức độ nhiễu của dữ liệu. Giả sử dữ liệu của bạn có nhiều điểm dữ liệu có tính năng CHÍNH XÁC nhưng các nhãn khác nhau, bất kể bạn làm gì, bạn không thể đạt được 1 điểm.)
Một vấn đề khác trong ví dụ của bạn là 350 ví dụ dường như quá nhỏ trong một ứng dụng thế giới thực.
Để hiểu rõ hơn, bạn có thể thực hiện theo các thí nghiệm để trải nghiệm dưới sự phù hợp quá mức và quan sát những gì sẽ xảy ra trong quá trình học tập.
Chọn một dữ liệu rất phức tạp nói dữ liệu MNIST và phù hợp với một mô hình đơn giản, nói mô hình tuyến tính với một tính năng.
Chọn một dữ liệu đơn giản, giả sử dữ liệu mống mắt, phù hợp với mô hình phức tạp, giả sử, SVM.
Ngoài ra, tôi sẽ đưa ra hai ví dụ liên quan đến việc lắp và quá phù hợp. Lưu ý rằng đây không phải là đường cong học tập, nhưng hiệu suất liên quan đến số lần lặp trong mô hình tăng cường độ dốc , trong đó nhiều lần lặp lại sẽ có nhiều cơ hội phù hợp hơn. Trục x hiển thị số lần lặp và trục y hiển thị hiệu suất, đó là Vùng âm dưới ROC (càng thấp càng tốt.)
Subplot bên trái không bị khớp quá mức (cũng không phù hợp vì hiệu suất khá tốt) nhưng bên phải chịu sự phù hợp quá mức khi số lần lặp lớn.