Làm thế nào để biết liệu một đường cong học tập từ mô hình SVM có bị sai lệch hoặc phương sai không?


12

Tôi đã tạo ra đường cong học tập này và tôi muốn biết liệu mô hình SVM của tôi có bị sai lệch hay sai lệch không? Làm thế nào tôi có thể kết luận rằng từ biểu đồ này?

học cuve


đây là một liên kết nơi bạn có thể tìm hiểu về chủ đề này một cách chi tiết- dataquest.io/blog/learning-curves-machine-learning
Sri991

Câu trả lời:


13

Phần 1: Cách đọc đường cong học tập

Đầu tiên, chúng ta nên tập trung vào phía bên phải của cốt truyện, nơi có đủ dữ liệu để đánh giá.

  • Nếu hai đường cong "gần nhau" và cả hai đều có điểm thấp. Mô hình bị một vấn đề phù hợp (Xu hướng cao)

  • Nếu đường cong đào tạo có điểm số tốt hơn nhiều nhưng đường cong thử nghiệm có điểm thấp hơn, nghĩa là có khoảng cách lớn giữa hai đường cong. Sau đó, mô hình bị một vấn đề phù hợp quá mức (Phương sai cao)

Phần 2: Đánh giá của tôi về cốt truyện bạn cung cấp

Từ cốt truyện, thật khó để nói rằng mô hình có tốt hay không. Có thể bạn có một "vấn đề dễ dàng" thực sự, một mô hình tốt có thể đạt được 90%. Mặt khác, có thể bạn có một "vấn đề khó khăn" thực sự là điều tốt nhất chúng ta có thể làm là đạt được 70%. (Lưu ý rằng, bạn có thể không mong đợi mình sẽ có một mô hình hoàn hảo, giả sử điểm số là 1. Bạn có thể đạt được bao nhiêu tùy thuộc vào mức độ nhiễu của dữ liệu. Giả sử dữ liệu của bạn có nhiều điểm dữ liệu có tính năng CHÍNH XÁC nhưng các nhãn khác nhau, bất kể bạn làm gì, bạn không thể đạt được 1 điểm.)

Một vấn đề khác trong ví dụ của bạn là 350 ví dụ dường như quá nhỏ trong một ứng dụng thế giới thực.

Phần 3: Thêm gợi ý

Để hiểu rõ hơn, bạn có thể thực hiện theo các thí nghiệm để trải nghiệm dưới sự phù hợp quá mức và quan sát những gì sẽ xảy ra trong quá trình học tập.

  • Chọn một dữ liệu rất phức tạp nói dữ liệu MNIST và phù hợp với một mô hình đơn giản, nói mô hình tuyến tính với một tính năng.

  • Chọn một dữ liệu đơn giản, giả sử dữ liệu mống mắt, phù hợp với mô hình phức tạp, giả sử, SVM.


Phần 4: Các ví dụ khác

Ngoài ra, tôi sẽ đưa ra hai ví dụ liên quan đến việc lắp và quá phù hợp. Lưu ý rằng đây không phải là đường cong học tập, nhưng hiệu suất liên quan đến số lần lặp trong mô hình tăng cường độ dốc , trong đó nhiều lần lặp lại sẽ có nhiều cơ hội phù hợp hơn. Trục x hiển thị số lần lặp và trục y hiển thị hiệu suất, đó là Vùng âm dưới ROC (càng thấp càng tốt.)

Subplot bên trái không bị khớp quá mức (cũng không phù hợp vì hiệu suất khá tốt) nhưng bên phải chịu sự phù hợp quá mức khi số lần lặp lớn.

nhập mô tả hình ảnh ở đây


Cảm ơn bạn hxd1011! Bạn có đồng ý với tôi không nếu tôi nói rằng mô hình của tôi bị một chút sai lệch và một chút sai lệch (vì điểm số không phải là 1)?
Afke

@Papie Tôi nghĩ rằng mô hình của bạn là tốt ... 80% về điểm số không phải là xấu và hai đường cong gần nhau. Vấn đề duy nhất là các ví dụ lên tới 350 có thể quá nhỏ trong một ứng dụng thế giới thực.
Haitao Du

@Papie Ngoài ra, bạn có thể không mong đợi mình sẽ có một mô hình hoàn hảo, giả sử điểm số là 1. Bạn có thể đạt được bao nhiêu tùy thuộc vào mức độ nhiễu trong dữ liệu của bạn. Giả sử dữ liệu của bạn có nhiều điểm dữ liệu có tính năng CHÍNH XÁC nhưng các nhãn khác nhau, bất kể bạn làm gì, bạn không thể đạt được 1 điểm.
Haitao Du

11
Tôi nghĩ rằng "80% về điểm số của anh ấy không tệ" không phải là một cách tốt để suy nghĩ về mọi thứ. Không có điểm toàn cầu nào là tốt, nó phụ thuộc rất nhiều vào vấn đề đang được giải quyết, cụ thể hơn là tỷ lệ tín hiệu / nhiễu trong quy trình và dữ liệu có sẵn. Bạn chỉ ra điều này trong câu trả lời của bạn, vì vậy tôi sẽ xóa bình luận "không tệ".
Matthew Drury

1
@MatthewDrury Cảm ơn bạn đã góp ý, trả lời sửa đổi!
Haitao Du
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.