Nói quá, tóm lại, có nghĩa là tính đến quá nhiều thông tin từ dữ liệu của bạn và / hoặc kiến thức trước đó, và sử dụng nó trong một mô hình. Để làm cho nó đơn giản hơn, hãy xem xét ví dụ sau: bạn được một số nhà khoa học thuê để cung cấp cho họ một mô hình để dự đoán sự phát triển của một số loại cây. Các nhà khoa học đã cung cấp cho bạn thông tin được thu thập từ công việc của họ với các nhà máy như vậy trong suốt cả năm và họ sẽ liên tục cung cấp cho bạn thông tin về sự phát triển trong tương lai của đồn điền của họ.
Vì vậy, bạn chạy qua dữ liệu nhận được và xây dựng một mô hình từ đó. Bây giờ giả sử rằng, trong mô hình của bạn, bạn đã xem xét càng nhiều đặc điểm càng tốt để luôn tìm ra hành vi chính xác của các cây bạn đã thấy trong tập dữ liệu ban đầu. Bây giờ, khi sản xuất vẫn tiếp tục, bạn sẽ luôn luôn đưa vào tài khoản những đặc điểm, và sẽ tạo ra rất hạt mịn kết quả. Tuy nhiên, nếu đồn điền cuối cùng bị thay đổi theo mùa, kết quả bạn sẽ nhận được có thể phù hợp với mô hình của bạn theo cách mà dự đoán của bạn sẽ bắt đầu thất bại (có thể nói rằng sự tăng trưởng sẽ chậm lại, trong khi nó thực sự sẽ tăng tốc, hoặc mặt đối diện, sự đối nghịch).
Ngoài việc không thể phát hiện các biến thể nhỏ như vậy và thường phân loại các mục nhập của bạn không chính xác, hạt mịn trên mô hình, nghĩa là, số lượng lớn các biến, có thể khiến việc xử lý quá tốn kém. Bây giờ, hãy tưởng tượng rằng dữ liệu của bạn đã phức tạp. Việc quá mức mô hình của bạn vào dữ liệu không chỉ làm cho việc phân loại / đánh giá trở nên rất phức tạp, mà rất có thể sẽ khiến bạn mắc lỗi dự đoán về sự thay đổi nhỏ nhất bạn có thể có trên đầu vào.
Chỉnh sửa : Điều này cũng có thể được sử dụng, có lẽ thêm tính năng động cho lời giải thích ở trên: D