Tôi không thể chạy với những con chó lớn thống kê đã trả lời trước tôi, và có lẽ suy nghĩ của tôi là ngây thơ, nhưng tôi nhìn nó theo cách này ...
Hãy tưởng tượng bạn đang ở trong một chiếc ô tô và bạn đang đi xuống đường và xoay bánh xe sang trái và phải và nhấn bàn đạp ga và phanh một cách điên cuồng. Tuy nhiên, chiếc xe đang di chuyển trơn tru, không bị ảnh hưởng bởi hành động của bạn. Bạn ngay lập tức nghi ngờ rằng bạn không ở trong một chiếc xe thật và có lẽ nếu chúng tôi nhìn kỹ, chúng tôi sẽ xác định rằng bạn đang đi xe trong Thế giới Disney. (Nếu bạn ở trong một chiếc xe thực sự, bạn sẽ gặp nguy hiểm chết người, nhưng chúng ta đừng đến đó.)
Mặt khác, nếu bạn đang lái xe trên đường và quay bánh xe chỉ hơi trái hoặc phải ngay lập tức dẫn đến xe chuyển động, nhấn phanh dẫn đến giảm tốc mạnh, trong khi nhấn bàn đạp ga ném bạn trở lại vào ghế. Bạn có thể nghi ngờ rằng bạn đang ở trong một chiếc xe thể thao hiệu suất cao.
Nói chung, bạn có thể trải nghiệm một cái gì đó giữa hai thái cực. Mức độ mà các yếu tố đầu vào của bạn (lái, phanh, ga) ảnh hưởng trực tiếp đến chuyển động của xe mang lại cho bạn manh mối về chất lượng của xe. Đó là, càng nhiều phương sai trong xe của bạn liên quan đến hành động của bạn thì xe càng tốt và xe càng di chuyển độc lập với sự kiểm soát của bạn thì xe càng tệ.
Theo cách tương tự, bạn đang nói về việc tạo mô hình cho một số dữ liệu (hãy gọi dữ liệu này là ), dựa trên một số bộ dữ liệu khác (hãy gọi chúng là ). Nếu không thay đổi, nó giống như một chiếc xe không di chuyển và có thực sự không có điểm trong thảo luận nếu xe (mô hình) hoạt động tốt hay không, vì vậy chúng tôi sẽ giả không khác nhau.yx1,x2,...,xiyy
yxixi yxiyxiy
Tái bút Tôi không thể đưa ra một tương tự Winnie The Pooh, nhưng tôi đã thử.
PPS [EDIT:] Lưu ý rằng tôi đang giải quyết câu hỏi cụ thể này. Đừng nhầm lẫn rằng nếu bạn chiếm 100% phương sai thì mô hình của bạn sẽ hoạt động tuyệt vời. Bạn cũng cần phải suy nghĩ về sự phù hợp quá mức, nơi mô hình của bạn linh hoạt đến mức nó phù hợp với dữ liệu đào tạo rất chặt chẽ - bao gồm cả những điều kỳ quặc và kỳ quặc ngẫu nhiên của nó. Để sử dụng sự tương tự, bạn muốn một chiếc xe có tay lái và phanh tốt, nhưng bạn muốn nó hoạt động tốt trên đường, không chỉ trong đường thử mà bạn đang sử dụng.