Trong 'Các yếu tố của học thống kê', biểu thức phân rã phương sai của mô hình tuyến tính được đưa ra là trong đó là hàm mục tiêu thực tế, là phương sai của lỗi ngẫu nhiên trong mô hình và là công cụ ước tính tuyến tính của .
Thuật ngữ phương sai đang gây rắc rối cho tôi ở đây vì phương trình ngụ ý rằng phương sai sẽ bằng 0 nếu các mục tiêu không ồn ào, nghĩa là,Nhưng nó không có ý nghĩa gì với tôi vì ngay cả với độ ồn bằng 0, tôi vẫn có thể nhận được các công cụ ước tính khác nhau cho các tập huấn luyện khác nhau có nghĩa là phương sai là khác không.
Ví dụ: giả sử hàm mục tiêu là một bậc hai và dữ liệu huấn luyện chứa hai điểm được lấy mẫu ngẫu nhiên từ phương trình bậc hai này; rõ ràng, tôi sẽ nhận được một sự phù hợp tuyến tính khác nhau mỗi khi tôi lấy mẫu ngẫu nhiên hai điểm từ mục tiêu bậc hai. Vậy thì làm thế nào phương sai có thể bằng không?
Bất cứ ai có thể giúp tôi tìm ra những gì sai trong sự hiểu biết của tôi về phân rã phương sai?