Nếu bình phương Lỗi bình phương = Phương sai + Xu hướng ^ 2. Vậy thì làm thế nào để lỗi bình phương trung bình có thể thấp hơn phương sai


7

Tôi đã đọc phần Giới thiệu về Học thống kê. Ở đây nó được hiển thị rằng: -Công thức MSE

Trong một ví dụ sau, MSE đào tạo và thử nghiệm được vẽ. Tôi muốn biết nếu cả hai độ lệch ^ 2 và phương sai đều là các đại lượng dương thì làm sao MSE có thể thấp hơn Phương sai. nhập mô tả hình ảnh ở đây


1
Đường màu đỏ nằm phía trên đường đứt nét và có lẽ điều gì đó tương tự sẽ xảy ra đối với dân số chưa được kiểm tra
Henry

1. Sử dụng văn bản đánh dấu trong câu trả lời của bạn, không liên kết đến hình ảnh được tạo bằng đánh dấu. 2. Câu "Tôi muốn biết nếu cả hai độ lệch ^ 2 và phương sai đều là các đại lượng dương thì làm sao MSE có thể thấp hơn Phương sai". sẽ rõ ràng hơn nếu có một dấu hai chấm sau khi "biết".
Tích lũy

Kính gửi @Acccumulation, vui lòng chỉnh sửa bài đăng cho phù hợp. Nó sẽ được nhiều đánh giá cao.
Jim

Câu trả lời:


8

Điều đó được gọi là quá mức. Các rõ ràng MSE trên dữ liệu huấn luyện là thấp hơn so với phương sai, nhưng điều này chỉ đạt được bằng cách thực hiện một mô hình quá phức tạp để nó có thể làm theo những biến động ngẫu nhiên nghệ thuật dữ liệu cá nhân điểm ( "đuổi tiếng ồn"). Một khi bạn cố gắng dự đoán dữ liệu mới thì MSE sẽ tệ hơn nhiều. Tức là MSE thực của các dự đoán từ mô hình không thấp hơn phương sai.


6

Công thức được sao chép trong câu hỏi là chính xác và do đó không tương thích với "MSE thấp hơn phương sai". Khi bạn đề cập người ta quan sát "MSE thấp hơn phương sai" trên biểu đồ được cung cấp (giả sử MSE tối thiểu là phương sai mô hình), đó là do bạn xem xét MSE và phương sai theo kinh nghiệm , thay vì đại lượng lý thuyết , là kỳ vọng đối với mô hình phân phối.


-1

Bạn dường như nghĩ rằng có một trường hợp cho thấy phương sai lớn hơn MSE, nhưng không rõ bạn đang nhìn thấy điều đó như thế nào. Trong học máy, Y được mô hình hóa bằng với một số chức năng của X, cộng với một thuật ngữ lỗi ngẫu nhiên. Lỗi đó là, như trong ví dụ này, thường được biểu thị bằng một epsilon, . Trong mô hình này, hàm ước tính bằng với phụ thuộc "thực" của Y trên X sẽ có MSE bằng với phương sai của . Công cụ ước tính không phải là phụ thuộc "thực" sẽ có MSE bằng với phương sai của , cộng với phương sai giữa phụ thuộc "thực" và công cụ ước tính được sử dụng. Do đó, MSE của công cụ ước tính sẽ lớn hơn hoặc bằng phương saiϵϵϵof _ϵ_. Nó có thể, và bất kỳ công cụ ước tính tử tế nào cũng sẽ nhỏ hơn phương sai . Nếu MSE của công cụ ước tính lớn hơn phương sai của Y, thì bỏ qua X hoàn toàn và chỉ dự đoán rằng Y sẽ bằng giá trị trung bình của Y sẽ là công cụ ước tính tốt hơn.of Y_

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.