Sự khác biệt giữa hệ số xác định của điểm xác định và điểm trung bình có nghĩa là lỗi bình phương là gì?


32

Đối với bài toán hồi quy, tôi đã thấy mọi người sử dụng "hệ số xác định" (còn gọi là bình phương R) để thực hiện lựa chọn mô hình, ví dụ: tìm hệ số hình phạt thích hợp cho chính quy.

Tuy nhiên, người ta cũng thường sử dụng "lỗi bình phương trung bình" hoặc "lỗi bình phương gốc" làm thước đo độ chính xác hồi quy.

Vì vậy, sự khác biệt chính giữa hai là gì? Chúng có thể được sử dụng thay thế cho các nhiệm vụ "chính quy hóa" và "hồi quy" không? Và cách sử dụng chính của mỗi trong thực tế, chẳng hạn như trong học máy, nhiệm vụ khai thác dữ liệu là gì?

Câu trả lời:


40

, trong đóSSElà tổng sai số bình phương (phần dư hoặc độ lệch so với đường hồi quy) vàSSTlà tổng độ lệch bình phương so vớitrung bìnhYcủa người phụ thuộc.R2= =1-SSESSTSSESSTY

MSE= =SSEn-mnm

R2MSE R2R2

Rmộtdj2= =1-(1-R2)n-1n-m= =1-SSE/(n-m)SST/(n-1)= =1-MSEσy2


2
Tôi nghĩ rằng MSE là avg của các lỗi, có nghĩa là MSE = SSE / n, trong những dịp nào chúng ta sử dụng MSE = SSE / (nm)? Vui lòng giải thích. Cảm ơn
Chân dung Brans

@SincoleBrans Vui lòng xem en.wikipedia.org/wiki/Mean_squared_error , phần "Hồi quy".
ttnphns

Tôi hơi bối rối. Kết quả trong martin-thoma.com/regression cho thấy một mô hình có thể tốt (so với một số mô hình khác) với R ^ 2, nhưng đồng thời xấu với MSE. Bạn có thể giải thích điều đó?
Martin Thoma
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.