Làm thế nào để giải thích lỗi bình phương gốc (RMSE) so với độ lệch chuẩn?


21

Hãy nói rằng tôi có một mô hình mang lại cho tôi các giá trị dự kiến. Tôi tính RMSE của các giá trị đó. Và sau đó độ lệch chuẩn của các giá trị thực tế.

Liệu nó có ý nghĩa gì để so sánh hai giá trị (phương sai) đó không? Những gì tôi nghĩ là, nếu RMSE và độ lệch chuẩn là tương tự / giống nhau thì lỗi / phương sai của mô hình của tôi giống như những gì đang thực sự xảy ra. Nhưng nếu nó thậm chí không có ý nghĩa để so sánh các giá trị đó thì kết luận này có thể sai. Nếu suy nghĩ của tôi là đúng, thì điều đó có nghĩa là mô hình đó tốt nhất có thể bởi vì nó không thể quy kết điều gì gây ra phương sai? Tôi nghĩ rằng phần cuối có lẽ là sai hoặc ít nhất là cần thêm thông tin để trả lời.

Câu trả lời:


22

Hãy nói rằng phản ứng của chúng tôi là và giá trị dự đoán của chúng tôi là y 1 , ... , y n .y1,,yny^1,,y^n

Phương sai mẫu (sử dụng thay vì n - 1 để đơn giản) là 1nn1trong khi MSE là11ni=1n(yiy¯)2. Do đó, phương sai mẫu cho biết mức độ phản hồi khác nhau xung quanh giá trị trung bình trong khi MSE đưa ra mức độ phản ứng khác nhau xung quanh dự đoán của chúng tôi. Nếu chúng ta nghĩ về tổng thể trung bình ˉ y như là yếu tố dự báo đơn giản nhất mà chúng tôi từng xem xét, sau đó bằng cách so sánh MSE với phương sai mẫu của các câu trả lời chúng ta có thể thấy thêm bao nhiêu biến thể chúng tôi đã giải thích với mô hình của chúng tôi. Đây chính xác là những gìgiá trịR2thực hiện trong hồi quy tuyến tính.1ni=1n(yiy^i)2y¯R2

Xem xét hình ảnh sau: Phương sai mẫu của là độ biến thiên xung quanh đường ngang. Nếu chúng ta chiếu tất cả dữ liệu lên trục Y, chúng ta có thể thấy điều này. MSE là khoảng cách trung bình bình phương vào dòng hồi quy, tức là sự thay đổi xung quanh đường hồi quy (tức là y i ). Vì vậy, độ biến thiên được đo bằng phương sai mẫu là khoảng cách bình phương trung bình đến đường ngang, mà chúng ta có thể thấy là lớn hơn nhiều so với khoảng cách bình phương trung bình đối với đường hồi quy. yiYy^ienter image description here


5

i(yiy^i)2np,

i(yiy¯)2n1,
y¯yi

y^i=y¯y¯

y^i

i(yiy^i)2n,

đó là dễ nhất để tính toán.


Tôi không có quyền nhận xét về câu trả lời của @Chaconne, nhưng tôi nghi ngờ nếu câu nói cuối cùng của anh ấy có lỗi đánh máy, anh ấy nói: "Vì vậy, độ biến thiên được đo bằng phương sai mẫu là khoảng cách bình phương trung bình cho đường ngang, mà chúng ta có thể nhìn thấy là ít hơn khoảng cách bình phương trung bình đến dòng ". Nhưng trong hình trong câu trả lời của ông, dự đoán của các giá trị y với đường thẳng là khá chính xác, điều đó có nghĩa là MSE nhỏ, ít nhất là tốt hơn nhiều so với "dự đoán" có giá trị trung bình.
Xiao-Feng Li

3

Trong trường hợp không có thông tin tốt hơn, giá trị trung bình của biến mục tiêu có thể được coi là ước tính đơn giản cho các giá trị của biến mục tiêu, cho dù cố gắng mô hình hóa dữ liệu hiện có hoặc cố gắng dự đoán các giá trị trong tương lai. Ước tính đơn giản này của biến mục tiêu (nghĩa là các giá trị dự đoán đều bằng giá trị trung bình của biến mục tiêu) sẽ bị tắt bởi một lỗi nhất định. Một cách tiêu chuẩn để đo sai số trung bình là độ lệch chuẩn (SD) ,1nΣtôi= =1n(ytôi-y¯)2, vì SD có đặc tính tốt là phù hợp với phân phối hình chuông (Gaussian) nếu biến mục tiêu thường được phân phối. Vì vậy, SD có thể được coi là lượng lỗi xảy ra tự nhiên trong các ước tính của biến mục tiêu. Điều này làm cho nó trở thành chuẩn mực mà bất kỳ mô hình nào cũng cần phải cố gắng đánh bại.

nhiều cách khác nhau để đo lường sai số của ước lượng mô hình ; trong số đó, Lỗi bình phương gốc (RMSE) mà bạn đã đề cập,1nΣtôi= =1n(ytôi-y^tôi)2, là một trong những phổ biến nhất. Về mặt khái niệm nó khá giống với SD: thay vì đo giá trị trung bình so với giá trị trung bình, nó sử dụng cùng một công thức để đo khoảng cách của một giá trị thực từ dự đoán của mô hình cho giá trị đó. Trung bình, một mô hình tốt nên có dự đoán tốt hơn so với ước tính ngây thơ về giá trị trung bình cho tất cả các dự đoán. Do đó, thước đo biến đổi (RMSE) sẽ làm giảm tính ngẫu nhiên tốt hơn SD.

Đối số này áp dụng cho các biện pháp lỗi khác, không chỉ với RMSE, mà RMSE đặc biệt hấp dẫn để so sánh trực tiếp với SD vì các công thức toán học của chúng là tương tự nhau.


Đây là câu trả lời tốt nhất vì nó giải thích cách so sánh có thể hữu ích thay vì chỉ mô tả sự khác biệt.
Hans
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.