RMSE và MAE có thể có cùng giá trị không?


9

Tôi đang triển khai xác thực chéo và tính toán các số liệu lỗi như RMSE, , MAE, MSE, v.v.R2

RMSE và MAE có thể có cùng giá trị không?


1
Đúng. Tại sao không? Đặt luôn là và một yếu tố dự đoán cho luôn là . Bạn có nó0 X 1X0X1
David

Câu trả lời:


17

Vâng, trên lý thuyết. Trường hợp đơn giản nhất tôi có thể tưởng tượng là một tập dữ liệu trong đó tất cả các lỗi dự đoán (tức là phần dư) chính xác là 1. RMSE và MAE sẽ trả về các giá trị giống hệt nhau của 1. Người ta cũng có thể xây dựng các kịch bản khác, nhưng dường như không có khả năng nào xảy ra.±

EDIT: Cảm ơn @DilipSarwate đã chỉ ra (được chi tiết thêm bởi @ user20160 trong câu trả lời xuất sắc của họ) rằng kết quả này có thể xảy ra nếu và chỉ khi các giá trị tuyệt đối của tất cả các lỗi dự đoán là giống hệt nhau. Nói cách khác, không có gì đặc biệt về giá trị 1 trong ví dụ của tôi; bất kỳ số nào khác sẽ làm việc thay vì 1.±


1
Bạn có thể đưa ra một ví dụ về các kịch bản khác mà bạn hình dung? Ý tôi là một ví dụ khác với bội số vô hướng (khi tất cả các phần dư là thay vì ) của ví dụ trên. ± 1±σ±1
Dilip Sarwate

@DilipSarwate Tôi đã suy nghĩ về điều này khi user20160 thêm một câu trả lời hay hơn bao gồm nó chi tiết hơn tôi có thể.
mkt - Tái lập Monica

1
@mkt Cảm ơn những lời tốt đẹp. Câu trả lời của bạn là chính xác và súc tích (+1)
user20160

@DilipSarwate Cảm ơn bạn đã nhập
mkt - Tái lập lại

1
Một vài phần tô điểm thêm cho câu trả lời của bạn: (i) phải thậm chí (nói n = 2 k ) và (ii) chính xác k dư phải có giá trị + σ và chính xác k dư phải có giá trị - σ , mà phương tiện khóa học tất cả các phần dư có giá trị tuyệt đối σ như bạn nêu, nhưng (ii) đảm bảo rằng phần dư tổng bằng 0 như chúng phải. Phần dư là độ lệch so với giá trị trung bình và do đó phải tổng bằng không. nn=2kk+σkσσ0
Dilip Sarwate

23

Lỗi tuyệt đối trung bình (MAE) có thể bằng lỗi bình phương trung bình (MSE) hoặc lỗi bình phương trung bình gốc (RMSE) trong các điều kiện nhất định, mà tôi sẽ trình bày dưới đây. Những điều kiện này không có khả năng xảy ra trong thực tế.

Sơ bộ

Đặt ri=|yiy^i|biểu thị giá trị tuyệt đối của số dư các i th điểm dữ liệu, và để cho r=[ri,,rn]T là một vector chứa dư tuyệt đối cho tất cả n điểm trong tập dữ liệu. Để 1 biểu thị một vectơ n×1 của các vectơ, MAE, MSE và RMSE có thể được viết là:

(1)MAE=1n1TrMSE=1nrTrRMSE=1nrTr

MSE

Đặt MSE bằng với MAE và sắp xếp lại sẽ cho:

(2)(r1)Tr=0

MSE và MAE bằng nhau cho tất cả các bộ dữ liệu trong đó phần dư tuyệt đối giải phương trình trên. Hai giải pháp rõ ràng là: (không có lỗi) và (phần dư đều là , như mkt đã đề cập). Nhưng, có vô số giải pháp.r=0r=1±1

Chúng ta có thể giải thích phương trình mặt hình học như sau: LHS là sản phẩm chấm của và . Sản phẩm không có dấu chấm ngụ ý tính trực giao. Vì vậy, MSE và MAE bằng nhau nếu trừ 1 từ mỗi phần dư tuyệt đối sẽ cho một vectơ trực giao với phần dư tuyệt đối ban đầu.(2)r1r

Hơn nữa, bằng cách hoàn thành hình vuông, phương trình có thể được viết lại thành:(2)

(3)(r121)T(r121)=n4

Phương trình này mô tả một cầu chiều tập trung tại với bán kính . MSE và MAE bằng nhau khi và chỉ khi phần dư tuyệt đối nằm trên bề mặt của siêu cầu này.n[12,,12]T12n

RMSE

Đặt RMSE bằng với MAE và sắp xếp lại sẽ cho:

(4)rTAr=0

A=(nI11T)

trong đó là ma trận danh tính. Bộ giải pháp là không gian rỗng của ; nghĩa là tập hợp tất cả sao cho . Để tìm không gian rỗng, lưu ý rằng là ma trận với các phần tử đường chéo bằng và tất cả các phần tử khác bằng . Câu lệnh tương ứng với hệ phương trình:IA r A r = 0 A n × n n - 1 - 1 A r = 0ArAr=0An×nn11Ar=0

(5)(n1)rijirj=0i

Hoặc, sắp xếp lại mọi thứ:

(6)ri=1n1jirji

Nghĩa là, mọi phần tử phải bằng giá trị trung bình của các phần tử khác. Cách duy nhất để đáp ứng yêu cầu này là cho tất cả các yếu tố bằng nhau (kết quả này cũng có thể đạt được bằng cách xem xét sự xuất tinh của ). Do đó, bộ giải pháp bao gồm tất cả các vectơ không âm với các mục giống nhau:riA

{rr=c1c0}

Vì vậy, RMSE và MAE bằng nhau khi và chỉ khi các giá trị tuyệt đối của phần dư bằng nhau cho tất cả các điểm dữ liệu.


1
+1. Tôi cảm thấy cần phải xác minh rằng hầu hết các siêu cầu này nằm trong khu vực nơi tất cả các thành phần của đều không âm, đó là một yêu cầu của phần dư tuyệt đối: điều đó thuyết phục tôi rằng thực sự có rất nhiều giải pháp (không tầm thường). r
whuber

+1 Câu trả lời tuyệt vời!
mkt - Tái lập Monica

1
Trên thực tế, câu hỏi đặt ra là liệu RMSE và MAE có thể bằng nhau hay không và liệu MSE và MAE có thể bằng nhau không. Có lẽ câu trả lời của @ mkt (hoặc phiên bản tổng quát mà tôi đề xuất trong một nhận xét) là câu trả lời duy nhất cho câu hỏi RMSE = MAE?
Dilip Sarwate

@DilipSarwate, Có, nhận ra sau khi đăng bài này mà tôi đã bỏ qua phần 'R'. Tôi đã chỉnh sửa để bao gồm RMSE ngay bây giờ. Tôi tin rằng phiên bản bạn đề xuất là câu trả lời duy nhất có thể trong trường hợp này.
user20160

2
@Hiyam Nếu chỉ có 1 giá trị thì RMSE theo định nghĩa phải bằng MAE. Bởi vì chỉ có 1 lỗi, bình phương nó và lấy gốc chỉ trả về giá trị tuyệt đối của lỗi ban đầu.
mkt - Tái lập lại
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.