Tại sao sử dụng Lỗi trung bình bình phương (RMSE) thay vì Lỗi tuyệt đối trung bình (MAE) ??
Chào
Tôi đã điều tra lỗi được tạo trong một phép tính - Ban đầu tôi đã tính lỗi là Lỗi bình phương bình thường gốc.
Nhìn kỹ hơn một chút, tôi thấy các tác động của bình phương lỗi gây ra trọng số lớn hơn cho các lỗi lớn hơn so với các lỗi nhỏ hơn, làm sai lệch ước tính lỗi đối với ngoại lệ lẻ. Điều này là khá rõ ràng khi nhìn lại.
Vì vậy, câu hỏi của tôi - trong trường hợp nào thì Lỗi bình phương gốc có thể là thước đo lỗi thích hợp hơn so với Lỗi tuyệt đối trung bình? Cái sau có vẻ phù hợp hơn với tôi hay tôi đang thiếu thứ gì đó?
Để minh họa điều này tôi đã đính kèm một ví dụ dưới đây:
Biểu đồ phân tán cho thấy hai biến có mối tương quan tốt,
hai biểu đồ bên phải biểu đồ lỗi giữa Y (quan sát) và Y (dự đoán) sử dụng RMSE chuẩn hóa (trên cùng) và MAE (dưới cùng).
Không có ngoại lệ đáng kể trong dữ liệu này và MAE cho lỗi thấp hơn RMSE. Có bất kỳ lý do nào, ngoài MAE được ưa thích hơn, vì sử dụng một biện pháp lỗi so với cái kia không?