Để quyết định sử dụng biện pháp lỗi dự báo điểm nào, chúng ta cần lùi lại một bước. Lưu ý rằng chúng ta không biết kết quả tương lai một cách hoàn hảo, cũng sẽ không bao giờ. Vì vậy, kết quả trong tương lai sau một phân phối xác suất . Một số phương pháp dự báo rõ ràng đưa ra một phân phối đầy đủ như vậy và một số thì không - nhưng nó luôn ở đó, nếu chỉ là ngầm.
Bây giờ, chúng tôi muốn có một thước đo lỗi tốt cho dự báo điểm . Dự báo điểm như vậy Ft là nỗ lực của chúng tôi để tóm tắt những gì chúng ta biết về phân phối trong tương lai (nghĩa là phân phối dự báo) tại thời điểm t sử dụng một số duy nhất, được gọi là chức năng của mật độ tương lai. Các biện pháp lỗi sau đó là một cách để đánh giá chất lượng của bản tóm tắt số duy nhất này.
Vì vậy, bạn nên chọn một thước đo lỗi thưởng cho các bản tóm tắt một số "tốt" (chưa biết, có thể dự báo, nhưng có thể chỉ ẩn) trong tương lai.
Thách thức là các biện pháp lỗi khác nhau được giảm thiểu bởi các chức năng khác nhau. MSE dự kiến được giảm thiểu bởi giá trị dự kiến của phân phối trong tương lai. MAD dự kiến được giảm thiểu bởi trung vị của phân phối trong tương lai. Do đó, nếu bạn hiệu chỉnh dự báo của mình để giảm thiểu MAE, dự báo điểm của bạn sẽ là trung vị tương lai, không phải giá trị dự kiến trong tương lai và dự báo của bạn sẽ bị sai lệch nếu phân phối trong tương lai của bạn không đối xứng.
Điều này có liên quan nhất đối với dữ liệu đếm, thường bị lệch. Trong các trường hợp cực đoan (giả sử, doanh số phân phối Poisson với giá trị trung bình dưới log2≈0.69 ), MAE của bạn sẽ thấp nhất cho dự báo bằng không. Xem ở đây hoặc ở đây hoặc ở đây để biết chi tiết.
Tôi cung cấp thêm một số thông tin và một minh họa trong Những thiếu sót của Lỗi phần trăm tuyệt đối trung bình (MAPE) là gì? Chủ đề đó xem xét mape , nhưng cũng có các biện pháp lỗi khác và nó chứa các liên kết đến các chủ đề liên quan khác.
Cuối cùng, biện pháp lỗi nào được sử dụng thực sự phụ thuộc vào Chi phí Lỗi Dự báo của bạn, nghĩa là loại lỗi nào gây đau đớn nhất. Không nhìn vào ý nghĩa thực tế của các lỗi dự báo, bất kỳ cuộc thảo luận nào về "tiêu chí tốt hơn" về cơ bản là vô nghĩa.
Các biện pháp về độ chính xác dự báo là một chủ đề lớn trong cộng đồng dự báo vài năm trước, và chúng vẫn bật lên ngay bây giờ và sau đó. Một bài viết rất hay để xem là Hyndman & Koehler "Một cái nhìn khác về các biện pháp chính xác dự báo" (2006).
Cuối cùng, một cách khác là tính toán mật độ dự đoán đầy đủ và đánh giá chúng bằng cách sử dụng quy tắc chấm điểm thích hợp .