Tại sao không sử dụng bình phương R để đo độ chính xác dự báo?


8

Tại sao trong tài liệu thường sử dụng các biện pháp chính xác phổ biến như MAD, MSE, RMSE, MAPE .... Tại sao không sử dụng (hệ số xác định)?R2

Tôi đã suy nghĩ về sự khác biệt: Bằng cách sử dụng MSE tôi có thể so sánh trung bình của dự báo. Và khi sử dụng tôi sẽ nhận được thông tin về phương sai.R2

Tại sao việc so sánh trung bình chủ yếu được sử dụng? Ai có thể cho tôi một gợi ý?

Câu trả lời:


7

Trong mẫu R2 không phải là thước đo phù hợp về độ chính xác dự báo vì nó không tính đến việc quá mức. Luôn có thể xây dựng một mô hình phức tạp sẽ phù hợp với dữ liệu một cách hoàn hảo trong mẫu nhưng không có gì đảm bảo rằng một mô hình như vậy sẽ thực hiện ra khỏi mẫu.


R -2 mẫu ngoài mẫuR2 , nghĩa là tương quan bình phương giữa các dự báo và giá trị thực tế, thiếu ở chỗ nó không tính đến độ lệch trong dự báo.

Ví dụ, hãy xem xét các giá trị nhận ra

yt+1,,yt+m

và hai dự báo cạnh tranh:

y^t+1,,y^t+m

y~t+1,,y~t+m.

Bây giờ giả sử rằng

y~t+i=c+y^t+i

với mọi , trong đó là hằng số. Đó là, các dự báo là như nhau ngoại trừ cái thứ hai cao hơn bởi . Hai dự báo này thường sẽ có MSE, MAPE khác nhau, nhưng sẽ giống nhau.iccR2

Hãy xem xét một trường hợp cực đoan: dự báo đầu tiên là hoàn hảo, tức là cho mọi . Các của dự báo đây sẽ là 1 (rất tốt). Tuy nhiên, của dự báo khác cũng sẽ là 1 mặc dù dự báo bị sai lệch bởi cho mọi .y^t+i=yt+iiR2R2ci


Tại sao bạn lại tính mẫu là tương quan bình phương thay vì ngoài mẫu ? Thực hiện mô phỏng R, tôi nhận được kết quả tương tự của bạn rằng không thay đổi khi thiên vị các dự đoán ngoài mẫu nếu tôi tính theo cách của bạn, nhưng tính theo cách của tôi cho giá trị ngoài mẫu khủng khiếp (tiêu cực, thậm chí). R21SSETSSR2R2R2
Dave

@Dave, cảm ơn bạn đã hiểu biết của bạn. Tôi không xem nó là cách của tôi so với cách của người khác , mà là một phần mở rộng trực tiếp của định nghĩa về trong mẫu . Xét cho cùng, chữ R biểu thị mối tương quan và trong mẫu là bình phương của nhiều tương quan giữa giá trị thực và giá trị được trang bị. Có nhiều cách khác để xác định trong mẫu , dẫn đến cùng một lượng trong mẫu. Trong khi đó, các phần mở rộng ngoài mẫu của chúng không tương đương. Câu trả lời của tôi cho thấy rằng một phần mở rộng trực tiếp (mặc dù không phải tất cả các phần mở rộng có thể) có thể vô nghĩa như một thước đo độ chính xác dự báo. R2R2R2
Richard Hardy

@Dave, trong mọi trường hợp, của bạn là một điểm tốt! Tôi có thể thêm một lưu ý nói rằng không phải tất cả các phần mở rộng của mẫu trong trường hợp ngoài mẫu đều bị hành xử quá tệ. Tôi sẽ phải nghĩ cái nào trong số chúng là hợp lý khi đo lường độ chính xác dự báo và cái nào trong số chúng thì không. R2
Richard Hardy
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.