Cả Root-mean-Square-Error (RMSE) và hệ số xác định ( ) đềuR2 cung cấp thông tin khác nhau, nhưng bổ sung, cần được đánh giá khi đánh giá mô hình vật lý của bạn. Không phải là "tốt hơn", nhưng một số báo cáo có thể tập trung nhiều hơn vào một số liệu tùy thuộc vào ứng dụng cụ thể.
Tôi sẽ sử dụng những điều sau đây như một hướng dẫn rất chung để hiểu sự khác biệt giữa cả hai số liệu:
Các RMSE mang đến cho bạn một cảm giác khoảng cách giữa (hoặc xa) giá trị dự đoán của bạn là từ dữ liệu thực tế bạn đang cố gắng mô hình. Điều này hữu ích trong nhiều ứng dụng mà bạn muốn hiểu tính chính xác và chính xác của các dự đoán của mô hình của bạn (ví dụ: mô hình chiều cao của cây).
Ưu
- Nó tương đối dễ hiểu và giao tiếp vì các giá trị được báo cáo nằm trong cùng đơn vị với biến phụ thuộc được mô hình hóa.
Nhược điểm
- Nó nhạy cảm với các lỗi lớn (phạt các lỗi dự đoán lớn hơn các lỗi dự đoán nhỏ hơn).
Các hệ số xác định ( )R2 rất hữu ích khi bạn đang cố gắng để hiểu như thế nào lựa chọn biến độc lập của bạn (s) giải thích sự thay đổi trong biến phụ thuộc của bạn (s). Điều này hữu ích khi bạn đang cố gắng giải thích những yếu tố nào có thể thúc đẩy quá trình quan tâm cơ bản (ví dụ: các biến khí hậu và điều kiện đất đai liên quan đến chiều cao của cây).
Ưu
- Cung cấp một ý nghĩa tổng thể về mức độ các biến được chọn của bạn phù hợp với dữ liệu.
Nhược điểm
- Như các biến độc lập hơn được thêm vào mô hình của bạn, tăng (xem adj. hoặc Thông tin Tiêu chuẩn Akaike của như giải pháp thay thế tiềm năng).R2R2
Tất nhiên, ở trên sẽ phải tuân theo kích thước mẫu và thiết kế lấy mẫu, và một sự hiểu biết chung rằng mối tương quan không ngụ ý nhân quả.
This value shows how well future outcomes can be predicted by the model
- điều này là vô cùng sai lệch và nghiêng về phía sai lầm . Không có gì đảm bảo rằng một hệ số xác định cao trong một mô hình nhất định liên quan đến kết quả trong tương lai sẽ được dự đoán như thế nào.