Tôi thường nghe về việc đánh giá hiệu suất của một mô hình phân loại bằng cách đưa ra bộ kiểm tra và huấn luyện một mô hình trên tập huấn luyện. Sau đó tạo 2 vectơ, một cho các giá trị dự đoán và một cho các giá trị thực. Rõ ràng việc thực hiện so sánh cho phép người ta đánh giá hiệu suất của mô hình bằng sức mạnh dự đoán của nó bằng cách sử dụng những thứ như F-Score, Kappa Statistic, Precision & Recall, ROC, v.v.
Làm thế nào điều này so sánh với việc đánh giá dự đoán số như hồi quy? Tôi giả định rằng bạn có thể huấn luyện mô hình hồi quy trên tập huấn luyện, sử dụng nó để dự đoán các giá trị, sau đó so sánh các giá trị dự đoán này với các giá trị thực nằm trong tập kiểm tra. Rõ ràng các biện pháp thực hiện sẽ phải khác nhau vì đây không phải là một nhiệm vụ phân loại. Phần dư thông thường và thống kê là các biện pháp rõ ràng nhưng có nhiều cách / tốt hơn để đánh giá hiệu suất cho các mô hình hồi quy? Có vẻ như phân loại có rất nhiều lựa chọn nhưng hồi quy được để lại cho R 2 và phần dư.