Trang Scikit Learn trên Lựa chọn Mô hình đề cập đến việc sử dụng xác thực chéo lồng nhau:
>>> clf = GridSearchCV(estimator=svc, param_grid=dict(gamma=gammas), ... n_jobs=-1) >>> cross_validation.cross_val_score(clf, X_digits, y_digits)
Hai vòng xác thực chéo được thực hiện song song: một vòng theo công cụ ước tính GridSearchCV để đặt gamma và vòng còn lại bằng cross_val_score để đo hiệu suất dự đoán của công cụ ước tính. Điểm số kết quả là ước tính không thiên vị của điểm dự đoán trên dữ liệu mới.
Từ những gì tôi hiểu, clf.fit
sẽ sử dụng xác thực chéo để xác định gamma tốt nhất. Trong trường hợp đó, tại sao chúng ta cần sử dụng cv lồng nhau như đã nêu ở trên? Ghi chú đề cập rằng cv lồng nhau tạo ra "ước tính không thiên vị" của điểm dự đoán. Đó không phải là trường hợp với clf.fit
?
Ngoài ra, tôi không thể có được ước tính tốt nhất của clf từ cross_validation.cross_val_score(clf, X_digits, y_digits)
thủ tục. Bạn có thể vui lòng tư vấn làm thế nào có thể được thực hiện?