Tôi đã nhận được ValueError khi dự đoán dữ liệu thử nghiệm bằng mô hình RandomForest.
Ma cua toi:
clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2)
clf.fit(X_fit, y_fit)
df_test.fillna(df_test.mean())
X_test = df_test.values
y_pred = clf.predict(X_test)
Lỗi:
ValueError: Input contains NaN, infinity or a value too large for dtype('float32').
Làm cách nào để tìm các giá trị xấu trong tập dữ liệu thử nghiệm? Ngoài ra, tôi không muốn bỏ các hồ sơ này, tôi chỉ có thể thay thế chúng bằng giá trị trung bình hoặc trung bình?
Cảm ơn.