Tôi phù hợp với một tập dữ liệu với một lớp mục tiêu nhị phân theo rừng ngẫu nhiên. Trong python, tôi có thể làm điều đó bằng Randomforest classifier hoặc Randomforestregressor.
Tôi có thể nhận được phân loại trực tiếp từ phân loại ngẫu nhiên hoặc tôi có thể chạy ngẫu nhiên trước khi đăng ký và nhận lại một tập hợp các điểm ước tính (giá trị liên tục). Sau đó, tôi có thể tìm thấy một giá trị ngưỡng để rút ra các lớp dự đoán trong số các điểm số. Cả hai phương thức đều có thể đạt được cùng một mục tiêu (nghĩa là dự đoán các lớp cho dữ liệu thử nghiệm).
Ngoài ra tôi có thể quan sát rằng
randomforestclassifier.predict_proba(X_test)[:,1])
la khac nhau tư
randomforestregressor.predict(X_test)
Vì vậy, tôi chỉ muốn xác nhận rằng cả hai phương pháp đều hợp lệ và sau đó phương pháp nào tốt hơn trong ứng dụng rừng ngẫu nhiên?