Tôi đã đào tạo một mô hình dự đoán với Scikit Learn in Python (Random Forest Regressor) và tôi muốn trích xuất trọng lượng của từng tính năng để tạo ra một công cụ excel để dự đoán thủ công.
Điều duy nhất tôi tìm thấy là model.feature_importances_
nhưng nó không có ích.
Có cách nào để đạt được nó?
def performRandomForest(X_train, y_train, X_test, y_test):
'''Perform Random Forest Regression'''
from sklearn.ensemble import RandomForestRegressor
model = RandomForestRegressor()
model.fit( X_train , y_train )
#make predictions
expected = y_test
predicted = model.predict( X_test )
#summarize the fit of the model
mse = np.mean(( predicted - expected )** 2)
accuracy = ( model.score ( X_train , y_train ))
return model, mse, accuracy
Hiện tại, tôi sử dụng model.predict([features])
để làm điều đó, nhưng tôi cần nó trong một tệp excel.
decision trees
, vì vậy bạn sẽ không nhận được một phương trình giống như bạn làm với hồi quy tuyến tính. Thay vào đó, bạn sẽ nhận được một loạtif, then, else
logic và nhiều phương trình cuối cùng để biến những chiếc lá cuối cùng thành giá trị số. Ngay cả khi bạn có thể hình dung cây và rút ra tất cả logic, tất cả điều này có vẻ như là một mớ hỗn độn lớn. Nếu bạn đang làm việc trong excel, có thể nghĩ về việc chỉ đào tạo mô hình của bạn trong excel bằng Azure. Tuy nhiên, tôi có lẽ sẽ chỉ gọi con trăn từ bên trong excel.