Tôi gặp khó khăn khi hiểu cách thức varImp
hoạt động của mô hình RandomForest với caret
gói. Trong ví dụ dưới đây, tính năng var3 có mức độ quan trọng bằng 0 khi sử dụng varImp
chức năng của caret , nhưng mô hình cuối cùng RandomForest cơ bản có tầm quan trọng khác không đối với tính năng var3. Tại sao điều này là trường hợp?
require(randomForest)
require(caret)
rf <- train(x, y,
method = "rf",
trControl = trainControl(method = "oob"),
importance = TRUE,
verbose = TRUE,
tuneGrid = data.frame(mtry = num.predictors) )
fm <- rf$finalModel
> varImp(f)
rf variable importance
Overall
var1 100.00
var2 80.14
var3 0.00
> importance(fm)
%IncMSE IncNodePurity
var2 872.7935 40505276
var1 1021.4707 55682866
var3 273.0168 3078731