Tôi gặp khó khăn khi hiểu cách thức varImphoạt động của mô hình RandomForest với caretgói. Trong ví dụ dưới đây, tính năng var3 có mức độ quan trọng bằng 0 khi sử dụng varImpchức năng của caret , nhưng mô hình cuối cùng RandomForest cơ bản có tầm quan trọng khác không đối với tính năng var3. Tại sao điều này là trường hợp?
require(randomForest)
require(caret)
rf <- train(x, y,
method = "rf",
trControl = trainControl(method = "oob"),
importance = TRUE,
verbose = TRUE,
tuneGrid = data.frame(mtry = num.predictors) )
fm <- rf$finalModel
> varImp(f)
rf variable importance
Overall
var1 100.00
var2 80.14
var3 0.00
> importance(fm)
%IncMSE IncNodePurity
var2 872.7935 40505276
var1 1021.4707 55682866
var3 273.0168 3078731