Tôi không nhận được sự khác biệt giữa rfobject$importance
và importance(rfobject)
trong cột MeanDecreasAccuracy.
Thí dụ:
> data("iris")
> fit <- randomForest(Species~., data=iris, importance=TRUE)
> fit$importance
setosa versicolor virginica MeanDecreaseAccuracy MeanDecreaseGini
Sepal.Length 0.027078501 0.019418330 0.040497602 0.02898837 9.173648
Sepal.Width 0.008553449 0.001962036 0.006951771 0.00575489 2.472105
Petal.Length 0.313303381 0.291818815 0.280981959 0.29216790 41.284869
Petal.Width 0.349686983 0.318527008 0.270975757 0.31054451 46.323415
> importance(fit)
setosa versicolor virginica MeanDecreaseAccuracy MeanDecreaseGini
Sepal.Length 1.277324 1.632586 1.758101 1.2233029 9.173648
Sepal.Width 1.007943 0.252736 1.014141 0.6293145 2.472105
Petal.Length 3.685513 4.434083 4.133621 2.5139980 41.284869
Petal.Width 3.896375 4.421567 4.385642 2.5371353 46.323415
>
Tôi nhận được các giá trị MeanDecreasAccuracy khác nhau nhưng có cùng thứ tự cho các biến quan trọng ( fit$importance
cũng như cho importance(fit)
):
Cánh hoa.Width
Cánh hoa.
Sepal. Chiều dài
Tháng chín
Nhưng trong các bộ dữ liệu khác, đôi khi tôi nhận được các đơn đặt hàng khác nhau. Ai đó có thể giải thích những gì đang xảy ra ở đây? Đây có thể là một lỗi?
Chỉnh sửa (để đáp lại Martin O'Leary )
Được rồi, cảm ơn! Tôi nhận thấy một cái gì đó khác.
Nhìn vào rfcv()
chức năng tôi nhận thấy dòng:
impvar <- (1:p)[order(all.rf$importance[, 1], decreasing = TRUE)]
với dòng này, chúng tôi chọn cột đầu tiên all.rf$importance
cung cấp cho chúng tôi thứ tự các biện pháp cụ thể của lớp (đối với yếu tố đầu tiên ) được tính là độ giảm trung bình chỉ trong độ chính xác. Điều này không phải lúc nào cũng giống với thứ tự giảm trung bình về độ chính xác trên tất cả các lớp ( MeanDecreaseAccuracy
). Sẽ không tốt hơn nếu chọn một trong hai MeanDecreaseAccuracy
hoặc MeanDecreaseGini
cột, hoặc tốt hơn là sử dụng importance()
chức năng cho các giá trị tỷ lệ? Vì vậy, chúng ta sẽ có số lượng dự đoán giảm liên tục được xếp hạng theo mức độ quan trọng khác nhau (trên tất cả các lớp) và không chỉ được xếp hạng theo mức độ quan trọng khác nhau cho lớp đầu tiên.