Cái đầu tiên có thể được 'diễn giải' như sau: nếu một yếu tố dự đoán quan trọng trong mô hình hiện tại của bạn, thì việc gán các giá trị khác cho dự đoán đó một cách ngẫu nhiên nhưng 'thực tế' (nghĩa là: cho phép các giá trị của dự đoán này vào tập dữ liệu của bạn), sẽ có ảnh hưởng tiêu cực về dự đoán, nghĩa là: sử dụng cùng một mô hình để dự đoán từ dữ liệu giống nhau ngoại trừ một biến, sẽ đưa ra dự đoán tồi tệ hơn.
Vì vậy, bạn thực hiện một biện pháp dự đoán (MSE) với bộ dữ liệu ban đầu và sau đó với bộ dữ liệu 'được thẩm thấu' và bạn so sánh chúng bằng cách nào đó. Một cách, đặc biệt là vì chúng tôi hy vọng MSE ban đầu luôn nhỏ hơn, sự khác biệt có thể được thực hiện. Cuối cùng, để làm cho các giá trị có thể so sánh được với các biến, chúng được chia tỷ lệ.
Đối với cách thứ hai: tại mỗi lần phân tách, bạn có thể tính toán mức phân chia này làm giảm tạp chất nút (đối với cây hồi quy, thực sự, sự khác biệt giữa RSS trước và sau khi phân tách). Điều này được tổng hợp trên tất cả các phân chia cho biến đó, trên tất cả các cây.
Lưu ý: một bài đọc tốt là Các yếu tố của việc học thống kê của Hastie, Tibshirani và Friedman ...
?importance
chưa Có một lời giải thích về ý nghĩa của cả hai biện pháp ...