Có thể kiểm soát chi phí phân loại sai trong gói R RandomForest không?
Trong công việc của tôi, âm tính giả (ví dụ, thiếu lỗi do một người có thể mắc bệnh) tốn kém hơn nhiều so với dương tính giả. Gói rpart cho phép người dùng kiểm soát chi phí phân loại sai bằng cách chỉ định ma trận tổn thất để phân loại sai trọng lượng khác nhau. Có bất cứ điều gì tương tự tồn tại cho randomForest
? Tôi có nên sử dụng classwt
tùy chọn để kiểm soát tiêu chí Gini không?
classwt
: Có, tôi đã thấy rằng trong thực tế và phù hợp với những người dùng khác, kết quả không như mong đợi. (iii)cutoff
: Tôi không rõ về cách sử dụngcutoff
trong trường hợp này và tôi hoan nghênh mọi lời khuyên khác.