Giả sử, tôi có một trình phân loại (Nó có thể là bất kỳ trình phân loại tiêu chuẩn nào như cây quyết định, rừng ngẫu nhiên, hồi quy logistic .. vv) để phát hiện gian lận bằng cách sử dụng mã dưới đây
library(randomForest)
rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier
Say, Y is a binary outcome - Fraud/Not-Fraud
Bây giờ, tôi đã dự đoán về một tập dữ liệu chưa thấy .
pred = predict(rfFit, newData)
Sau đó, tôi đã nhận được phản hồi từ nhóm điều tra về phân loại của mình và thấy rằng tôi đã phạm sai lầm khi phân loại một vụ lừa đảo là Không gian lận (tức là Một sai lầm phủ định ) . Có cách nào mà tôi có thể để thuật toán của mình hiểu rằng nó đã phạm sai lầm không? tức là có cách nào thêm vòng lặp phản hồi vào thuật toán để nó có thể sửa lỗi không?
Một lựa chọn tôi có thể nghĩ từ trên đỉnh đầu là xây dựng một adaboost classifier
bộ phân loại mới để sửa lỗi sai của cái cũ. hoặc tôi đã nghe một cái gì đó của Incremental Learning
hoặc Online learning
. Có bất kỳ triển khai (gói) hiện có trong R
?
Đó có phải là phương pháp đúng đắn? hoặc Có cách nào khác để điều chỉnh mô hình thay vì xây dựng nó từ đầu không?