Một khu rừng ngẫu nhiên (RF) được tạo ra bởi một nhóm các cây quyết định (DT). Bằng cách sử dụng đóng gói, mỗi DT được đào tạo trong một tập hợp dữ liệu khác nhau. Do đó, có cách nào để thực hiện một khu rừng ngẫu nhiên trực tuyến bằng cách thêm nhiều quyết định vào dữ liệu mới không?
Ví dụ: chúng tôi có các mẫu 10K và đào tạo 10 DT. Sau đó, chúng tôi nhận được các mẫu 1K và thay vì đào tạo lại toàn bộ RF, chúng tôi thêm một DT mới. Dự đoán được thực hiện bởi mức trung bình của Bayes là 10 + 1 DT.
Ngoài ra, nếu chúng tôi giữ tất cả dữ liệu trước đó, DT mới có thể được đào tạo chủ yếu trong dữ liệu mới, trong đó xác suất chọn mẫu được tính trọng số tùy thuộc vào số lần đã được chọn.