Rừng ngẫu nhiên về cơ bản là thay đổi kích thước và đào tạo cây quyết định trên các mẫu, vì vậy câu trả lời cho câu hỏi của bạn cần giải quyết hai vấn đề đó.
Bootstrap resampling là không phải là một chữa bệnh cho mẫu nhỏ . Nếu bạn chỉ có hai mươi bốn quan sát trong tập dữ liệu của mình, thì mỗi mẫu được lấy thay thế từ dữ liệu này sẽ bao gồm không quá hai mươi bốn giá trị riêng biệt. Xáo trộn các trường hợp và không vẽ một số trong số chúng sẽ không thay đổi nhiều về khả năng của bạn để tìm hiểu bất cứ điều gì mới về phân phối cơ bản. Vì vậy, một mẫu nhỏ là một vấn đề cho bootstrap.
Cây quyết định được đào tạo bằng cách phân chia dữ liệu có điều kiện trên các biến dự đoán, một biến tại một thời điểm, để tìm ra các mẫu con có sức mạnh phân biệt đối xử lớn nhất. Nếu bạn chỉ có hai mươi bốn trường hợp, thì hãy nói rằng nếu bạn may mắn và tất cả các phần tách đều có kích thước, thì với hai phần tách, bạn sẽ kết thúc với bốn nhóm sáu trường hợp, với phần tách cây, với tám nhóm ba phần. Nếu bạn tính toán phương tiện có điều kiện trên các mẫu (để dự đoán giá trị liên tục trong cây hồi quy hoặc xác suất có điều kiện trong cây quyết định), bạn sẽ chỉ dựa vào kết luận của mình trong vài trường hợp đó! Vì vậy, các mẫu phụ mà bạn sẽ sử dụng để đưa ra quyết định thậm chí còn nhỏ hơn dữ liệu ban đầu của bạn.
Với các mẫu nhỏ, thường là khôn ngoan khi sử dụng các phương pháp đơn giản . Hơn nữa, bạn có thể bắt kịp mẫu nhỏ bằng cách sử dụng các linh mục thông tin trong môi trường Bayes (nếu bạn có bất kỳ kiến thức ngoài dữ liệu hợp lý nào về vấn đề này), vì vậy bạn có thể cân nhắc sử dụng một số mô hình Bayes phù hợp.