Trong tất cả các tài liệu rừng ngẫu nhiên (hồi quy) mà tôi đã đọc, khi đến lúc thu thập dự đoán của tất cả các cây, chúng tôi lấy giá trị trung bình làm dự đoán.
Câu hỏi của tôi là tại sao chúng ta làm điều đó?
Có một biện minh thống kê cho việc lấy trung bình?
EDIT: Để làm rõ câu hỏi, tôi biết có thể sử dụng các hàm tổng hợp khác (chúng tôi sử dụng chế độ để phân loại), tôi chủ yếu quan tâm đến việc có một số biện minh lý thuyết đằng sau sự lựa chọn của hàm trung bình.