Nghiên cứu về thuật toán xgboost tôi đã xem qua tài liệu này .
Trong cách tiếp cận này, cây được chuẩn hóa bằng định nghĩa độ phức tạp trong đó và là các tham số, là số lá cuối cùng và là điểm số trong mỗi lá.
Tôi tự hỏi: làm thế nào để xác định sự phức tạp? , số lượng các nút thiết bị đầu cuối, dường như tự nhiên đối với tôi. Nhưng tổng điểm cuối bình phương?
Có lẽ quá mức là có nghĩa. Có nghĩa là điểm số rất lớn cho quá nhiều sự tự tin? Được chọn để có được một người học yếu? Một lời giải thích tự nhiên cho sự lựa chọn này của hàm phức tạp là gì?