Các định nghĩa của tham số min_child_weight trong xgboost được đưa ra như:
tổng trọng lượng tối thiểu (hessian) cần thiết ở trẻ. Nếu bước phân vùng cây dẫn đến một nút lá có tổng trọng số thể hiện nhỏ hơn min_child_ weight, thì quá trình xây dựng sẽ từ bỏ phân vùng tiếp theo. Trong chế độ hồi quy tuyến tính, điều này chỉ đơn giản tương ứng với số lượng phiên bản tối thiểu cần có trong mỗi nút. Càng lớn, thuật toán sẽ càng bảo thủ.
Tôi đã đọc khá nhiều điều trên xgboost bao gồm cả bài báo gốc (xem công thức 8 và một công thức chỉ sau phương trình 9), câu hỏi này và hầu hết những điều cần làm với xgboost xuất hiện trên một vài trang đầu tiên của tìm kiếm google. ;)
Về cơ bản tôi vẫn không hài lòng về lý do tại sao chúng ta đang áp đặt một ràng buộc đối với tổng của hessian? Suy nghĩ duy nhất của tôi tại phút từ bài báo gốc là nó liên quan đến phần phác họa lượng tử có trọng số (và sự cải tổ theo phương trình 3 mất bình phương có trọng số) có là 'trọng số' của mỗi trường hợp.
Một câu hỏi nữa liên quan đến lý do tại sao nó chỉ đơn giản là số lượng phiên bản trong chế độ hồi quy tuyến tính? Tôi đoán điều này có liên quan đến đạo hàm thứ hai của tổng phương trình bình phương?