Giải thích về min_child_ weight trong thuật toán xgboost


23

Các định nghĩa của tham số min_child_weight trong xgboost được đưa ra như:

tổng trọng lượng tối thiểu (hessian) cần thiết ở trẻ. Nếu bước phân vùng cây dẫn đến một nút lá có tổng trọng số thể hiện nhỏ hơn min_child_ weight, thì quá trình xây dựng sẽ từ bỏ phân vùng tiếp theo. Trong chế độ hồi quy tuyến tính, điều này chỉ đơn giản tương ứng với số lượng phiên bản tối thiểu cần có trong mỗi nút. Càng lớn, thuật toán sẽ càng bảo thủ.

Tôi đã đọc khá nhiều điều trên xgboost bao gồm cả bài báo gốc (xem công thức 8 và một công thức chỉ sau phương trình 9), câu hỏi này và hầu hết những điều cần làm với xgboost xuất hiện trên một vài trang đầu tiên của tìm kiếm google. ;)

Về cơ bản tôi vẫn không hài lòng về lý do tại sao chúng ta đang áp đặt một ràng buộc đối với tổng của hessian? Suy nghĩ duy nhất của tôi tại phút từ bài báo gốc là nó liên quan đến phần phác họa lượng tử có trọng số (và sự cải tổ theo phương trình 3 mất bình phương có trọng số) có là 'trọng số' của mỗi trường hợp.htôi

Một câu hỏi nữa liên quan đến lý do tại sao nó chỉ đơn giản là số lượng phiên bản trong chế độ hồi quy tuyến tính? Tôi đoán điều này có liên quan đến đạo hàm thứ hai của tổng phương trình bình phương?

Câu trả lời:


42

Đối với hồi quy, mất từng điểm trong một nút là

12(ytôi-ytôi^)2

ytôi^1

Đối với hồi quy logistic nhị phân, hessian cho mỗi điểm trong một nút sẽ chứa các thuật ngữ như

σ(ytôi^)(1-σ(ytôi^))

σytôi^σ(ytôi^)

Hessian là một thứ lành mạnh để sử dụng cho việc thường xuyên hóa và hạn chế độ sâu của cây. Đối với hồi quy, thật dễ dàng để xem bạn có thể vượt mức như thế nào nếu bạn luôn chia nhỏ các nút với, chỉ cần 1 quan sát. Tương tự, để phân loại, thật dễ dàng để xem bạn có thể vượt mức như thế nào nếu bạn khăng khăng tách cho đến khi mỗi nút hoàn toàn.


Cảm ơn bạn đã trả lời, tôi không thể nâng cao bạn do danh tiếng thấp.
maw501

1
Xin chào @ maw501: Không vấn đề gì, tôi có thể. Câu trả lời tốt Hahdawg!
Catbuilts

Vậy trong trường hợp dữ liệu mất cân bằng cao, phạm vi đề xuất của bạn cho min_child_ weight là bao nhiêu?
Mahdi Baghbanzadeh

Khi trong tập dữ liệu không cân bằng, min_child_ weight có nên bao gồm cả trọng số không? Cảm ơn bạn! @hahdawg
HanaKaze
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.