lý lịch:
trong xgboost , lần lặp cố gắng khớp một cây f t trên tất cả n ví dụ nhằm giảm thiểu mục tiêu sau:
nơi là thứ tự đầu tiên và các dẫn xuất tự thứ hai qua trước chúng tôi ước lượng tốt nhất y (từ lặp t - 1 ):
và là hàm mất mát của chúng ta.
Câu hỏi (cuối cùng):
Khi xây dựng và xem xét một tính năng cụ thể k trong một phân tách cụ thể, họ sử dụng phương pháp phỏng đoán sau để chỉ đánh giá một số ứng cử viên phân tách: Họ sắp xếp tất cả các ví dụ theo x k của họ , chuyển qua danh sách được sắp xếp và tính tổng đạo hàm thứ hai của họ h i . Họ xem xét một ứng cử viên chia chỉ khi tổng thay đổi hơn ε . Tại sao vậy???
Lời giải thích họ đưa ra cho tôi:
Họ tuyên bố chúng ta có thể viết lại phương trình trước đó như sau:
và tôi không theo được đại số - bạn có thể chỉ ra tại sao nó bằng nhau không?
Và sau đó họ tuyên bố rằng "đây là tổn thất bình phương chính xác với các nhãn và trọng số h i " - một tuyên bố tôi đồng ý, nhưng tôi không hiểu nó liên quan đến thuật toán ứng cử viên mà họ đang sử dụng như thế nào. ..
Cảm ơn và xin lỗi nếu điều này quá dài cho diễn đàn này.