Cần giúp đỡ để hiểu đề xuất chia điểm gần đúng của xgboost


12

lý lịch:

trong xgboost , lần lặp cố gắng khớp một cây f t trên tất cả n ví dụ nhằm giảm thiểu mục tiêu sau:tftn

i=1n[gift(xi)+12hift2(xi)]

nơi là thứ tự đầu tiên và các dẫn xuất tự thứ hai qua trước chúng tôi ước lượng tốt nhất y (từ lặp t - 1 ):gi,hiy^t1

  • gi=dy^l(yi,y^)
  • hi=dy^2l(yi,y^)

là hàm mất mát của chúng ta.l


Câu hỏi (cuối cùng):

Khi xây dựng và xem xét một tính năng cụ thể k trong một phân tách cụ thể, họ sử dụng phương pháp phỏng đoán sau để chỉ đánh giá một số ứng cử viên phân tách: Họ sắp xếp tất cả các ví dụ theo x k của họ , chuyển qua danh sách được sắp xếp và tính tổng đạo hàm thứ hai của họ h i . Họ xem xét một ứng cử viên chia chỉ khi tổng thay đổi hơn ε . Tại sao vậy???ftkxkhiϵ

Lời giải thích họ đưa ra cho tôi:

Họ tuyên bố chúng ta có thể viết lại phương trình trước đó như sau:

i=1n12hi[ft(xi)gi/hi]2+constant

và tôi không theo được đại số - bạn có thể chỉ ra tại sao nó bằng nhau không?

Và sau đó họ tuyên bố rằng "đây là tổn thất bình phương chính xác với các nhãn và trọng số h i " - một tuyên bố tôi đồng ý, nhưng tôi không hiểu nó liên quan đến thuật toán ứng cử viên mà họ đang sử dụng như thế nào. ..gi/hihi

Cảm ơn và xin lỗi nếu điều này quá dài cho diễn đàn này.

Câu trả lời:


8

Tôi sẽ không đi vào chi tiết nhưng những điều sau đây sẽ giúp bạn nắm bắt được ý tưởng.

{x1,,x100}10{x10,x20,,x90}ϵϵNϵ=0.01100{1%,2%,...,99%}ϵϵ

1010%10%


Tôi đăng nhập chỉ để cho bạn một cuộc bỏ phiếu. Cảm ơn bạn đã giải thích dễ nắm bắt.
Pakpoom Tiwakornkit

3

Chỉ cần thêm phần đại số vào câu trả lời @Winks:

Phương trình thứ hai nên có dấu của nó đảo ngược, như trong:

i=1n12hi[ft(xi)(gi/hi)]2+constant=i=1n12hi[ft2(xi)+2ft(xi)gihi+(gi/hi)2]=i=1n[gift(xi)+12hift2(xi)+gi22hi]

gihift

gi/hihi

Tín dụng đến Yaron và Avi từ nhóm của tôi để giải thích cho tôi điều này.


0

Và sau đó họ tuyên bố rằng "đây là tổn thất bình phương chính xác với nhãn gi / higi / hi và trọng số hihi" - một tuyên bố tôi đồng ý, nhưng tôi không hiểu nó liên quan đến thuật toán ứng cử viên mà họ đang sử dụng như thế nào .. .

  1. wtthw=gi/hi(ft(gi/hi))2

  2. wavg(gi)/constsigma(gi)/sigma(hi)whigiwhi

hi

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.