Định nghĩa độ phức tạp của cây trong xgboost


9

Nghiên cứu về thuật toán xgboost tôi đã xem qua tài liệu này .

Trong cách tiếp cận này, cây được chuẩn hóa bằng định nghĩa độ phức tạp trong đó và là các tham số, là số lá cuối cùng và là điểm số trong mỗi lá.

Ω(f)=γT+12λj=1Twj2
γλTwj

Tôi tự hỏi: làm thế nào để xác định sự phức tạp? , số lượng các nút thiết bị đầu cuối, dường như tự nhiên đối với tôi. Nhưng tổng điểm cuối bình phương?T

Có lẽ quá mức là có nghĩa. Có nghĩa là điểm số rất lớn cho quá nhiều sự tự tin? Được chọn để có được một người học yếu? Một lời giải thích tự nhiên cho sự lựa chọn này của hàm phức tạp là gì?

Câu trả lời:


7

Điều này có ý nghĩa với tôi.

Tôi sẽ tập trung vào trường hợp Gaussian. Ở đây, mỗi cây phù hợp với phần dư của mô hình hiện tại và bản cập nhật mô hình là . Ý tưởng của bộ tăng cường độ dốc là giảm cẩn thận và từ từ độ lệch của mô hình bằng cách thêm từng cây một.TiMi+1=Mi+αTi

Trong trường hợp này, giá trị lớn của sẽ tương ứng với nút thiết bị đầu cuối (lá) cung cấp một bản cập nhật rất lớn và quan trọng cho mô hình trước đó. Ý tưởng của thuật ngữ chính quy là để giảm thiểu các sự cố này của các cập nhật cây đơn lớn (chỉ cho phép chúng nếu mức giảm của hàm mất mô hình đủ lớn để bù cho hình phạt chính quy). Nếu một bản cập nhật như vậy được thường xuyên hóa cho một cây, nhưng hóa ra là hợp lý, nó sẽ được đưa vào trong nhiều bản cập nhật mô hình, theo triết lý tăng cường.wi

Đây là tương tự rất gần với hồi quy sườn núi.


Cảm ơn, do đó bạn nghĩ về nó tương tự như tôi khi tôi nói về một người học yếu ... Theo nghĩa yếu nếu không thực hiện các bước quá lớn ..
Ric

Bạn có thể cụ thể hơn cho "trường hợp Gaussian" là gì? phù hợp với một hỗn hợp của Gaussian?
Haitao Du

@ hxd1011 Tôi chỉ có nghĩa là chúng ta đang sử dụng tổng mất lỗi bình phương, hay còn gọi là khả năng đăng nhập của phân phối gaussian. Điểm chính là ở đây bạn có thể cho rằng bạn chỉ phù hợp với phần dư.
Matthew Drury

@MatthewDrury bạn có thể xem câu hỏi liên quan này không? Cảm ơn!! stats.stackexchange.com/questions/229599/ Cách
Haitao Du
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.