Tôi nhận ra rằng có 3 tham số điều chỉnh trong mô hình cây tăng tốc, tức là
- số lượng cây (số lần lặp)
- tham số co ngót
- số lượng phân chia (kích thước của từng cây cấu thành)
Câu hỏi của tôi là: đối với mỗi tham số điều chỉnh, làm thế nào tôi nên tìm giá trị tối ưu của nó? Và phương pháp nào?
Lưu ý rằng: tham số co ngót và số lượng tham số cây hoạt động cùng nhau, nghĩa là một giá trị nhỏ hơn cho tham số co rút dẫn đến giá trị cao hơn cho số lượng cây. Và chúng ta cũng cần phải tính đến điều này.
Tôi đặc biệt quan tâm đến phương pháp tìm giá trị tối ưu cho số lần chia tách. Có nên dựa trên xác thực chéo hoặc kiến thức tên miền về mô hình phía sau?
Và làm thế nào những điều này được thực hiện trong gbm
gói trong R?