Câu hỏi
Tôi đang đấu tranh để hiểu cách dự đoán được giữ trong khi thực hiện phân loại nhị phân với Gradient Boosting.
Giả sử chúng ta đang làm việc với một vấn đề phân loại nhị phân và hàm mục tiêu của chúng ta là mất nhật ký, , trong đó y là biến mục tiêu ∈ { 0 , 1 } và là mô hình hiện tại của chúng tôi.
Khi đào tạo người học yếu tiếp theo sao cho mô hình mới của chúng ta là H i = H i - 1 + h i , cơ chế nào được cho là giữ H i ∈ [ 0 , 1 ] ? Hoặc, có thể một câu hỏi phù hợp hơn, có một cơ chế như vậy?
Thông tin thêm về những gì tôi đang làm
Tôi đang cố gắng thực hiện tăng cường độ dốc, sử dụng cây hồi quy. Điều tôi phải làm để tránh đó là nhân với hệ số c ∈ [ 0 , c max ] , sao cho H + c max h không xuống dưới 0 hoặc trên một và tôi chọn c trong phạm vi này giảm thiểu hàm mất.
Điều này mang đến một vấn đề sau: Sau một số vòng, tôi có một điểm được phân loại hoàn hảo và phân chia tốt nhất có sẵn để đẩy trình phân loại theo hướng của gradient muốn đẩy điểm này lên trên một điểm, điều mà tôi chắc chắn không xảy ra bởi cài đặt . Do đó, tất cả các lần lặp tiếp theo sẽ chọn cùng một phần tách và cùng c = 0 .
Tôi đã thử thực hành chính quy phổ biến
- Giảm tỷ lệ học bằng cách nhân bởi μ = 0,01 . Điều này chỉ trì hoãn vấn đề.
- Lấy mẫu không gian tính năng, nhưng một số điểm rất dễ phân loại, họ đánh dấu vào hầu hết mọi ô trong "đây có phải là số dương không?" hình thức, và hầu hết mọi "phân chia tốt" cho thấy hành vi này.
Tôi nghĩ rằng đây không phải là vấn đề của các tham số, và cần có thêm âm thanh cách để sửa lỗi này. Tôi không loại bỏ khả năng việc triển khai của tôi bị hỏng, nhưng tôi không tìm thấy gì để giải quyết vấn đề này.
Những gì chúng ta đang thao túng, trong bối cảnh mất mát hậu cần, nên là một xác suất, vậy làm thế nào để chúng ta tránh nó?
Trực giác của tôi sẽ là đưa mô hình mà chúng ta đang xây dựng, , vào một hàm sigmoid sao cho nó bị ràng buộc với [ 0 , 1 ] , và tôi đoán rằng nó sẽ hoạt động, nhưng tôi muốn biết liệu có giải pháp nào khác không. Vì việc tăng cường độ dốc dường như được sử dụng thành công trong các nhiệm vụ phân loại, nên tồn tại một giải pháp "chính xác" (nghĩa là có biện minh).