Tôi muốn tạo một khu rừng ngẫu nhiên bằng quy trình sau:
- Xây dựng cây trên một mẫu ngẫu nhiên của dữ liệu và tính năng bằng cách sử dụng thông tin để xác định phân tách
- Chấm dứt một nút lá nếu vượt quá độ sâu được xác định trước HOẶC bất kỳ sự phân tách nào sẽ dẫn đến số lượng lá nhỏ hơn mức tối thiểu được xác định trước
- Thay vì chỉ định nhãn lớp cho mỗi cây, hãy gán tỷ lệ các lớp trong nút lá
- Dừng xây dựng cây sau khi một số được xác định trước đã được xây dựng
Điều này mang lại quá trình rừng ngẫu nhiên truyền thống theo hai cách. Một, nó sử dụng các cây được cắt tỉa để gán tỷ lệ thay vì nhãn lớp. Và hai, tiêu chí dừng là số lượng cây được xác định trước chứ không phải là một số ước tính lỗi ngoài túi.
Câu hỏi của tôi là:
Đối với quá trình trên mà kết quả đầu ra N cây, có thể tôi sau đó phù hợp với một mô hình sử dụng logistic hồi quy với lựa chọn Lasso? Có ai có kinh nghiệm phù hợp với trình phân loại Rừng ngẫu nhiên và xử lý hậu kỳ với LASSO hậu cần không?
Khung ISLE đề cập đến việc sử dụng LASSO như một bước xử lý hậu kỳ cho các vấn đề hồi quy nhưng không phải là vấn đề phân loại. Hơn nữa, tôi không nhận được bất kỳ kết quả hữu ích nào khi googling "Lasso rừng ngẫu nhiên".