Câu hỏi của tôi là về phân loại nhị phân, nói rằng tách khách hàng tốt khỏi khách hàng xấu, nhưng không phân loại hồi quy hoặc phân loại không nhị phân. Trong bối cảnh này, một khu rừng ngẫu nhiên là một tập hợp các cây phân loại. Đối với mỗi quan sát, mỗi cây biểu quyết "có" hoặc "không" và phiếu bầu trung bình của tất cả các cây là xác suất rừng cuối cùng.
Câu hỏi của tôi là về việc sửa đổi hành vi của các cây bên dưới: Làm thế nào chúng ta có thể sửa đổi hàm RandomForest (của gói RandomForest của R) để mỗi cây biểu quyết một số thập phân thay vì nhị phân có / không. Để hiểu rõ hơn ý của tôi về số thập phân, hãy nghĩ về cách cây quyết định hoạt động.
Cây quyết định được phát triển đầy đủ có 1 trường hợp tốt hoặc 1 trường hợp xấu trong các nút thiết bị đầu cuối. Giả sử rằng tôi giới hạn kích thước nút đầu cuối là 100. Sau đó, các nút đầu cuối sẽ trông như sau:
Node1 = 80 xấu, 20
Node2 tốt = 51 xấu, 49
Node3 tốt = 10 xấu, 90 tốt
Lưu ý, mặc dù Node1 và Node2 bỏ phiếu "xấu", "sức mạnh xấu" của họ rất khác nhau. Đó là những gì tôi đang theo đuổi. Thay vì để chúng tạo ra 1 hoặc 0 (đó là hành vi mặc định), người ta có thể sửa đổi gói R để họ bỏ phiếu 80/100, 51/100, 10/100, v.v.?