Đến bữa tiệc muộn, nhưng dù sao đây cũng là câu trả lời của tôi và đó là "Có", người ta phải luôn quan tâm đến sự cộng tác, bất kể mô hình / phương pháp có tuyến tính hay không, hoặc nhiệm vụ chính là dự đoán hoặc phân loại.
Giả sử một số phép toán / tính năng tương quan tuyến tính có trong tập dữ liệu và Rừng ngẫu nhiên làm phương thức. Rõ ràng, lựa chọn ngẫu nhiên trên mỗi nút chỉ có thể chọn (hoặc hầu hết) các tính năng cộng tuyến có thể / sẽ dẫn đến sự phân chia kém và điều này có thể xảy ra lặp đi lặp lại, do đó ảnh hưởng tiêu cực đến hiệu suất.
Bây giờ, các tính năng cộng tuyến có thể ít thông tin về kết quả hơn các tính năng khác (không phải thông đồng) và do đó chúng nên được xem xét để loại bỏ khỏi bộ tính năng. Tuy nhiên, giả sử rằng các tính năng được xếp hạng cao trong danh sách 'tầm quan trọng của tính năng' do RF sản xuất. Vì vậy, chúng sẽ được giữ trong tập dữ liệu làm tăng kích thước một cách không cần thiết. Vì vậy, trong thực tế, tôi luôn luôn, như một bước khám phá (trong số nhiều liên quan) kiểm tra sự liên kết theo cặp của các tính năng, bao gồm cả tương quan tuyến tính.