Tôi có một vấn đề phân loại ( lớp ), với thứ tự 100 dự đoán có giá trị thực, một trong số đó dường như có sức mạnh giải thích hơn nhiều so với bất kỳ dự đoán nào khác. Tôi muốn tìm hiểu sâu hơn về tác động của các biến khác. Tuy nhiên, các kỹ thuật học máy tiêu chuẩn (rừng ngẫu nhiên, SVM, v.v.) dường như bị lấn át bởi một người dự đoán mạnh mẽ và không cung cấp cho tôi nhiều thông tin thú vị về những người khác.
Nếu đây là một vấn đề hồi quy, tôi chỉ đơn giản là hồi quy chống lại bộ dự báo mạnh và sau đó sử dụng phần dư làm đầu vào cho các thuật toán khác. Tôi thực sự không thấy cách tiếp cận này có thể được dịch sang ngữ cảnh phân loại.
Bản năng của tôi là vấn đề này phải phổ biến một cách hợp lý: có một kỹ thuật tiêu chuẩn để xử lý nó không?