Tôi đang sử dụng hồi quy vectơ hỗ trợ để mô hình hóa một số dữ liệu khá sai lệch (với mức độ tổn thương cao). Tôi đã thử mô hình hóa dữ liệu trực tiếp nhưng tôi nhận được dự đoán sai, tôi nghĩ chủ yếu là do phân phối dữ liệu, bị lệch với đuôi rất mập. Tôi khá chắc chắn rằng một số ngoại lệ (là các điểm dữ liệu hợp pháp) đang ảnh hưởng đến đào tạo SVR, và có lẽ trong quá trình xác nhận chéo, tại thời điểm này tôi đang tối ưu hóa các siêu đường kính bằng cách giảm thiểu lỗi bình phương trung bình.
Tôi đã cố gắng chia tỷ lệ dữ liệu của mình trước khi áp dụng SVR (ví dụ: sử dụng hàm sqrt để giảm các ngoại lệ) cũng như sử dụng hàm giảm thiểu siêu tham số khác (ví dụ: lỗi tuyệt đối), có vẻ cho kết quả tốt hơn, nhưng vẫn không tốt lắm. Tôi tò mò liệu có ai gặp phải vấn đề tương tự không và làm thế nào họ tiếp cận nó? Bất kỳ đề xuất và / hoặc phương pháp thay thế đều được chào đón nhất.