Tôi có một trình phân loại mà tôi đang thực hiện xác thực chéo, cùng với hàng trăm tính năng mà tôi đang tiến hành lựa chọn để tìm các kết hợp tính năng tối ưu. Tôi cũng so sánh điều này với việc chạy các thử nghiệm tương tự với PCA, nơi tôi sử dụng các tính năng tiềm năng, áp dụng SVD, chuyển đổi tín hiệu gốc vào không gian tọa độ mới và sử dụng các tính năng hàng đầu trong quy trình lựa chọn chuyển tiếp của tôi.
Trực giác của tôi là PCA sẽ cải thiện kết quả, vì các tín hiệu sẽ "nhiều thông tin" hơn các tính năng ban đầu. Là sự hiểu biết ngây thơ của tôi về PCA dẫn tôi vào rắc rối? Bất cứ ai cũng có thể đề xuất một số lý do phổ biến tại sao PCA có thể cải thiện kết quả trong một số tình huống, nhưng làm xấu đi chúng ở những người khác?