Phân tích thành phần chính (PCA) được sử dụng để giảm dữ liệu n chiều thành dữ liệu k chiều để tăng tốc mọi thứ trong học máy. Sau khi PCA được áp dụng, người ta có thể kiểm tra số lượng phương sai của tập dữ liệu gốc còn lại trong tập dữ liệu kết quả. Một mục tiêu chung là giữ chênh lệch giữa 90% và 99%.
Câu hỏi của tôi là: nó có được coi là một cách thực hành tốt để thử các giá trị khác nhau của tham số k (kích thước của kích thước của tập dữ liệu kết quả) và sau đó kiểm tra kết quả của các mô hình kết quả dựa trên một số tập dữ liệu xác thực chéo giống như cách chúng tôi chọn giá trị tốt của các siêu âm khác như lambdas chính quy và ngưỡng?