Tôi đang sử dụng caret
gói trong R
đào tạo phân loại SVM nhị phân. Để giảm các tính năng, tôi đang tiền xử lý với PCA bằng tính năng tích hợp preProc=c("pca")
khi gọi train()
. Đây là câu hỏi của tôi:
- Làm thế nào để caret chọn thành phần chính?
- Có một số lượng cố định của các thành phần chính được chọn?
- Các thành phần chính được chọn theo một số lượng phương sai được giải thích (ví dụ 80%)?
- Làm cách nào tôi có thể đặt số lượng thành phần chính được sử dụng để phân loại?
- (Tôi hiểu rằng PCA nên là một phần của xác thực chéo bên ngoài để cho phép ước tính dự đoán đáng tin cậy.) PCA cũng nên được thực hiện trong chu trình xác thực chéo bên trong (ước tính tham số)?
- Làm thế nào để caret thực hiện PCA trong xác nhận chéo?
Thông tin hữu ích có thể được tìm thấy trong bài viết này trên PCA và k lần cross-validation trong gói caret trong R .
—
Ekaba Bisong 7/12/2016