Tôi hiện đang sử dụng phân tích thành phần chính để chọn các biến để sử dụng trong mô hình hóa. Hiện tại, tôi thực hiện các phép đo A, B và C trong các thí nghiệm của mình - Điều tôi thực sự muốn biết là: Tôi có thể thực hiện ít phép đo hơn và dừng ghi C và hoặc B để tiết kiệm thời gian và công sức không?
Tôi thấy rằng cả 3 biến tải rất nhiều vào thành phần chính đầu tiên của tôi, chiếm 60% phương sai trong dữ liệu của tôi. Điểm thành phần cho tôi biết rằng nếu tôi cộng các biến này lại với nhau theo một tỷ lệ nhất định (aA + bB + cC). Tôi có thể nhận được điểm trên PC1 cho từng trường hợp trong tập dữ liệu của mình và có thể sử dụng điểm này làm biến trong mô hình hóa, nhưng điều đó không cho phép tôi ngừng đo B và C.
Nếu tôi bình phương tải của A và B và C trên PC1, tôi thấy biến A đó chiếm 65% phương sai trong PC1 và biến B chiếm 50% phương sai trong PC1 và biến C cũng là 50%, tức là một số của phương sai trong PC1 chiếm bởi mỗi biến A, B và C được chia sẻ với một biến khác, nhưng A xuất hiện trên kế toán hàng đầu với giá cao hơn một chút.
Có sai không khi nghĩ rằng tôi chỉ có thể chọn biến A hoặc có thể (aA + bB, nếu cần) để sử dụng trong mô hình hóa vì biến này mô tả một tỷ lệ lớn của phương sai trong PC1 và điều này lần lượt mô tả một tỷ lệ lớn của phương sai trong dữ liệu?
Phương pháp nào bạn đã đi trong quá khứ?
- Biến duy nhất tải nặng nhất trên PC1 ngay cả khi có các bộ tải nặng khác?
- Điểm thành phần trên PC1 sử dụng tất cả các biến ngay cả khi chúng đều là các trình tải nặng?