Tôi giả sử một phần của câu hỏi này là liệu số liệu khác có tồn tại bên cạnh phương sai phần trăm tích lũy (CPV) và cách tiếp cận cốt truyện tương tự hay không. Câu trả lời cho điều này là, vâng, nhiều .
Một bài báo tuyệt vời về một số tùy chọn là Valle 1999:
Nó vượt qua CPV, nhưng cũng phân tích song song, xác thực chéo, phương sai của lỗi tái cấu trúc (VRE), phương pháp dựa trên tiêu chí thông tin, v.v. Bạn có thể làm theo khuyến nghị của bài báo sau khi so sánh và sử dụng VRE, nhưng xác thực chéo dựa trên PRESS cũng hoạt động tốt theo kinh nghiệm của tôi và họ cũng nhận được kết quả tốt với điều đó. Theo kinh nghiệm của tôi, CPV thuận tiện và dễ dàng, và làm một công việc tốt, nhưng hai phương pháp đó thường tốt hơn.
Có nhiều cách khác để đánh giá mô hình PCA của bạn tốt như thế nào nếu bạn biết thêm về dữ liệu. Một cách là so sánh tải lượng PCA ước tính với tải thực sự nếu bạn biết chúng (mà bạn sẽ mô phỏng). Điều này có thể được thực hiện bằng cách tính toán độ lệch của các tải trọng ước tính cho các tải trọng thực. Sự thiên vị của bạn càng lớn, mô hình của bạn càng tệ. Để biết cách làm điều đó, bạn có thể xem bài báo này nơi họ sử dụng phương pháp này để so sánh các phương pháp. Tuy nhiên, không thể sử dụng được trong các trường hợp dữ liệu thực, nơi bạn không biết tải PCA thực sự. Điều này nói ít hơn về số lượng thành phần bạn đã loại bỏ, so với sai lệch của mô hình của bạn do ảnh hưởng của các quan sát bên ngoài, nhưng nó vẫn đóng vai trò là một thước đo chất lượng mô hình.