Câu hỏi được gắn thẻ «pca»

Phân tích thành phần chính (PCA) là một kỹ thuật giảm kích thước tuyến tính. Nó giảm một tập dữ liệu đa biến thành một tập hợp nhỏ hơn các biến được xây dựng bảo tồn càng nhiều thông tin (càng nhiều phương sai) càng tốt. Các biến này, được gọi là các thành phần chính, là sự kết hợp tuyến tính của các biến đầu vào.



1
Làm thế nào để có được các giá trị bản địa (phần trăm của phương sai được giải thích) của các vectơ không phải là hàm riêng của PCA?
Tôi muốn hiểu làm thế nào tôi có thể nhận được tỷ lệ phần trăm phương sai của một tập dữ liệu, không phải trong không gian tọa độ do PCA cung cấp, mà dựa vào một tập các vectơ (xoay) hơi khác. set.seed(1234) xx <- rnorm(1000) yy <- xx …








1
Bối rối về lời giải thích trực quan của người bản địa: làm thế nào các bộ dữ liệu khác nhau có thể có cùng một hàm riêng?
Rất nhiều sách giáo khoa thống kê cung cấp một minh họa trực quan về những gì các hàm riêng của ma trận hiệp phương sai là: Các vectơ u và z tạo thành các hàm riêng (tốt, eigenaxes). Điều này thật ý nghĩa. Nhưng một điều làm tôi bối …

2
Các số liệu tốt để đánh giá chất lượng của PCA phù hợp, để chọn số lượng các thành phần là gì?
Một số liệu tốt để đánh giá chất lượng phân tích thành phần chính (PCA) là gì? Tôi đã thực hiện thuật toán này trên một tập dữ liệu. Mục tiêu của tôi là giảm số lượng tính năng (thông tin rất dư thừa). Tôi biết tỷ lệ phần trăm …



3
Chọn số lượng thành phần chính để giữ lại
Một phương pháp được đề xuất với tôi là xem xét một âm mưu và kiểm tra "khuỷu tay" để xác định số lượng PC chính xác sẽ sử dụng. Nhưng nếu cốt truyện không rõ ràng, R có tính toán để xác định số không? fit <- princomp(mydata, cor=TRUE)
10 r  pca 

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.