Câu hỏi được gắn thẻ «pca»

Phân tích thành phần chính (PCA) là một kỹ thuật giảm kích thước tuyến tính. Nó giảm một tập dữ liệu đa biến thành một tập hợp nhỏ hơn các biến được xây dựng bảo tồn càng nhiều thông tin (càng nhiều phương sai) càng tốt. Các biến này, được gọi là các thành phần chính, là sự kết hợp tuyến tính của các biến đầu vào.





6
Phân tích thành phần chính có thể được áp dụng cho các bộ dữ liệu có chứa hỗn hợp các biến liên tục và phân loại không?
Tôi có một bộ dữ liệu có cả dữ liệu liên tục và phân loại. Tôi đang phân tích bằng cách sử dụng PCA và tự hỏi liệu có tốt không nếu bao gồm các biến phân loại như là một phần của phân tích. Hiểu biết của tôi là …





3
Một ví dụ: Hồi quy LASSO bằng glmnet cho kết quả nhị phân
Tôi bắt đầu say mê với việc sử dụng glmnetvới LASSO Regression trong đó kết quả quan tâm của tôi là phân đôi. Tôi đã tạo một khung dữ liệu giả nhỏ bên dưới: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 



4
Làm thế nào để hình dung phân tích tương quan chính tắc nào (so với phân tích thành phần chính nào)?
Phân tích tương quan Canonical (CCA) là một kỹ thuật liên quan đến phân tích thành phần chính (PCA). Mặc dù rất dễ để dạy PCA hoặc hồi quy tuyến tính bằng cách sử dụng biểu đồ phân tán (xem một vài nghìn ví dụ về tìm kiếm hình ảnh …

4
Sự khác biệt giữa chức năng R prcomp và Princeomp là gì?
Tôi đã so sánh ?prcompvà ?princomptìm thấy điều gì đó về phân tích thành phần chính của chế độ Q và chế độ R (PCA). Nhưng thành thật mà nói - tôi không hiểu điều đó. Bất cứ ai có thể giải thích sự khác biệt và thậm chí có …
70 r  pca 

5
Loadings vs eigenvector trong PCA: khi nào nên sử dụng cái này hay cái khác?
Trong phân tích thành phần chính (PCA), chúng ta có các hàm riêng (vectơ đơn vị) và giá trị riêng. Bây giờ, chúng ta hãy định nghĩa các tải làLoadings=Eigenvectors⋅Eigenvalues−−−−−−−−−−√.Loadings=Eigenvectors⋅Eigenvalues.\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}. Tôi biết rằng các hàm riêng chỉ là các hướng và tải (như được định nghĩa …
67 pca 

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.