Thống kê và dữ liệu lớn pca

1

Tại sao các hàm R 'Princeomp' và 'prcomp' đưa ra các giá trị riêng khác nhau?

Bạn có thể sử dụng bộ dữ liệu decathlon {FactoMineR} để sao chép này. Câu hỏi là tại sao các giá trị riêng được tính toán khác với các ma trận hiệp phương sai. Dưới đây là các giá trị riêng sử dụng princomp: > library(FactoMineR);data(decathlon) > pr <- princomp(decathlon[1:10], …

22 r pca

2

Giới hạn của công cụ ước tính hồi quy sườn núi đơn vị-độ sai lệch khi

Xem xét hồi quy sườn với một ràng buộc bổ sung yêu cầu có tổng đơn vị bình phương (tương đương, phương sai đơn vị); nếu cần, người ta có thể giả sử rằng cũng có tổng đơn vị bình phương:y^y^\hat{\mathbf y}yy\mathbf y β^∗λ=argmin{∥y−Xβ∥2+λ∥β∥2}s.t.∥Xβ∥2=1.β^λ∗=arg⁡min{‖y−Xβ‖2+λ‖β‖2}s.t.‖Xβ‖2=1.\hat{\boldsymbol\beta}_\lambda^* = \arg\min\Big\{\|\mathbf y - \mathbf X …

21 pca regularization ridge-regression partial-least-squares constrained-regression

3

PCA khi kích thước lớn hơn số lượng mẫu

Tôi đã bắt gặp một kịch bản trong đó tôi có 10 tín hiệu / người cho 10 người (vì vậy 100 mẫu) chứa 14000 điểm dữ liệu (kích thước) mà tôi cần chuyển đến bộ phân loại. Tôi muốn giảm tính chiều của dữ liệu này và PCA dường …

21 pca dimensionality-reduction svd

3

Mối tương quan kỳ lạ trong kết quả SVD của dữ liệu ngẫu nhiên; họ có một lời giải thích toán học hay đó là một lỗi LAPACK?

Tôi quan sát một hành vi rất kỳ lạ trong kết quả SVD của dữ liệu ngẫu nhiên, mà tôi có thể sao chép trong cả Matlab và R. Có vẻ như một số vấn đề về số trong thư viện LAPACK; Là nó? Tôi vẽ mẫu từ Gaussian chiều …

21 pca svd linear-algebra numerics

4

Phân tích thành phần chính chức năng (FPCA): tất cả là gì?

Phân tích thành phần chính chức năng (FPCA) là điều tôi đã vấp ngã và không bao giờ hiểu được. Cái này chủ yếu là gì? Xem "Khảo sát phân tích thành phần chính chức năng" của Thương, 2011 và tôi đang trích dẫn: PCA gặp khó khăn nghiêm trọng …

21 time-series pca dimensionality-reduction

4

Làm thế nào để chiếu một vectơ mới lên không gian PCA?

Sau khi thực hiện phân tích thành phần chính (PCA), tôi muốn chiếu một vectơ mới lên không gian PCA (tức là tìm tọa độ của nó trong hệ tọa độ PCA). Tôi đã tính PCA bằng ngôn ngữ R bằng cách sử dụng prcomp. Bây giờ tôi có thể …

21 r pca r variance heteroscedasticity misspecification distributions time-series data-visualization modeling histogram kolmogorov-smirnov negative-binomial likelihood-ratio econometrics panel-data categorical-data scales survey distributions pdf histogram correlation algorithms r gpu parallel-computing approximation mean median references sample-size normality-assumption central-limit-theorem rule-of-thumb confidence-interval estimation mixed-model psychometrics random-effects-model hypothesis-testing sample-size dataset large-data regression standard-deviation variance approximation hypothesis-testing variance central-limit-theorem kernel-trick kernel-smoothing error sampling hypothesis-testing normality-assumption philosophical confidence-interval modeling model-selection experiment-design hypothesis-testing statistical-significance power asymptotics information-retrieval anova multiple-comparisons ancova classification clustering factor-analysis psychometrics r sampling expectation-maximization markov-process r data-visualization correlation regression statistical-significance degrees-of-freedom experiment-design r regression curve-fitting change-point loess machine-learning classification self-study monte-carlo markov-process references mathematical-statistics data-visualization python cart boosting regression classification robust cart survey binomial psychometrics likert psychology asymptotics multinomial

2

PCA có thể được áp dụng cho dữ liệu chuỗi thời gian không?

Tôi hiểu rằng Phân tích thành phần chính (PCA) về cơ bản có thể được áp dụng cho dữ liệu cắt ngang. PCA có thể được sử dụng cho dữ liệu chuỗi thời gian một cách hiệu quả bằng cách chỉ định năm là biến chuỗi thời gian và chạy …

21 time-series pca

1

Hiệu ứng hình móng ngựa của người Hồi giáo là gì và / hoặc hiệu ứng vòm của người khác trong phân tích PCA / tương ứng là gì?

Có nhiều kỹ thuật trong thống kê sinh thái để phân tích dữ liệu thăm dò dữ liệu đa chiều. Chúng được gọi là kỹ thuật 'phong chức'. Nhiều người giống nhau hoặc liên quan chặt chẽ đến các kỹ thuật phổ biến ở những nơi khác trong thống kê. …

20 pca eda ecology correspondence-analysis

2

Có bất kỳ lợi thế của SVD so với PCA?

Tôi biết cách tính toán PCA và SVD một cách toán học và tôi biết rằng cả hai đều có thể được áp dụng cho hồi quy tuyến tính Least Squares. Ưu điểm chính của SVD về mặt toán học dường như là nó có thể được áp dụng cho …

20 pca least-squares svd

2

Các phương pháp tính điểm yếu tố, và ma trận điểm hệ số điểm số điểm số trong PCA hoặc phân tích nhân tố là gì?

Theo hiểu biết của tôi, trong PCA dựa trên các mối tương quan, chúng ta có các hệ số (= thành phần chính trong trường hợp này), không có gì ngoài các mối tương quan giữa các biến và các yếu tố. Bây giờ khi tôi cần tạo điểm yếu …

20 spss pca factor-analysis

3

Tôi đang nhận được các phần mềm tải nhanh chóng trong PCA trong PC. Tôi có thể sửa nó không?

Tôi có 10 năm dữ liệu trả về hàng ngày cho 28 loại tiền tệ khác nhau. Tôi muốn trích xuất thành phần chính đầu tiên, nhưng thay vì vận hành PCA trong toàn bộ 10 năm, tôi muốn nhanh chóng mở cửa sổ 2 năm, vì các hành vi …

20 r pca

6

PCA của dữ liệu không phải Gaussian

Tôi có một vài câu hỏi nhanh về PCA: PCA có cho rằng tập dữ liệu là Gaussian không? Điều gì xảy ra khi tôi áp dụng PCA cho dữ liệu phi tuyến tính vốn có? Đưa ra một tập dữ liệu, quá trình đầu tiên là bình thường hóa, …

20 pca svd

4

Giá trị chính xác cho độ chính xác và thu hồi trong trường hợp cạnh là gì?

Độ chính xác được định nghĩa là: p = true positives / (true positives + false positives) Có đúng không, như true positivesvà false positivescách tiếp cận 0, độ chính xác tiếp cận 1? Câu hỏi tương tự để nhớ lại: r = true positives / (true positives + false …

20 precision-recall data-visualization logarithm references r networks data-visualization standard-deviation probability binomial negative-binomial r categorical-data aggregation plyr survival python regression r t-test bayesian logistic data-transformation confidence-interval t-test interpretation distributions data-visualization pca genetics r finance maximum probability standard-deviation probability r information-theory references computational-statistics computing references engineering-statistics t-test hypothesis-testing independence definition r censoring negative-binomial poisson-distribution variance mixed-model correlation intraclass-correlation aggregation interpretation effect-size hypothesis-testing goodness-of-fit normality-assumption small-sample distributions regression normality-assumption t-test anova confidence-interval z-statistic finance hypothesis-testing mean model-selection information-geometry bayesian frequentist terminology type-i-and-ii-errors cross-validation smoothing splines data-transformation normality-assumption variance-stabilizing r spss stata python correlation logistic logit link-function regression predictor pca factor-analysis r bayesian maximum-likelihood mcmc conditional-probability statistical-significance chi-squared proportion estimation error shrinkage application steins-phenomenon

2

PCA trong numpy và sklearn tạo ra kết quả khác nhau

Có phải tôi đang hiểu nhầm điều gì đó. Đây là mã của tôi sử dụng sklearn import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D from sklearn import decomposition from sklearn import datasets from sklearn.preprocessing import StandardScaler pca = decomposition.PCA(n_components=3) x = np.array([ [0.387,4878, 5.42], [0.723,12104,5.25], …

20 pca python scikit-learn

1

Trong các nghiên cứu hiệp hội trên toàn bộ gen, các thành phần chính là gì?

Trong các nghiên cứu hiệp hội trên toàn bộ bộ gen (GWAS): Các thành phần chính là gì? Tại sao chúng được sử dụng? Họ tính toán như thế nào? Một nghiên cứu hiệp hội trên toàn bộ gen có thể được thực hiện mà không cần sử dụng PCA?

20 pca genetics gwas

Câu hỏi được gắn thẻ «pca»