Phiên dịch điểm PCA


16

Bất cứ ai có thể giúp tôi trong việc giải thích điểm PCA? Dữ liệu của tôi đến từ một bảng câu hỏi về thái độ đối với gấu. Theo các tải, tôi đã giải thích một trong những thành phần chính của mình là "sợ gấu". Điểm số của thành phần chính đó có liên quan đến cách mỗi người trả lời đo lường đến thành phần chính đó (liệu anh ấy / cô ấy có điểm tích cực / tiêu cực về nó không)?


Câu trả lời ngắn cho câu hỏi của bạn là CÓ.
amip nói rằng Phục hồi lại

Câu trả lời:


13

Về cơ bản, các điểm yếu tố được tính là các phản hồi thô có trọng số bởi các yếu tố tải. Vì vậy, bạn cần xem xét các yếu tố tải của thứ nguyên đầu tiên của bạn để xem mỗi biến liên quan đến thành phần chính như thế nào. Quan sát các tải trọng dương (tương ứng) âm cao liên quan đến các biến cụ thể có nghĩa là các biến này đóng góp tích cực (tương ứng tiêu cực) cho thành phần này; do đó, những người đạt điểm cao trong các biến này sẽ có xu hướng có điểm yếu tố cao hơn (tương ứng thấp hơn) trên khía cạnh cụ thể này.

Vẽ vòng tròn tương quan rất hữu ích để có ý tưởng chung về các biến đóng góp "tích cực" so với "tiêu cực" (nếu có) cho trục chính đầu tiên, nhưng nếu bạn đang sử dụng R, bạn có thể xem gói FactoMineR và các dimdesc()chức năng.

Dưới đây là một ví dụ với USArrestsdữ liệu:

> data(USArrests)
> library(FactoMineR)
> res <- PCA(USArrests)
> dimdesc(res, axes=1)  # show correlation of variables with 1st axis
$Dim.1
$Dim.1$quanti
         correlation  p.value
Assault        0.918 5.76e-21
Rape           0.856 2.40e-15
Murder         0.844 1.39e-14
UrbanPop       0.438 1.46e-03
> res$var$coord  # show loadings associated to each axis
         Dim.1  Dim.2  Dim.3   Dim.4
Murder   0.844 -0.416  0.204  0.2704
Assault  0.918 -0.187  0.160 -0.3096
UrbanPop 0.438  0.868  0.226  0.0558
Rape     0.856  0.166 -0.488  0.0371

Như có thể thấy từ kết quả mới nhất, chiều thứ nhất chủ yếu phản ánh các hành vi bạo lực (dưới bất kỳ hình thức nào). Nếu chúng ta nhìn vào bản đồ cá nhân, rõ ràng các trạng thái nằm bên phải là những nơi mà các hành vi đó thường xuyên nhất.

văn bản thay thế văn bản thay thế

Bạn cũng có thể quan tâm đến câu hỏi liên quan này: Điểm thành phần chính là gì?


5

Đối với tôi, điểm PCA chỉ là sự sắp xếp lại dữ liệu theo một hình thức cho phép tôi giải thích tập dữ liệu với ít biến hơn. Điểm số thể hiện mức độ mỗi mục liên quan đến thành phần. Bạn có thể đặt tên chúng theo phân tích nhân tố, nhưng điều quan trọng cần nhớ là chúng không phải là biến tiềm ẩn, vì PCA phân tích tất cả phương sai trong tập dữ liệu, không chỉ các yếu tố chung (như phân tích nhân tố).


Có, bạn đã đúng khi nói rằng không có mô hình lỗi nào được kết hợp trong PCA, trái ngược với FA. Tôi đã +1 cho điểm cụ thể đó. Lưu ý rằng tôi đã nói "thật hợp lý khi xem xét", không phải các thành phần chính được trích xuất từ ​​PCA là LV thực sự. Trừ khi bạn quan tâm đến việc đánh giá độ tin cậy của thang đo hoặc các mô hình đo lường, điều đó sẽ tạo ra rất ít sự khác biệt cho dù bạn sử dụng PCA hay FA. Bây giờ, phân tích dữ liệu thường liên quan đến việc giải thích mối tương quan giữa các biến hoặc tìm nhóm đối tượng, do đó ý tưởng diễn giải một hoặc nhiều chiều của không gian giai thừa. (...)
chl

(...) FactoMineR bao gồm một bộ dữ liệu về rượu vang và nhiều phương pháp yếu tố có thể được sử dụng để chơi với nó (PCA, MFA) và thậm chí PLS hoặc CCA đã được Michel Tenenhaus thực hiện.
chl

@ chl, Cảm ơn bạn đã gợi ý về gói hàng, tôi sẽ kiểm tra xem. Trên PCA vs FA tôi đồng ý đến một điểm. Tôi thích FA cho hầu hết các ứng dụng, vì tôi tài trợ cho các cộng đồng (phương sai chung) ước tính sẽ rất hữu ích trong việc đánh giá giá trị của một cấu trúc yếu tố cụ thể. Đó có thể chỉ là một sở thích cá nhân, tuy nhiên.
richiemorrisroe

Bạn hoàn toàn đúng (Tôi đã nâng cao phản hồi trước đó của bạn vì nó được làm rất rõ ràng). Chỉ là PCA (không được bảo vệ) có lịch sử riêng trong phân tích dữ liệu (đặc biệt là trường học ở Pháp), cùng với CA, MFA, MCA. Mặt khác, Paul Kline có hai cuốn sách rất hay về việc sử dụng FA trong nghiên cứu tính cách. Và cuốn sách sắp tới của William Revelle sẽ khuấy động người dùng R :) Vâng, trong mọi trường hợp, tôi nghĩ chúng tôi đồng ý rằng đây là những công cụ hữu ích để phân tích cấu trúc của ma trận tương quan.
chl

0

Kết quả PCA (các kích thước hoặc thành phần khác nhau) nói chung không thể được dịch thành một khái niệm thực sự tôi nghĩ là sai khi cho rằng một trong những thành phần là "sợ gấu", điều gì khiến bạn nghĩ đó là thành phần có nghĩa là gì? Quy trình thành phần chính biến đổi ma trận dữ liệu của bạn thành ma trận dữ liệu mới có cùng số lượng hoặc ít hơn kích thước và phạm vi kích thước kết quả từ phạm vi giải thích rõ hơn về phương sai giải thích phương sai ít hơn. Các thành phần này được tính toán dựa trên sự kết hợp của các biến ban đầu với các hàm riêng được tính toán. Thủ tục PCA qua chuyển đổi các biến ban đầu thành các biến trực giao (độc lập tuyến tính). Hy vọng điều này sẽ giúp bạn làm rõ một chút về thủ tục pca


Bạn có đồng ý rằng sự kết hợp tuyến tính của một số biến vẫn có thể được hiểu là phản ánh một loại đóng góp có trọng số của từng biến cho trục nhân tố không?
chl

Vâng, đó chính xác là nó.
mariana mềm hơn

Vì vậy, tại sao ngăn chặn đặt tên cho nó? Các biến chỉ được coi là các biến số biểu hiện và trong một số trường hợp, nên xem xét sự kết hợp có trọng số của chúng như phản ánh một yếu tố tiềm ẩn (không quan sát được).
chl
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.