Biện pháp liên kết thích hợp của một biến với thành phần PCA (trên biểu đồ biplot / tải) là gì?


17

Tôi đang sử dụng FactoMineRđể giảm tập dữ liệu đo của mình xuống các biến tiềm ẩn.

![variable map](http://f.cl.ly/items/071s190V1G3s1u0T0Y3M/pca.png)

Bản đồ biến ở trên rõ ràng đối với tôi để giải thích, nhưng tôi bối rối khi nói đến mối liên hệ giữa các biến và thành phần 1. Nhìn vào bản đồ biến, ddpcovrất gần với thành phần trong bản đồ, và ddpAbsxa hơn một chút xa. Nhưng, đây không phải là những gì các mối tương quan cho thấy:

$Dim.1
$Dim.1$quanti
        correlation      p.value
jittAbs   0.9388158 1.166116e-11
rpvi      0.9388158 1.166116e-11
sd        0.9359214 1.912641e-11
ddpAbs    0.9327135 3.224252e-11
rapAbs    0.9327135 3.224252e-11
ppq5      0.9319101 3.660014e-11
ppq5Abs   0.9247266 1.066303e-10
cov       0.9150209 3.865897e-10
npvi      0.8853941 9.005243e-09
ddp       0.8554260 1.002460e-07
rap       0.8554260 1.002460e-07
jitt      0.8181207 1.042053e-06
cov5_x    0.6596751 4.533596e-04
ps13_20  -0.4593369 2.394361e-02
ps5_12   -0.5237125 8.625918e-03

Sau đó, có sin2số lượng, là chiều cao cho rpvi(ví dụ), nhưng số đo đó không phải là biến gần nhất với thành phần đầu tiên.

Variables
           Dim.1    ctr   cos2    Dim.2    ctr   cos2  
rpvi    |  0.939  8.126  0.881 |  0.147  1.020  0.022 |
npvi    |  0.885  7.227  0.784 |  0.075  0.267  0.006 |
cov     |  0.915  7.719  0.837 | -0.006  0.001  0.000 |
jittAbs |  0.939  8.126  0.881 |  0.147  1.020  0.022 |
jitt    |  0.818  6.171  0.669 |  0.090  0.380  0.008 |
rapAbs  |  0.933  8.020  0.870 |  0.126  0.746  0.016 |
rap     |  0.855  6.746  0.732 |  0.040  0.076  0.002 |
ppq5Abs |  0.925  7.884  0.855 |  0.091  0.392  0.008 |
ppq5    |  0.932  8.007  0.868 | -0.035  0.057  0.001 |
ddpAbs  |  0.933  8.020  0.870 |  0.126  0.746  0.016 |
ddp     |  0.855  6.746  0.732 |  0.040  0.076  0.002 |
pa      |  0.265  0.646  0.070 | -0.857 34.614  0.735 |
ps5_12  | -0.524  2.529  0.274 |  0.664 20.759  0.441 |
ps13_20 | -0.459  1.945  0.211 |  0.885 36.867  0.783 |
cov5_x  |  0.660  4.012  0.435 |  0.245  2.831  0.060 |
sd      |  0.936  8.076  0.876 |  0.056  0.150  0.003 |

Vì vậy, tôi nên xem xét gì khi nói đến sự liên kết giữa một biến và thành phần đầu tiên?


1
Điểm Althougt trên bản đồ của bạn (trông giống như âm mưu tải) lộn xộn, tôi muốn nói rằng cốt truyện tương ứng với đầu ra "tương quan" độc đáo. Những "tương quan" đó là tọa độ trên Dim1. Chúng, các tải trọng, là mối tương quan giữa một yếu tố và các biến (khi bạn dựa vào anaysis của bạn trên dữ liệu được tiêu chuẩn hóa = dựa trên các mối tương quan b / w các biến).
ttnphns

Ngoài câu trả lời dưới đây, vui lòng kiểm tra câu hỏi này với các liên kết khác trong đó.
ttnphns

Câu trả lời:


25

Giải thích về sơ đồ tải của phân tích PCA hoặc Factor.

Tải biểu đồ hiển thị các biến dưới dạng các điểm trong không gian của các thành phần chính (hoặc các yếu tố). Các tọa độ của các biến là, thông thường, các tải. (Nếu bạn kết hợp đúng cách tải biểu đồ với biểu đồ phân tán tương ứng của các trường hợp dữ liệu trong cùng một không gian thành phần, đó sẽ là biplot.)

Hãy để chúng tôi có 3 biến bằng cách nào đó tương quan, , W , U . Chúng tôi tập trung vào chúng và thực hiện PCA , trích xuất 2 thành phần chính đầu tiên trong số ba: F 1F 2 . Chúng tôi sử dụng tải trọng làm tọa độ để thực hiện tải đồ bên dưới. Tải là các phần tử của hàm riêng không chuẩn, tức là các hàm riêng được tạo bởi các phương sai thành phần tương ứng hoặc giá trị riêng.VWUF1F2

enter image description here

Đang tải cốt truyện là mặt phẳng trên hình. Chúng ta hãy xem xét chỉ biến . Mũi tên được vẽ theo thói quen trên một ô tải là những gì được dán nhãn h ở đây; tọa độ a 1 , a 2 lần lượt là các tải của V với F 1F 2 (xin vui lòng biết rằng về mặt thuật ngữ thì đúng hơn khi nói "thành phần tải một biến", chứ không phải ngược lại).Vha1a2VF1F2

Mũi tên là chiếu, trên máy bay thành phần, các vector h mà là vị trí thực sự của biến V trong các biến không gian kéo dài bởi V , W , U . Chiều dài bình phương của vectơ, h 2 , là đúng một của V . Trong khi h 2phần của phương sai đó được giải thích bởi hai thành phần.hhVVWUh2aVh2

Đang tải, tương quan, dự kiến ​​tương quan . Kể từ biến đã tập trung khai thác trước khi các linh kiện, tương quan Pearson giữa V và thành phần F 1 . Đó không nên nhầm lẫn với cos alpha trên cốt truyện tải, đó là một đại lượng khác: nó là Pearson tương quan giữa thành phần F 1 và biến vectored đây là h ' . Là một biến, h là dự đoán của V bởi các thành phần (được chuẩn hóa) trong hồi quy tuyến tính (so sánh với bản vẽ hình học hồi quy tuyến tính ở đâycosϕVF1cosαF1hhV) trong đó các tải của là các hệ số hồi quy (khi các thành phần được giữ trực giao, như được trích xuất).a

Thêm nữa. Chúng tôi có thể nhớ (lượng giác) mà . Nó có thể được hiểu là sản phẩm vô hướng giữa vector V và đơn vị độ dài vector F 1 : h 1 cos φ . F 1 được đặt là vectơ phương sai đơn vị vì nó không có phương sai riêng của nó ngoài phương sai của V mà nó giải thích (theo số lượng h ): tức là F 1a1=hcosϕVF1h1cosϕF1VhF1là một trích xuất từ ​​V, W, U và không phải là một thực thể được mời từ bên ngoài. Sau đó, rõ ràng, hiệp phương saigiữaVtiêu chuẩn hóa, đơn vị có quy môb(để sets1=a1=varVvarF1r=h1cosϕVb) thành phầnF1. Hiệp phương sai này có thể so sánh trực tiếp với hiệp phương sai giữa các biến đầu vào; ví dụ, hiệp phương sai giữaVWsẽ là tích của độ dài vectơ của chúng nhân với cosin giữa chúng.s1=varF1=1F1VW

Tóm lại: tải có thể được coi là hiệp phương sai giữa các thành phần tiêu chuẩn hóa và biến quan sát, h 1 cos φ , hoặc tương đương giữa các thành phần tiêu chuẩn hóa và giải thích (bởi tất cả các thành phần xác định cốt truyện) hình ảnh của biến, h '1 cos α . Đó cos α có thể được gọi là V-F1 tương quan dự kiến trên thành phần không gian con F1-F2.a1h1cosϕh1cosαcosα

Mối tương quan nói trên giữa một biến và một thành phần, , cũng được gọi là tải tiêu chuẩn hóa hoặc thay đổi kích thước . Nó thuận tiện trong việc giải thích các thành phần vì nó nằm trong phạm vi [-1,1].cosϕ=a1/h

cosϕVa1=e1s1s11F1biến tiềm ẩn. Sau đó, đến phần tử eigenvector e1=a1s1=hs1cosϕcosϕcosϕ (có biểu đồ tải) trong đó các biến tương quan là quạt của vectơ - không phải là trục trực giao - và các góc vectơ là thước đo liên kết - và không phải là xoay vòng cơ sở không gian.

1/sh/s

a cosϕcosαe=a/s

Bình phương giá trị Eigenvector có nghĩa là sự đóng góp của một biến vào một pr. thành phần. Tải lại bình phương bình phương có ý nghĩa của sự đóng góp của một pr. thành phần thành một biến.

cosϕ a1=cosϕh=1

hh hVhα


a,b/(n1)nnXXXXn1a1=hs1cosϕh varVVs11F1varF1F1cosϕ=rn1


α

@ssdecontrol, tôi đã thêm một dòng liên quan đến điều đó.
ttnphns

a1=varVvarF1r=h1cosϕr=cosϕvarF1=1varV=hh=V=x2varV=x2n1

1
@AntoniParellada, vui lòng kiểm tra chú thích.
ttnphns

1
F1
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.