Có nhiều cách khác nhau để tạo ra một biplot PCA và vì vậy không có câu trả lời duy nhất cho câu hỏi của bạn. Đây là một tổng quan ngắn.
Chúng tôi giả sử rằng ma trận dữ liệu có n điểm dữ liệu trong các hàng và được căn giữa (nghĩa là cột có nghĩa là tất cả bằng không). Hiện tại, chúng tôi không cho rằng nó đã được chuẩn hóa, tức là chúng tôi xem xét PCA trên ma trận hiệp phương sai (không phải trên ma trận tương quan). PCA chiếm một phân hủy giá trị ít X = U S V ⊤ , bạn có thể xem câu trả lời của tôi ở đây để biết chi tiết: Mối quan hệ giữa SVD và PCA. Làm thế nào để sử dụng SVD để thực hiện PCA?Xn
X = U S V.⊤,
Trong một biplot PCA, hai thành phần chính đầu tiên được vẽ như một biểu đồ phân tán, tức là cột đầu tiên của được vẽ trên cột thứ hai của nó. Nhưng bình thường hóa có thể khác nhau; ví dụ: người ta có thể sử dụng:Bạn
- Cột của : đây là các thành phần chính được chia tỷ lệ thành đơn vị tổng bình phương;Bạn
- Cột của : đây là các thành phần chính được tiêu chuẩn hóa (phương sai đơn vị);n - 1-----√Bạn
- Cột của : đây là các thành phần chính "thô" (dự đoán về các hướng chính).U S
Hơn nữa, các biến ban đầu được vẽ như mũi tên; tức là tọa độ của một i -thứ mũi tên thiết bị đầu cuối được đưa ra bởi các i -thứ giá trị trong cột đầu tiên và thứ hai của V . Nhưng một lần nữa, người ta có thể chọn các chuẩn hóa khác nhau, ví dụ:(x,y)iiV
- VS
- V S /n−1−−−−-√
- V
Đây là cách tất cả những thứ đó trông giống như cho bộ dữ liệu của Fisher Iris:
9XU SαβV S( 1 - a )/ β9 là "biplots thích hợp": cụ thể là sự kết hợp của bất kỳ subplot nào ở trên với cái trực tiếp bên dưới.
[Dù sử dụng kết hợp nào, có thể cần phải chia tỷ lệ mũi tên theo một số yếu tố không đổi tùy ý để cả mũi tên và điểm dữ liệu xuất hiện gần như trên cùng một tỷ lệ.]
V S / n - 1-----√U n - 1-----√
[Sự lựa chọn cụ thể] này có khả năng cung cấp một trợ giúp đồ họa hữu ích nhất trong việc diễn giải các ma trận đa biến của các quan sát, tất nhiên, với điều kiện là chúng có thể được xấp xỉ đầy đủ ở cấp hai.
U SV
U S
biplot
BạnV Sbiplot
0,8biplot
n / ( n - 1 )1Mũi tên của các biến cơ bản trong biplot PCA trong R. )
PCA về ma trận tương quan
X1
1R = 1
Đọc thêm: