Tọa độ sao so với phân tích thành phần chính


8

Tôi hiện đang chuẩn bị một bài thuyết trình cho một khóa học đại học về "Phân tích dữ liệu trực quan". Và một trong những chủ đề của tôi là hình dung "Phối hợp sao". Tọa độ sao

Khi tọa độ sao thực hiện chuyển đổi dữ liệu chiều cao và kỹ thuật PCA nổi tiếng cũng làm như vậy, tôi tự hỏi liệu PCA có thể được bắt chước bởi tọa độ sao không? Tôi nghĩ đến việc sắp xếp lại các trục tọa độ theo cách chúng thể hiện sự kết hợp tuyến tính của các biến ban đầu? Nhưng đây chỉ là một ý tưởng. Ai đó có thể xác nhận hoặc bác bỏ điều này?


Liên kết này rất thú vị, cảm ơn (+1). Ý tưởng của bạn bằng cách nào đó mimic PCA by Star Coordinatesquá mơ hồ để đặt ra một vấn đề thực sự (vì vậy một câu hỏi có thể được đặt ra). Người ta có thể khuyên bạn thử làm điều đó trước, và sau đó - nếu bạn gặp vấn đề hoặc nghi ngờ - hãy đặt câu hỏi.
ttnphns

2
Để thêm vào câu trả lời được chấp nhận, bạn có thể dùng thử Tọa độ sao tại đây: star-coordins.com Việc triển khai này có thể cho bạn ý tưởng về các hoạt động có thể. Tuyên bố miễn trừ trách nhiệm: Tôi là người tạo ra trang web đó. Khi tôi đang tìm cách hiểu loại hình trực quan này cho chính mình, tôi không thể tìm thấy một triển khai trực tuyến cho nó.
kadrian

Câu trả lời:


9

PCA và "tọa độ sao" làm những việc khác nhau. Vì tọa độ sao chuẩn hóa tất cả các giá trị, nên so sánh công bằng sẽ áp dụng PCA cho ma trận tương quan (chứ không phải ma trận hiệp phương sai), đây là một cách khác để chuẩn hóa các giá trị.

  • PCA xác định một hệ tọa độ thích ứng với hình dạng của dữ liệu, trong khi tọa độ sao dựa trên tọa độ đã cho ban đầu trong dữ liệu.

    Điều này làm cho PCA linh hoạt hơn rất nhiều trong việc phát hiện mối quan hệ giữa các dữ liệu. "Tọa độ sao", ngược lại, không nhiều hơn một đồ họa 2D đơn sắc thông tin .

  • PCA (khi được thực hiện trên ma trận tương quan) sử dụng phương tiện dữ liệu cho nguồn gốc và độ lệch chuẩn của chúng cho các thang đo. Các tọa độ sao sử dụng cực tiểu dữ liệu cho gốc và phạm vi của chúng cho các tỷ lệ.

    Các cực tiểu và phạm vi rất nhạy cảm với dữ liệu xa hơn so với độ lệch chuẩn, làm cho tọa độ sao không phù hợp để khám phá dữ liệu mục đích chung.

Như vậy, mỗi cái đều có những điểm mạnh - mặc dù những điểm mạnh riêng của tọa độ sao so với PCA rất khó để hiểu.

{2,1,.01}

Nhân vật

Do các hướng khác nhau của các đám mây điểm này so với các trục tọa độ ban đầu, các ô tọa độ sao hoàn toàn khác nhau. Đây là đặc điểm: tọa độ sao cung cấp thông tin (rất hạn chế) về tọa độ ban đầu trong khi PCA tiết lộ mối quan hệ giữa các tọa độ.

Bạn cũng có thể thấy tọa độ sao là một loại phép chiếu "tình cờ": đôi khi chúng sẽ thu được các thành phần chính lớn của dữ liệu, như trong phiên bản tay trái, và đôi khi chúng sẽ chụp các thành phần lớn và nhỏ (như ở tay phải) và tại các thời điểm khác (không được minh họa) họ chỉ chụp các thành phần nhỏ (và tất cả các điểm được tập trung dày đặc gần gốc, cho thấy hầu như không có gì).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.