Trực quan hóa dữ liệu chiều cao


11

Tôi có các mẫu của hai lớp là các vectơ trong không gian chiều cao và tôi muốn vẽ chúng ở dạng 2D hoặc 3D.

Tôi biết về các kỹ thuật giảm kích thước, nhưng tôi cần một công cụ thực sự đơn giản và dễ sử dụng (trong matlab, python hoặc .exe dựng sẵn).

Ngoài ra tôi tự hỏi là đại diện trong 2D sẽ là "có ý nghĩa"? (Ví dụ cách hai lớp giao nhau hoặc có thể tách rời).

Câu trả lời:


8

Bạn có thể thử tSNE . Nó là khá đơn giản để sử dụng. Nó hoạt động với Octave, ngoài Matlab và Python. Hãy xem hướng dẫn để có được một cốt truyện đầu tiên trong vòng một phút.


10

Một công cụ dựng sẵn để hiển thị dữ liệu chiều cao là ggobi . Nó cho phép bạn tô màu các điểm để thể hiện các nhóm và sau đó có một vài tùy chọn để giảm kích thước cao thành biểu diễn 2 chiều. Một công cụ đặc biệt thú vị là chuyến tham quan lớn 2D về cơ bản xoay đám mây dữ liệu theo nhiều chiều và hiển thị cho bạn hình ảnh động của phép chiếu 2D của phép quay. Bạn có thể làm chậm hoặc tạm dừng xoay khi bạn thấy các mẫu thú vị.


Một công cụ rất tốt thực sự, cũng hoạt động với R.
Yves


2

Cách tiếp cận cổ điển sẽ là sử dụng PCA ( Phân tích thành phần chính ) để thực hiện giảm kích thước tuyến tính. Về cơ bản, điều này chiếu dữ liệu của bạn lên một không gian có kích thước thấp hơn (trong trường hợp 2D, đây chỉ đơn giản là một mặt phẳng) trong khi bảo tồn càng nhiều phương sai của dữ liệu càng tốt.

Chạy PCA thường liên quan đến việc thực thi một lệnh trong hầu hết các ngôn ngữ lập trình, vì vậy nó rất đơn giản.

Bạn nên nhớ rằng có thể dữ liệu của bạn không thể được trình bày chính xác theo 2 hoặc 3 chiều. PCA sẽ tự động cung cấp cho bạn một ước tính định lượng về điều này: Nó sẽ cho bạn biết phần trăm phương sai được ghi lại bằng cách biểu diễn chiều thấp. Điều này sẽ cho bạn cảm giác về việc bạn mất bao nhiêu thông tin bằng cách nhìn vào hình ảnh đơn giản hóa này.




1

Bên cạnh gợi ý của @ juampa, bạn cũng nên thử NeRV (Neighbor Retriny Visualizer), "đây là cách tiếp cận dựa trên truy xuất thông tin theo nguyên tắc để giảm kích thước phi tuyến " và SNE / t-SNE có thể được xem là trường hợp đặc biệt của NeRV. Điểm chính của NeRV là giảm thiểu sự đánh đổi của thu hồiđộ chính xác giữa không gian ban đầu và màn hình. NeRV được cung cấp như một công cụ dòng lệnh được viết bằng C ++.

Một hình ảnh demo từ trang web của họ: kết quả bên trái nhấn mạnh nhiều hơn vào việc thu hồi (ít "bỏ lỡ"), trong khi hình bên phải nhấn mạnh nhiều hơn vào độ chính xác (ít "hàng xóm sai").

nhập mô tả hình ảnh ở đây


1

Nếu bạn không phản đối phần mềm thương mại, bạn có thể dùng thử phần mềm VisuMap triển khai hàng tá thuật toán ánh xạ tuyến tính và phi tuyến tính cho dữ liệu chiều cao, bao gồm các phương pháp như PCA, LDA, SMACOF, tSNE, CCA, Sammon, Kohonen Map, v.v.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.