Một số lựa chọn phổ biến để trực quan hóa dữ liệu 4 chiều là gì?


12

Giả sử tôi có dữ liệu bốn chiều sau, trong đó ba dữ liệu đầu tiên có thể được coi là tọa độ và dữ liệu cuối cùng có thể được coi là giá trị.

c1, c2, c3, value
1, 2, 6, 0.456
34, 34, 12 0.27
12, 1, 66 0.95

Làm thế nào để hình dung rõ hơn ảnh hưởng của ba tọa độ đầu tiên đến giá trị cuối cùng?

Tôi nhận thức được ba phương pháp.

Một là đồ thị 3D cho ba tọa độ đầu tiên với kích thước điểm là bốn giá trị. Nhưng không dễ để thấy xu hướng trong dữ liệu.

Một cái khác đang sử dụng một loạt các cốt truyện 3D, mỗi cốt truyện đều có tọa độ cố định. nhập mô tả hình ảnh ở đây

Một số khác có thể là một "đồ thị trellis" trong mạng của R. Không sur eif nó là cho mục đích này nhưng có vẻ như vậy. nhập mô tả hình ảnh ở đây


2
Bạn có cần một màn hình tĩnh (ví dụ, cho một tờ giấy)?
gung - Phục hồi Monica

Câu trả lời:


12

Nếu ba đầu tiên chỉ là tọa độ không gian và dữ liệu thưa thớt, bạn có thể chỉ cần thực hiện một biểu đồ phân tán 3D với các điểm có kích thước hoặc màu khác nhau cho giá trị.

Trông giống như thế này: (nguồn: gatech.edu )Tiêu tan

Nếu dữ liệu của bạn được dự định là liên tục trong tự nhiên và tồn tại trên một mạng lưới, bạn có thể vẽ một số isocontours của dữ liệu bằng cách sử dụng Marching Cubes .

Một cách tiếp cận khác khi bạn có dữ liệu 4D dày đặc là hiển thị một vài "lát" dữ liệu 2D được nhúng trong 3D. Nó sẽ trông giống như thế này:

Lát


Scatterplot 3D màu chỉ thực sự phù hợp cho các chức năng liên tục trên dữ liệu 3D. Nếu độ dốc của hàm thay đổi trơn tru thì bạn có thể thấy một số mẫu trên phân tán điểm. Tương tự, trực quan hóa âm lượng ở phía dưới cũng hoạt động tốt nhất trong kịch bản này. Nếu chức năng rất ồn bạn sẽ khó có thể nhìn thấy bất cứ điều gì. Nếu bạn có 4 biến giải thích (như thực hiện PCA hoặc phân cụm) vẽ 3 trong tọa độ Euclide và thứ 4 sử dụng một số ánh xạ phi tuyến để tô màu trong việc đưa ra một số sai lệch nhận thức, không thể định lượng được.
Dianne Cook

@DianneCook đó là sự thật. Tôi đoán đó là những gì tôi nhận được khi luôn làm việc với dữ liệu thể tích 3D mượt mà, liên tục;)
mklingen

Này, đó là những gì mà quesiton đã hỏi% ^)
Dianne Cook

9

Bạn có bốn biến định lượng? Nếu vậy, hãy thử tham quan, các ô phối hợp song song, ma trận phân tán. Gói tourr (và tourrGui) trong R sẽ chạy các tour, về cơ bản xoay theo kích thước cao, bạn có thể chọn chiếu thành 1D, 2D trở lên và có một bài báo JSS mà bạn có thể đọc để bắt đầu trích dẫn trong gói. Các lô phối hợp song song và ma trận phân tán nằm trong gói GGally, các ma trận phân tán cũng nằm trong gói YaleToolkit. Bạn cũng có thể xem http://www.ggobi.org để xem video và có thêm tài liệu về tất cả những thứ này.

Nếu dữ liệu của bạn là hoàn toàn phân loại, bạn nên sử dụng các ô khảm hoặc các biến thể. Hãy xem gói sản phẩm trong R, vcd cũng có một số chức năng hợp lý hoặc gói ggpool để thực hiện tương đương với các lô tọa độ song song cho dữ liệu phân loại. Ngoài ra, chỉ cần tìm thấy gói extracat có một số chức năng để hiển thị dữ liệu phân loại.

Tôi đã đọc sai câu hỏi, ban đầu, vì tôi dừng lại ở câu hỏi và bỏ qua việc đọc mô tả đầy đủ. Tương tự như cách tiếp cận bên dưới (tô màu các điểm trong 3D), bạn có thể sử dụng đánh răng được liên kết để khám phá các chức năng được xác định trên các không gian chiều cao. Hãy xem video ở đây cho thấy làm điều này cho một chức năng bình thường đa biến 3D. Bàn chải vẽ các điểm có mật độ cao (giá trị hàm cao) và sau đó di chuyển đến giá trị mật độ thấp hơn và thấp hơn (giá trị hàm thấp). Các vị trí nơi chức năng được lấy mẫu được hiển thị trong biểu đồ phân tán xoay 3D, sử dụng chuyến tham quan, có thể được sử dụng để xem xét các miền 4, 5 hoặc cao hơn.


2

Hãy thử khuôn mặt của Chernoff . Ý tưởng là gắn các biến với các đặc điểm trên khuôn mặt. Chẳng hạn, kích thước của nụ cười sẽ là một biến số, độ tròn của khuôn mặt là một biến số khác. Thật kỳ cục như nó nghe, điều này thực sự có thể hoạt động nếu bạn tìm ra một cách thông minh để ánh xạ các biến vào các tính năng.

Một cách khác là hiển thị các hình chiếu 2-d của sơ đồ pha 3-d. Giả sử bạn có x1, x2, x3, x4 các biến của bạn. Đối với mỗi giá trị của x4, hãy vẽ đồ thị 3-d của (x1, x2, x3) điểm và kết nối các điểm. Điều này hoạt động tốt nhất khi x4 được đặt hàng, ví dụ như ngày hoặc giờ.

CẬP NHẬT: Bạn cũng có thể thử lô bong bóng. Ba kích thước thường là cartesian x, y, z và chiều thứ 4 sẽ là kích thước của điểm bong bóng.

Bạn có thể thử hoạt hình, tức là sử dụng thời gian làm chiều thứ tư.

Cũng là sự kết hợp giữa bong bóng và hoạt hình: x, y, bong bóng và thời gian.

Ngoài ra, liên quan đến Chernoff là cốt truyện glyph , có thể nghiêm trọng hơn một chút. Đó là những ngôi sao có chiều dài tia tỷ lệ với các giá trị thay đổi.


Cảm ơn bạn đã trả lời. Có vẻ như tùy chọn thứ hai là có thể cho vấn đề của tôi. Tôi nghĩ rằng cái đầu tiên dường như không nghiêm trọng đối với một bài nghiên cứu. Về cơ bản tôi muốn cốt truyện có thể tiết lộ một số xu hướng hoặc ảnh hưởng của ba yếu tố đến giá trị (chiều thứ tư).
Tyler 来 国

5
Khuôn mặt của Chernoff đã được sử dụng trong nghiên cứu nghiêm túc, afaik.
Aksakal

1
Các mặt của Chernoff có thể cực kỳ hữu ích, đặc biệt là khi chiều có khoảng 10-20 biến. Đối với bốn chiều, chúng không hiệu quả như các loại biểu diễn đồ họa khác.
whuber

3
khuôn mặt chernoff là một ý tưởng khủng khiếp! nếu bạn phải sử dụng một biểu tượng biểu tượng, hãy sử dụng starplot. Nếu bạn có một bộ dữ liệu thực sự nhỏ, những thứ này có thể hữu ích, nhưng hãy thử vẽ 1000 biểu tượng và xem bạn có thực sự nhìn thấy gì không!
Dianne Cook
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.