Hình dung các giao điểm của nhiều bộ


30

Có một mô hình trực quan nào tốt cho việc hiển thị giao điểm chồng chéo của nhiều bộ không?

Tôi đang suy nghĩ một cái gì đó giống như biểu đồ Venn nhưng bằng cách nào đó có thể cho vay tốt hơn với số lượng lớn hơn các bộ như 10 hoặc nhiều hơn. Wikipedia không hiển thị một số sơ đồ Venn được đặt cao hơn nhưng ngay cả các sơ đồ 4 bộ cũng có rất nhiều.

Tôi đoán kết quả cuối cùng của dữ liệu là nhiều bộ sẽ không trùng nhau nên có thể sơ đồ Venn sẽ ổn - nhưng tôi muốn tìm một công cụ máy tính có thể tạo ra nó. Đối với tôi, biểu đồ của Google không cho phép nhiều bộ như vậy.


1
Liên quan, nhưng đối với số lượng nhỏ các bộ (để tham khảo): stats.stackexchange.com/questions/4211/...

Câu trả lời:


18

Khi bạn có một số lượng lớn các tập hợp, tôi sẽ thử một cái gì đó tuyến tính hơn và hiển thị các liên kết trực tiếp (như biểu đồ mạng). Flare và Protovis đều có các tiện ích để xử lý các hình ảnh này.

Xem câu hỏi này cho một số ví dụ như thế này:

văn bản thay thế


(+1) Câu trả lời hay! - Tôi đặc biệt thích đồ họa. Tôi đã tự hỏi nếu có một cách để làm điều này trong R?
suncoolsu

1
Tôi không biết cách nào để làm điều đó; gói webvis của tôi cung cấp một trình bao bọc cho Protovis, nhưng sẽ rất nhiều công việc để làm cho nó tạo ra đồ họa này. Ngẫu nhiên, bài viết này giới thiệu "sơ đồ vòng cung" có liên quan: ieg.ifs.tuwien.ac.at/~aigner/teaching/ws06/infovis_ue/ con / trộm
Shane

1
@suncoolsu, sơ đồ gói R có thể thực hiện cùng một "sơ đồ cung" mà Shane đã chỉ. Có vẻ như sẽ rất vất vả mặc dù để có được "web cốt truyện" trông giống như hình ảnh ở trên. cran.r-project.org/web/packages/diagram/vignettes/diagram.pdf .
Andy W

và Andy. Cảm ơn bạn cho câu trả lời của bạn. @Shane, tôi đã thấy gói webvis của bạn. Nhưng tôi vẫn cần khám phá thêm. Tôi thích đồ thị nguyên sinh rất nhiều. Họ có một trang web tuyệt vời.
suncoolsu

1
Biểu đồ đẹp, nhưng nó không trả lời câu hỏi ban đầu, vì bạn không thể biểu thị giao điểm của 3 bộ trở lên. Có một biến thể của nó không?
nassimhddd

11

Điều này sẽ không cạnh tranh với câu trả lời của @ Shane vì màn hình tròn thực sự phù hợp để hiển thị các mối quan hệ phức tạp với các bộ dữ liệu chiều cao.

Đối với sơ đồ Venn, tôi đã sử dụng gói venneuler R. Nó có giao diện đơn giản nhưng trực quan và tạo ra các sơ đồ tiện lợi với độ trong suốt, so với venn()chức năng cơ bản được mô tả trong Tạp chí Phần mềm Thống kê . Nó không xử lý hơn 3 loại, mặc dù. Một dự án khác là eVenn và nó liên quan đến bộ.K=4

Gần đây, tôi đã bắt gặp một gói mới liên quan đến các bộ quan hệ bậc cao hơn và có thể cho phép tái tạo một số sơ đồ Venn được hiển thị trên Wikipedia hoặc trên trang web này, Biểu đồ Venn là gì? , nhưng nó cũng bị giới hạn ở bộ. Nó được gọi là VennDiagram, nhưng xem tài liệu tham khảo: VennDiagram: gói dành cho việc tạo sơ đồ Venn và Euler có khả năng tùy biến cao trong R (Chen và Boutros, BMC Bioinformatics 2011, 12:35).K=4

Để tham khảo thêm, bạn có thể quan tâm đến

Kestler và cộng sự, sơ đồ Venn tổng quát: một phương pháp mới trực quan hóa các mối quan hệ di truyền phức tạp , Tin sinh học, 21 (8), 1592-1595 (2004).

Biểu đồ Venn có những hạn chế của họ, mặc dù. Về mặt này, tôi thích cách tiếp cận của Robert Kosara trong Tầm nhìn: Thử thách có thể định vị hoặc với Bộ song song (nhưng cũng xem cuộc thảo luận này trên weblog của Andrew Gelman).


Nó có vẻ tốt. tôi sẽ thích nó nếu nó chấp nhận số không. Có vẻ như người ta phải chuyển đổi dữ liệu của họ thành một danh sách số trước tiên.
Eastafri

Đối với các mục đích thực tế, sẽ rất tuyệt vời khi bao gồm một số screengrabs
user5783745

7

Chúng tôi đã phát triển một cách tiếp cận dựa trên ma trận cho các giao lộ được đặt tên là Upset, bạn có thể kiểm tra nó tại http://vcg.github.io/upset/ . Đây là một ví dụ:

Ảnh chụp màn hình

Ma trận bên trái xác định giao điểm mà một hàng đại diện, hàng cuối cùng ở đây, ví dụ, là giao điểm của thể loại phim "Hành động, Phiêu lưu và Trẻ em". Các thanh bên phải cho bạn thấy kích thước của giao lộ, 4 trong ví dụ này.

Bạn cũng có thể vẽ các thuộc tính của các giao lộ hoặc các lựa chọn khác, v.v. Kiểm tra trang web để biết chi tiết.

Hiện tại cũng có một phiên bản tĩnh cho R mà bạn có thể tìm thấy trên trang web được đề cập ở trên hoặc bằng cách truy cập tại đây: https://github.com/hms-dbmi/UpSetR/

Một báo cáo hiện đại về trực quan hóa thiết lập có thể truy cập được tại http://www.cvast.tuwien.ac.at/setViz - hầu hết trong số này là học thuật mặc dù và không đi kèm với mã có sẵn.


1
Đối với tôi, hình ảnh bạn đăng lên là một ví dụ về việc quá mức, với quá nhiều thông tin được đóng gói trên một cốt truyện duy nhất ...
Tim

1
@Tim. Trong khi tôi hiểu những gì bạn đang nói, nó không thực sự quá mức vì tất cả các yếu tố thị giác đều có thể nhìn thấy và tách biệt rõ ràng. Bạn có thể lập luận rằng cốt truyện quá phức tạp để dễ dàng nhận ra nhưng điều này cũng có thể liên quan đến việc bạn không được đào tạo sử dụng cốt truyện - không phải tất cả các trực quan hóa đều có thể hoặc nên nhắm vào người dùng chưa được đào tạo, vì đơn giản hóa thường dẫn đến phạm vi hạn chế (ví dụ khả năng mở rộng kém của sơ đồ venn)
ThomasP85

@ ThomasP85 đã có nhiều nghiên cứu chỉ ra rằng mọi người thực sự rất tệ trong việc diễn giải trực quan các lô (thậm chí là "các chuyên gia", kể cả những thứ cơ bản như biểu đồ hình tròn. Trong hầu hết các trường hợp trực quan phức tạp dẫn đến giải thích sai và hiểu lầm.
Tim

@Tim Tôi đồng ý rằng đơn giản luôn tốt hơn, nhưng câu hỏi phức tạp đôi khi có câu trả lời phức tạp. Lý do câu hỏi này được đặt ra ngay từ đầu là vì ở đó, cho đến ngày nay, không phải là một kỹ thuật trực quan đơn giản, hấp dẫn để đối phó với số lượng lớn các giao điểm được thiết lập. Câu trả lời được chấp nhận chỉ liên quan đến chính nó với các giao điểm 2 độ, khi số bộ tăng lên, là một phần nhỏ hơn và nhỏ hơn trong tổng số giao cắt.
ThomasP85

... và ví dụ của bạn với biểu đồ hình tròn có liên quan đến thực tế là con người (chuyên gia hay không) rất kinh khủng khi so sánh các góc, đó là lý do tại sao không nên sử dụng biểu đồ hình tròn :-)
ThomasP85
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.