Tài nguyên cho việc học để tạo trực quan hóa dữ liệu?


19

Tôi quan tâm đến việc tìm hiểu làm thế nào để tạo ra loại trực quan mà bạn nhìn thấy tại http://flowingdata.com và thông tin đẹp mắt. EDIT: Có nghĩa là, trực quan hóa bản thân rất thú vị - giống như đồ họa của NY Times, trái ngược với một cái gì đó nhanh chóng cho một báo cáo.

Những loại công cụ nào được sử dụng để tạo ra những công cụ này - có phải hầu hết là Adobe Illustrator / Photoshop không? Tài nguyên tốt (sách, trang web, v.v.) để tìm hiểu cách sử dụng các công cụ này để trực quan hóa dữ liệu cụ thể là gì?

Tôi biết những gì tôi muốn trực quan hóa trông như thế nào (và tôi quen thuộc với các nguyên tắc thiết kế, ví dụ, từ sách của Tufte), nhưng tôi không biết làm thế nào để tạo ra chúng.

Câu trả lời:


20

Dữ liệu chảy thường xuyên thảo luận về các công cụ mà anh ta sử dụng. Xem, ví dụ:

Anh ấy cũng thể hiện rất chi tiết cách anh ấy làm đồ họa, chẳng hạn như:

Ngoài ra còn có các câu hỏi khác trên trang web này:

IMO, hãy thử:

  1. R và ggplot2: đây là một video giới thiệu tốt , nhưng trang web ggplot2 có rất nhiều tài nguyên.
  2. Xử lý: nhiều hướng dẫn tốt trên trang chủ .
  3. Protovis: cũng là một loạt các ví dụ tuyệt vời trên trang chủ .

Bạn có thể sử dụng Adobe sau đó để dọn sạch chúng.

Bạn cũng có thể xem webvisgói R , mặc dù nó không đầy đủ như ggplot2. Từ R, bạn có thể chạy lệnh này để xem ví dụ Wheat của Playfair:

install.packages("webvis")
library(webvis)
demo("playfairs.wheat")

Cuối cùng, các ứng dụng thương mại yêu thích của tôi để hiển thị tương tác là:


1
Tuyệt vời, liên kết tuyệt vời! Tôi đã sử dụng R và ggplot2, nhưng các hình ảnh trực quan từ đó dường như giống với "đồ họa cho báo cáo" hơn là "sự thú vị / hình ảnh thú vị của chính nó" - sự thú vị mà tôi đang tìm kiếm. (ggplot2 là siêu đẹp, nhưng nó không thực sự có nghĩa là cho phép sáng tạo không giới hạn.) Tôi có sai không?, hoặc đôi khi bạn sử dụng R / ggplot2 làm đầu vào cho một công cụ trực quan khác?
raegtin

5

Đã đề cập xử lý có một bộ sách đẹp có sẵn. Xem: 1 , 2 , 3 , 4 , 5 , 6 , 7

Bạn sẽ tìm thấy rất nhiều thứ trên web để giúp bạn bắt đầu với R. Là bước tiếp theo sau đó ggplot2 có tài liệu web tuyệt vời . Tôi cũng thấy cuốn sách của Hadley rất hữu ích.

Python có thể là một cách khác để đi. Đặc biệt với các công cụ như:

Tất cả các dự án đều được ghi chép tốt trên web. Bạn cũng có thể xem xét nhìn trộm vào một số cuốn sách .

Cuối cùng, cuốn sách Đồ họa của Bộ dữ liệu lớn cũng có thể là một số trợ giúp.


igraphlàm việc trong R cũng; cho 3D openGL tăng tốc vis trong R, sử dụng rgl& misc3dgói.

Ngoài ra matplotlibâm mưu là xấu xí; chúng có thể tốt cho người dùng gnuplot lâu năm.

2

Bạn sẽ dành nhiều thời gian để tăng tốc với R.

RapidMiner là mã nguồn mở và đồ họa miễn phí, và có nhiều hình ảnh trực quan tốt, và bạn có thể xuất chúng.

Nếu bạn có tiền để dự phòng, hoặc là nhân viên / sinh viên đại học thì JMP cũng rất tuyệt vời. Nó có thể tạo ra một số biểu đồ rất đẹp, rất rất dễ dàng. Có thể xuất sang flash hoặc PNG hoặc PDF hoặc những gì có bạn.


5
1. Thời gian IMHO dành cho R được đầu tư tốt nếu bạn có kế hoạch làm bất cứ điều gì nghiêm túc. 2. Cũng xem xét KNIME knime.org như một sự thay thế RapidMiner.
radek

(+1) @radek. Tôi cũng là một người hâm mộ nhanh chóng, nhưng theo tôi nó không đủ linh hoạt cho các hình ảnh tinh vi.
steffen

Nếu bạn có bất kỳ kinh nghiệm mã hóa nào, thì bạn sẽ không thực sự cần nhiều hơn một ngày để tăng tốc với R. Nó khá dễ dàng, theo như ngôn ngữ, và có một số hướng dẫn trực tuyến tuyệt vời.
ness101

1

Một lựa chọn tốt khác là thư viện protovis http://vis.stanford.edu/protovis/

Đây là một thư viện JavaScript được tạo thủ công rất tốt, có thể tạo ra một số hình ảnh đẹp mắt nếu bạn có thời gian và khả năng viết số lượng mã JavaScript khiêm tốn cần thiết.

Tôi cũng rất khuyến khích Tableau http://www.tableausoftware.com . Nó là tuyệt vời để nhanh chóng khám phá các tập dữ liệu và tạo ra nhiều hình ảnh trực quan khác nhau.

Cả hai sản phẩm đều có nguồn gốc tại Nhóm Trực quan Stanford.


1

Nhiều câu trả lời xuất sắc đã được đưa ra ở đây, và ngôn ngữ / thư viện bạn chọn để học sẽ phụ thuộc vào loại hình ảnh bạn muốn làm.

Tuy nhiên, nếu bạn sử dụng Python thường xuyên thì tôi khuyên bạn nên đi biển . Nó rất tinh vi khi nói đến trực quan hóa dữ liệu thống kê, nhưng cũng trông khá tinh vi từ quan điểm trình bày.

Hãy lấy một ví dụ. Giả sử bạn đang cố gắng tiêu thụ điện năng cho một tòa nhà thương mại theo tháng. Một biểu đồ đường đơn giản có thể được tạo ra trong matplotlib cho mục đích này.

Tuy nhiên, nếu chúng ta muốn làm cho trực quan hóa tinh vi và nhiều thông tin hơn, chúng ta có thể tạo ra một bản đồ nhiệt với seaborn:

bản đồ nhiệt

Một bản đồ nhiệt chỉ là một ví dụ. Một số cách sử dụng phổ biến khác với seaborn bao gồm:

  • Lô KDE
  • Lô đất
  • Lô violon

Ý tưởng đằng sau seaborn là trình bày dữ liệu theo cách trực quan hơn có thể bằng cách sử dụng các biểu đồ đơn giản hơn, ví dụ như đường, thanh, bánh, v.v.

Nếu đó là điều bạn quan tâm - bạn có thể tìm thêm thông tin về seaborn tại đây: https://seaborn.pydata.org/



0

R là tuyệt vời, nhưng không khó để R học được rằng tài liệu không thể tìm kiếm bất kỳ tên nào khác như Rq sẽ là tuyệt vời. Vì vậy, khi bạn gặp vấn đề, tìm kiếm giải pháp là một cơn ác mộng và tài liệu cũng không tuyệt vời. Matlab hoặc Octave sẽ rất tuyệt. Và để có được những âm mưu trong R hoặc Matlab sẽ rất rất tẻ nhạt.

IMHO xử lý bài hình ảnh là con đường tốt nhất. Rất nhiều trong số chúng từ luồng dữ liệu được đưa vào thông qua Adobe Illustrator hoặc Gimp. Nó nhanh hơn Khi bạn có được cấu trúc của cốt truyện, sau đó thay đổi chi tiết trong trình chỉnh sửa. Sử dụng R làm trình chỉnh sửa không mang lại cho bạn sự linh hoạt mà bạn muốn. Bạn sẽ thấy mình tìm kiếm các gói mới mọi lúc.


R; function??- R đã sẵn sàng giúp đỡ. bạn cũng có thể thường tìm kiếm "cran" để tìm nội dung R và tôi thấy rằng hầu hết các công cụ tìm kiếm lớn có thể xử lý tốt từng chữ cái.
ness101



-3

Có vô số tài nguyên, nhưng bạn có thể thu hẹp chúng dựa trên cách bạn muốn chuyển đổi dữ liệu của mình, số lượng nguồn dữ liệu bạn đang xử lý, cách chúng cần được chia sẻ, v.v.

Dưới đây là hướng dẫn về cách chọn đúng tài nguyên có thể giúp chỉ cho bạn đi đúng hướng.


1
Khi bạn liên kết với nhóm này, vui lòng khai báo sở thích. Liên kết chỉ trả lời không hữu ích nhất. Lời khuyên tại stats.stackexchange.com/help/promotion có thể được áp dụng.
Nick Cox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.