Vẽ đồ thị tương tác trong khi ghi dữ liệu

8

Tôi đang tìm kiếm biểu đồ và tương tác khám phá dữ liệu đo trực tiếp / liên tục. Có khá nhiều lựa chọn ngoài kia, với cốt truyện là thân thiện với người dùng nhất. Plot.ly có giao diện người dùng tuyệt vời và dễ sử dụng (có thể mở rộng dễ dàng, có thể mở rộng, dễ thu phóng / vừa với màn hình), nhưng không thể xử lý các bộ dữ liệu lớn mà tôi đang thu thập. Có ai biết bất kỳ sự thay thế?

Tôi có MATLAB, nhưng không có đủ giấy phép để đồng thời chạy nó và phát triển cùng một lúc. Tôi biết rằng LabVIEW sẽ là một lựa chọn tuyệt vời, nhưng hiện tại nó rất cấm.

Cảm ơn trước!

dataset visualization

— Clayton Pipkin
nguồn

Bạn đã đề cập đến cả hai loại dữ liệu bạn thu thập, cũng không phải thứ tự độ lớn của khối lượng . Thông tin này sẽ hữu ích trong việc cung cấp một lời khuyên nhắm mục tiêu hơn.

— Alexanderr Blekh

7

Đối với câu trả lời này, tôi đã giả định rằng bạn thích các giải pháp nguồn mở hơn để trực quan hóa dữ liệu lớn . Giả định này dựa trên chi tiết ngân sách từ câu hỏi của bạn. Tuy nhiên, có một loại trừ đối với điều này - bên dưới tôi sẽ thêm một tham chiếu đến một sản phẩm thương mại, mà tôi tin rằng có thể có lợi trong trường hợp của bạn (với điều kiện bạn có thể đủ khả năng đó). Tôi cũng cho rằng các giải pháp dựa trên trình duyệt là chấp nhận được (tôi thậm chí sẽ thích chúng hơn, trừ khi bạn có các yêu cầu mâu thuẫn cụ thể).

Đương nhiên, ứng cử viên đầu tiên là một giải pháp cho vấn đề của bạn, tôi sẽ xem xét thư viện JavaScript của D3.js : http://d3js.org . Tuy nhiên, mặc dù tính linh hoạt và các lợi ích khác , tôi nghĩ rằng giải pháp này quá thấp .

Do đó, tôi khuyên bạn nên xem các dự án nguồn mở sau đây để trực quan hóa dữ liệu lớn , đủ mạnh mẽ và linh hoạt , nhưng hoạt động ở mức độ trừu tượng cao hơn (một số trong số chúng dựa trên nền tảng D3.js và đôi khi được gọi là ngăn xếp trực quan D3.js ).

Bokeh - Thư viện trực quan tương tác dựa trên Python, hỗ trợ dữ liệu lớn và truyền dữ liệu: http://bokeh.pydata.org
Flot - Thư viện trực quan tương tác dựa trên JavaScript, tập trung vào jQuery: http://www.flotcharts.org
NodeBox - hệ thống trực quan hóa dữ liệu nhanh độc đáo (không dựa trên trình duyệt, nhưng đa ngôn ngữ và đa nền tảng), dựa trên thiết kế tổng quát và lập trình chức năng trực quan: https://www.nodebox.net
Xử lý - hệ thống phát triển phần mềm hoàn chỉnh với ngôn ngữ lập trình, thư viện, trình cắm, v.v., hướng đến nội dung trực quan: https : // www. Xử lý.org (cho phép thực hiện các chương trình Xử lý trong trình duyệt thông qua http: // processjs. org )
Crossfilter - Thư viện trực quan tương tác dựa trên JavaScript cho dữ liệu lớn theo Square (trực quan hóa rất nhanh các bộ dữ liệu đa biến lớn): http://sapes.github.io/crossfilter
bigvis - gói R để phân tích khám phá dữ liệu lớn (không phải là thư viện trực quan, nhưng có thể hữu ích để xử lý các tập hợp / tổng hợp dữ liệu lớn, làm mịn / trước khi trực quan hóa, sử dụng các tùy chọn đồ họa R khác nhau): https://github.com / hadley / bigvis
prefuse - Thư viện trực quan tương tác dựa trên Java: http://prefuse.org
Lumify - nền tảng tích hợp, phân tích và trực quan hóa dữ liệu lớn (tính năng thú vị: hỗ trợ Semantic Web): http://lumify.io

Một cách riêng biệt, tôi muốn đề cập đến hai dự án phân tích và hiển thị dữ liệu lớn nguồn mở , tập trung vào dữ liệu đồ thị / mạng (với một số hỗ trợ cho việc truyền dữ liệu loại đó): Cytoscape và Gephi . Nếu bạn đang quan tâm đến một số khác, cụ thể hơn ( bản đồ hỗ trợ, vv) hoặc thương mại (tầng miễn phí cơ bản), các dự án và các sản phẩm, vui lòng xem này biên soạn tuyệt vời , mà tôi triệt để giám tuyển để đưa ra danh sách chính trên và phân tích : http://blog.profitbricks.com/39-data-visualization-tools-for-big-data .

Cuối cùng, như tôi đã hứa lúc đầu, Zoomdata - một sản phẩm thương mại, mà tôi nghĩ bạn có thể muốn xem qua: http://www.zoomdata.com . Lý do tôi loại trừ nó khỏi phần biên dịch phần mềm nguồn mở của tôi là do hỗ trợ tích hợp sẵn cho các nền tảng dữ liệu lớn . Cụ thể, Zoomdata cung cấp các trình kết nối dữ liệu cho Cloudera Impala, Amazon Redshift, MongoDB, Spark và Hadoop, cộng với các công cụ tìm kiếm, công cụ cơ sở dữ liệu chính và dữ liệu truyền phát.

Tuyên bố miễn trừ trách nhiệm: Tôi không có liên kết với Zoomdata nào - tôi chỉ bị ấn tượng bởi một loạt các tùy chọn kết nối của họ (có thể khiến bạn phải trả giá đắt, nhưng đó là một khía cạnh khác của phân tích chủ đề này).

— Alexanderr Blekh
nguồn

1

Cảm ơn rất nhiều Alexanderr Blekh & Nitesh vì sự sáng suốt của bạn. Tôi chắc chắn sẽ xem xét các tùy chọn này. Một điều tôi nên rõ ràng hơn là tôi đang thu thập dữ liệu trực tiếp từ micromet laser, lấy mẫu ở khoảng 60 mẫu mỗi giây. Ngay sau khi tôi hỏi câu hỏi này, tôi đã tìm thấy một phần mềm có tên KST ( kst-plot.kde.org ). Nó hoạt động độc đáo ngoại trừ việc nó không ổn định và đặc biệt không dễ dàng để lấy dữ liệu cũ hơn, phóng to / thu nhỏ, v.v.

— Clayton Pipkin

@ClaytonPipkin: Bạn rất hoan nghênh. Tôi rất vui lòng giúp đỡ. Đừng quên nâng cấp cả hai câu trả lời và chấp nhận điều tốt nhất, nếu hài lòng. KST có vẻ thú vị, nhưng hãy nhớ rằng đó là một ứng dụng, do đó, nó không có khả năng trực quan hóa dữ liệu cho Web.

— Aleksandr Blekh

@AleksandrBlekh Không ai bình chọn câu trả lời của tôi :( Nhưng câu trả lời của bạn rất thỏa mãn. Tôi sẽ bỏ phiếu cho nó!

— Nitesh

@Nitesh: Cảm ơn bạn vì những lời tốt đẹp và nâng cao tinh thần. Đừng lo lắng quá nhiều về câu trả lời cụ thể của bạn - nó không tệ, chỉ là giới hạn trong phạm vi. Tuy nhiên, tôi sẽ nâng cấp nội dung cho nó và để giúp bạn vui lên một chút :-).

— Alexanderr Blekh

1

Hình dung bộ dữ liệu lớn là một vấn đề lâu dài. Một trong những vấn đề là để hiểu làm thế nào chúng ta có thể hiển thị hơn một triệu điểm trên màn hình chỉ có khoảng ~ triệu pixel.

Phải nói rằng, đây là một vài công cụ có thể xử lý dữ liệu lớn:

Tableau: bạn có thể sử dụng công cụ máy tính để bàn miễn phí của họ.
Tabplot: được xây dựng trên đỉnh ggplot2 trong R để xử lý các bộ dữ liệu lớn hơn.
Xem đánh giá này cho 5 sản phẩm khác có thể giúp bạn thực hiện công việc của bạn.

— Nitesh
nguồn

0

Nếu bạn đang sử dụng python, tôi khuyên bạn nên sử dụng mpld3 kết hợp trực quan hóa javascript của D3js với matplotlib của python.

Việc cài đặt và sử dụng thực sự đơn giản và nó có một số plugin và nội dung tương tác thú vị.

http://mpld3.github.io/

— Ram
nguồn