Có một lời chào, thế giới về đồ họa thống kê?


25

Trong lập trình máy tính, có một chương trình đầu tiên cổ điển để học / dạy một ngôn ngữ hoặc hệ thống mới, được gọi là "xin chào, thế giới". http://en.wikipedia.org/wiki/Hello_world_program

Có một trực quan hóa dữ liệu đầu tiên cổ điển để sử dụng một gói đồ thị? Nếu vậy, nó là cái gì? Và nếu không, ứng cử viên tốt sẽ là gì?


3
Chào mừng đến với trang web của chúng tôi! Faq của chúng tôi yêu cầu rằng "Bạn chỉ nên hỏi những câu hỏi thực tế, có thể trả lời dựa trên những vấn đề thực tế mà bạn gặp phải." Bạn có thể giải thích vấn đề thực sự của bạn là gì?
whuber

3
Tôi muốn xác định "mục kiểm tra tiêu chuẩn" cho đồ họa thống kê, nếu có, để đưa vào tài liệu đào tạo tôi đang phát triển.
Abraham D Flaxman

2
Bởi vì các ứng dụng đồ họa rất khác nhau, nên khó có thể hình dung ra một số đồ họa tiêu chuẩn hoặc phổ quát. Có được một số tiêu chuẩn cho một số loại gói vẽ đồ thị, chẳng hạn như thỏ nổi tiếng trong lịch sử và Ấm cho đồ họa 3D. Để câu hỏi của bạn có thể trả lời được, sau đó, nó sẽ giúp cho câu hỏi cụ thể hơn về gói (tài liệu) đào tạo của bạn sẽ được bao gồm.
whuber

1
Điểm tốt, cảm ơn. Tôi sẽ bao gồm ít nhất một cái gì đó về đồ họa thống kê trong R, STATA, Python và Javascript.
Abraham D Flaxman

@AbrahamDFlaxman Tôi tò mò về "tài liệu đào tạo" này và ai và mục đích của nó là gì. Bạn có thể nói nhiều hơn không?
Peter Flom - Tái lập Monica

Câu trả lời:


9

Hai suy nghĩ:

A. Khi tôi cố gắng tìm hiểu bản chất của "Hello World", đó là điều tối thiểu phải được thực hiện bằng ngôn ngữ lập trình để tạo ra một chương trình hợp lệ in một dòng văn bản. Điều đó gợi ý cho tôi rằng "Hello World" của bạn phải là một tập dữ liệu đơn biến, điều cơ bản nhất bạn có thể cắm vào một chương trình thống kê hoặc đồ họa.

B. Tôi không biết về bất kỳ đồ thị "Hello World" nào. Gần nhất tôi có thể đến là các bộ dữ liệu điển hình được bao gồm trong các gói thống kê khác nhau, chẳng hạn như RP AirPas messenger. Trong R, một tuyên bố đồ thị Hello World sẽ là:

plot (AirPassengers)  # Base graphics, prints line graph

hoặc là

qplot (AirPassengers) # ggplot2, prints a bar chart

hoặc là

xyplot (AirPassengers) # lattice, which doesn't have a generic plot

Cá nhân, tôi nghĩ rằng biểu đồ đơn giản nhất là biểu đồ đường trong đó bạn có N mục trong Y và X nằm trong khoảng từ 1: N. Nhưng đó không phải là một tiêu chuẩn.


1
Sự đồng thuận từ điều này và các câu trả lời khác là hiện tại không có một "xin chào, thế giới" của đồ họa thống kê. Tôi nghĩ rằng đề xuất của bạn về một bộ dữ liệu đơn biến, với N mục trong Y và X nằm trong khoảng từ 1: N là hấp dẫn. Tương tự như "xin chào, thế giới", thật tuyệt khi có một chữ N nhỏ và Y đáng nhớ. Bạn nghĩ gì về N = 5 và Y = (3,1,4,1,5,9) (nghĩa là chữ số của pi)? Có lẽ đó là quá toán học.
Abraham D Flaxman

1
@AbrahamDFlaxman: Tôi không nghĩ nó là toán học, tôi nghĩ nó thật tuyệt. Đáng nhớ, ngắn và biểu đồ không chỉ là một đường thẳng hay bất cứ điều gì. Dữ liệu nổi tiếng và không bị ràng buộc với bất kỳ chương trình cụ thể nào và có thể được mở rộng tùy ý bởi bất kỳ ai muốn có nhiều điểm hơn. Tôi bỏ phiếu cho nó!
Wayne

24

Tôi có lẽ sẽ bắt đầu với các biểu đồ tán xạ và chứng minh bốn mối tương quan xấu xí .


2
+1. Nhưng bạn có thể muốn xem xét một cái gì đó tổng quát hơn một chút, chẳng hạn như một số hình thức cốt truyện. Rốt cuộc, ngay khi bạn có thể vẽ một đoạn đường, bạn có thể vẽ bất cứ thứ gì . Điều này lặp lại ý tưởng đằng sau "Xin chào, thế giới!": Một khi bạn có thể nhận được đầu ra có thể đọc được từ một chương trình, bạn biết bạn có thể giao tiếp với máy tính và phần còn lại chỉ là chi tiết :-). (Các chi tiết có thể khó . Khi học cách viết mã hội cho máy tính lớn IBM 360, cách đơn giản nhất để lấy đầu ra là lưu trữ nó trong RAM và tạo ra lỗi khi kết thúc thực thi, khiến hệ thống in kết xuất lõi thập lục phân !)
whuber

Tôi nghĩ rằng bộ tứ của Anscombe trong tổng số chứa quá nhiều để được sử dụng như "xin chào, thế giới" của đồ họa thống kê, nhưng Hình 1 từ bài báo của anh ấy có thể là một ứng cử viên tốt. Tuy nhiên, các câu trả lời khác đã tạo ra trường hợp cho một tập dữ liệu đơn biến, tuy nhiên, điều mà tôi đang nghiêng về.
Abraham D Flaxman

7

Biểu đồ của một mẫu của một biến ngẫu nhiên thường được phân phối.


Tôi thích giao diện này, nhưng có lẽ biểu đồ yêu cầu xử lý dữ liệu nhiều hơn so với phân tán và việc đưa ra các mẫu từ phân phối bình thường có thể gây mất tập trung.
Abraham D Flaxman

Tôi chỉ nhận thấy rằng đây là ví dụ đầu tiên từ trang web Matplotlib: matplotlib.org
Abraham D Flaxman

5

Tôi nghĩ câu trả lời là "không". Đó là, không có câu trả lời chung thỏa thuận cho câu hỏi của bạn.

@StasK chỉ vào biểu đồ phân tán.

Nhưng tôi sẽ xem xét những gì plottrong R: Nó phụ thuộc vào dữ liệu!

Bạn có thể lập luận rằng số liệu thống kê đơn biến đơn giản hơn số liệu thống kê bivariate. Vì vậy, ... có lẽ điều cơ bản nhất là biểu đồ; hoặc có lẽ là một âm mưu thanh; có thể là một âm mưu mật độ.

Nếu quan điểm của "Xin chào, Thế giới!" là để cho thấy rằng bạn có thể làm cho máy tính làm một cái gì đó sau đó tôi sẽ nói bất kỳ âm mưu nào sẽ làm.


1
Có lẽ sự vắng mặt của một mục kiểm tra tiêu chuẩn cho thấy rằng bạn là chính xác, và nó phù hợp hơn để sử dụng bất kỳ cốt truyện nào là đơn giản nhất trong hệ thống được thể hiện. Điều đó làm cho nó khó để so sánh, tuy nhiên.
Abraham D Flaxman

5

Không chắc chắn nếu nó chính xác đủ điều kiện là một thế giới xin chào, nhưng trong R cũng có các bản demo được tích hợp trong nhiều gói. ví dụ

library(graphics)
demo(graphics)

sẽ hướng dẫn người dùng thông qua một số đồ họa cơ bản có sẵn trong gói. Chỉ cần nhấp chuột qua từng hình ảnh để bước qua các hình minh họa đồ họa cơ bản. Chỉ với hai dòng, người dùng được đưa vào một số khả năng truyền cảm hứng của đồ họa R để thống kê.

Mã tương ứng để tạo đồ họa được hiển thị trong bảng điều khiển R.

nhập mô tả hình ảnh ở đây


2

Tôi muốn nói có hai chương trình loại "Hello World" để trực quan hóa dữ liệu:

In ("Hello World"): Một cái gì đó giống như biểu đồ của một biến được phân phối bình thường, hoặc có lẽ là một biểu đồ tán xạ X, Y đơn giản.

Đối với một cái gì đó phức tạp hơn một chút, như phần mà người ta thực hiện các nguyên tắc của Hello World và bắt đầu chơi với đầu vào của người dùng, thoát các ký tự và tương tự, tôi sẽ nói rằng nó sẽ được chơi xung quanh với bộ dữ liệu Iris.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.