Tài nguyên trực tuyến tốt với các mẹo về liên kết biểu đồ giữa hai biến số trong các điều kiện khác nhau


22

Bối cảnh:

Trong thời gian đó, tôi đã có được một tập hợp các heuristic về cách vẽ đồ thị hiệu quả sự liên kết giữa hai biến số. Tôi tưởng tượng hầu hết những người làm việc với dữ liệu sẽ có một bộ quy tắc tương tự.

Ví dụ về các quy tắc như vậy có thể là:

  • Nếu một trong các biến bị lệch dương, hãy xem xét vẽ đồ thị trục đó theo thang đo log.
  • Nếu có nhiều điểm dữ liệu (ví dụ: n> 1000), hãy áp dụng một chiến lược khác, chẳng hạn như sử dụng một số hình thức minh bạch một phần hoặc lấy mẫu dữ liệu;
  • Nếu một trong các biến có số lượng danh mục riêng biệt hạn chế, hãy xem xét sử dụng biểu đồ jitter hoặc hoa hướng dương;
  • Nếu có ba hoặc nhiều biến, hãy xem xét sử dụng ma trận phân tán;
  • Phù hợp một số hình thức của đường xu hướng thường hữu ích;
  • Điều chỉnh kích thước của ký tự vẽ theo kích thước mẫu (đối với n lớn hơn, sử dụng ký tự vẽ nhỏ hơn);
  • vân vân

Câu hỏi:

Tôi muốn có thể giới thiệu sinh viên đến một trang web hoặc trang web giải thích những điều này và các thủ thuật khác để vẽ đồ thị hiệu quả giữa hai biến số, có thể bằng các ví dụ.

  • Có bất kỳ trang hoặc trang web nào trên internet làm tốt công việc này không?

2
Nếu bạn có thể tìm thấy nó, hướng dẫn "Đồ họa" được in kèm theo các bản sao cũ của Systat (tiền Windows, tin hay không) sẽ là một tài nguyên tuyệt vời. Nó không chỉ minh họa tất cả các quy tắc này (như tôi nhớ lại), nó còn đầy những lời khuyên sâu sắc và tuyệt vời.
whuber

2
@whuber, một nhận xét tuyệt vời. Leland Wilkinson, tác giả chính của Systat, đồng thời cũng là tác giả của The Grammar of Graphics (là một cuốn sách khoa học máy tính hơn là một cuốn sách thống kê), có hương vị rất tốt để hiển thị dữ liệu đồ họa. Bài thuyết trình của ông luôn rất hiệu quả trong việc truyền tải thông điệp của họ.
StasK

@Jeromy, bạn có thể đã biết gói ggplot2 cho R, nhưng bây giờ The Grammar of Graphics đã được đề cập, tôi nghĩ cũng nên đề cập đến nó. Tôi thấy gói, cuốn sách và hướng dẫn tham khảo trực tuyến của Hadley Wickham rất hữu ích để biến các biến số thành các ô và đồ họa hữu ích.
NRH

1
@Jeromy tại sao không viết lại câu hỏi (riêng) như một wiki cộng đồng, yêu cầu một bài đăng cho mỗi quy tắc? Bằng cách đó, thay vì một tập hợp các liên kết, chúng ta có thể có một bộ quy tắc có thể bỏ phiếu và tạo tài nguyên ở đây.
David LeBauer

@David Được rồi, tôi đã thêm một câu hỏi wiki cộng đồng chung về các tài nguyên tốt nhất để thiết kế các số liệu thống kê.stackexchange.com/questions/16631/ trên
Jeromy Anglim

Câu trả lời:


13

Tôi không thể nghĩ ra các nguồn tài nguyên trực tuyến tuyệt vời ngoài đầu, nhưng một chương sách hay (và dễ tải xuống) thuật lại cách khám phá trực quan một dữ liệu lớn, đa chiều được đặt theo cách chu đáo là Brendan O'Connor và Lukas Biewald chương (cảnh báo: liên kết trực tiếp đến PDF) từ Dữ liệu đẹp . Chương này đặc biệt hữu ích như một tài nguyên giảng dạy vì nó kết hợp mã R vào tường thuật.

Ngoài ra, khi xem xét thêm, tôi nghĩ rằng "Một số hiển thị đồ họa và ngữ nghĩa" kinh điển của John Tukey (được đăng một cách thuận tiện trên trang web của Edward Tufte) là một giới thiệu thực sự tuyệt vời, mặc dù hơi bình dị, để hình dung.

Vì một số lý do, tôi dường như đang nghĩ về các chương sách ...


+1 Ít nhất các chương này có sẵn trên Web: Tôi nghĩ rằng đủ điều kiện. Cảm ơn, Aaron.
whuber

@ whuber cảm ơn vì đã đăng tiền thưởng; và @ashaw cả hai liên kết làm cho việc đọc thú vị.
Jeromy Anglim

Tôi nhận thấy rằng bài báo Tukey là tiền thân của phương pháp điều trị mở rộng được tìm thấy trong cuốn sách EDA của ông (1977) (ngoại trừ phần cuối cùng về treo biểu đồ gốc và biểu đồ).
whuber

11

Tài liệu tham khảo gần đây:

Tài nguyên cũ hơn nhưng có liên quan


3
+1 Các quy tắc và hướng dẫn có vẻ hữu ích, toàn diện - và cấm! Làm thế nào có thể viết về đồ họa mà không cung cấp một minh họa duy nhất ? :-)
whuber

1
Sự lựa chọn là khó khăn, nhưng tôi đã trao tiền thưởng cho câu trả lời này bởi vì tổng thể nó giải quyết tốt nhất câu hỏi khi được hỏi. Tài liệu của Liên Hợp Quốc dường như đặc biệt hữu ích và dễ tiếp cận đối với sinh viên, với ngôn ngữ đơn giản và nhiều ví dụ rõ ràng.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.