Những thuộc tính nào tạo nên một con số tinh tế chất lượng chuyên nghiệp?


35

Tôi đã nghe mọi người nói rằng các lô được sản xuất bởi ORIGIN có xu hướng trông bóng bẩy và "chuyên nghiệp", trong khi các lô do Mathicala sản xuất thì không. Tuy nhiên, hầu hết các chương trình tạo cốt truyện đều có cấu hình khá cao và lý do là với các cài đặt phù hợp cho những thứ như đánh dấu vị trí và ghi nhãn, lựa chọn phông chữ và màu sắc, căn chỉnh nhãn, v.v., tôi có thể tạo ra một hình với Mathicala / matplotlib / Gnuplot / v.v. có vẻ tốt như những người đến từ ORIGIN. Nhưng nó có nghĩa gì đối với một nhân vật "chuyên nghiệp" trong bối cảnh này?

Nói cách khác, nếu mục tiêu của tôi là tạo ra những số liệu đẹp nhất có thể để đưa vào một bài báo khoa học, những lựa chọn thiết kế nào thường được đề xuất cho mục tiêu đó? Rõ ràng người ta phải chọn loại biểu đồ thích hợp , ví dụ biểu đồ thanh so với biểu đồ phân tán và tỷ lệ tuyến tính so với logarit, nhưng đó là những lựa chọn mà chúng ta luôn nghĩ về bất kể chương trình âm mưu nào chúng ta đang sử dụng. Tôi quan tâm nhiều hơn đến những điều chúng ta thường không nghĩ tới, thường được đặt theo mặc định của một số chương trình âm mưu, nhưng có thể thay đổi để cải thiện giao diện của cốt truyện.


2
Điều này có thể lạc đề ở đây ... Tôi đang đăng nó để thăm dò ranh giới của những câu hỏi trực quan hóa dữ liệu được chấp nhận là gì (cf meta.scicomp.stackexchange.com/questions/55/ Lỗi )
David Z

5
Xem xét chất lượng kém của nhiều mảnh đất biến nó thành các ấn phẩm khoa học, có thể là định nghĩa của cộng đồng cần cải thiện!
David Ketcheson

2
@DavidZaslavsky - Tôi nghĩ rằng điều này có thể thực sự là nơi thích hợp nhất cho câu hỏi này vì nó cụ thể để trình bày dữ liệu khoa học, mà là một phần của khoa học tính toán. Tôi thường thấy các nhà khoa học phàn nàn rằng các biểu đồ được tạo ra bởi phần mềm của chúng tôi không theo 'tiêu chuẩn xuất bản' và phải được đưa lên, vì vậy thật tuyệt khi thấy những người khác trải nghiệm vấn đề này. Như mọi khi với câu hỏi chủ quan, câu trả lời nên tuân theo sáu nguyên tắc .
Đánh dấu gian hàng

Tất nhiên, @Mark. Tôi đã cố gắng làm cho điều này trở nên khách quan nhất có thể vì đó không phải là một câu hỏi kỹ thuật.
David Z

Cảm ơn David, bình luận của tôi nhắm nhiều hơn vào những câu trả lời, vì chúng tôi đang có xu hướng trả lời ngắn vào thời điểm đó. Sáu hướng dẫn thích dài hơn ngắn, kinh nghiệm về ý kiến, bối cảnh trên giả định, vô tư đối với định kiến, nghiêm túc trên flippant và đề nghị sao lưu câu trả lời với sự kiện và tài liệu tham khảo, vv Tất cả những điều này dường như là những điều tốt để phấn đấu trong câu trả lời cho loại này câu hỏi
Đánh dấu gian hàng

Câu trả lời:


14

IMO, những gì làm cho một con số "chất lượng chuyên nghiệp" được xác định bởi các quy tắc tạp chí / nhà xuất bản. Mà thực sự chuyển thành "chất lượng xuất bản" tương đối tùy thuộc vào nơi bạn xuất bản. Một số quy tắc phổ quát dường như nổi bật - bất biến của phần mềm vẽ đang được sử dụng:

1) Một hình nên chứa càng ít yếu tố cần thiết để truyền đạt thông tin / ý tưởng / đối số. Một con số nên dễ dàng đọc / hiểu trong vòng vài giây - nếu bạn mất nhiều thời gian hơn để hiểu những gì đang diễn ra trên hình, thì đó có thể là quá nhiều thông tin. Điều này đôi khi rất khó kiểm tra vì bạn đã quen thuộc với âm mưu / dữ liệu của riêng bạn - bất kể nó bị quá tải - hiển thị cho vài đồng nghiệp để xem họ có thể đọc nó dễ dàng không. (đừng nhầm lẫn với việc hiểu ý nghĩa vật lý đằng sau con số - việc này thường mất khá nhiều thời gian).

2) Nếu bạn phải sử dụng màu sắc, tốt nhất nên giới hạn bản thân ở một số ít, lý tưởng nhất là ở phía đối diện của bánh xe màu. Ví dụ: màu xanh và màu đỏ tốt hơn màu xanh và màu xanh lá cây. Một hình có thể có nhiều sắc thái - nhưng tốt nhất là có ít màu chính. Tôi thường thích sử dụng màu xanh lam (giá trị thấp) và màu đỏ (giá trị cao) với sự chuyển tiếp màu trắng ở giữa. Luôn luôn có trong tâm trí độc giả mù màu.

3) Đánh dấu đánh dấu, nhãn đường viền, v.v ... tất cả phải dễ đọc mà không cần kính lúp - vì vậy, kích thước phông chữ tương tự như văn bản thân tạp chí. Bạn có thể kiểm tra xem mọi thứ có thể đọc được hay không bằng cách in ra một bản cứng với chiều rộng hình 3 và 6 inch (đây là những kích thước hình phổ biến trong các tạp chí khoa học).

4) Cuối cùng, đảm bảo mọi yếu tố duy nhất của hình có mục đích của nó. Nếu có bất cứ điều gì không truyền đạt thông tin hữu ích - hãy vứt nó đi. Nó sẽ giúp dễ đọc của hình.

Tại thời điểm bạn cảm thấy thoải mái với việc tùy chỉnh tất cả các yếu tố nhỏ tạo thành hình - đánh dấu, nhãn, v.v., việc bạn sử dụng công cụ nào miễn là bạn có thể tạo ra một eps sạch sẽ không quan trọng.


Bạn có thể giải thích lý do cho (1) không? Một vài giây không phải là một thời gian dài. Đây có phải là lý do thực tế rằng mọi người thực sự, thực sự, bận rộn, để nếu mất hơn một vài giây để hiểu con số, họ sẽ không bận tâm?
Faheem Mitha

@FaheemMitha Không, điều tôi thực sự muốn nói là, bạn đang được độc giả ủng hộ nếu bạn giữ cho con số rõ ràng và đơn giản. Đừng giữ vài giây như một tiêu chí vững chắc - đây chỉ là cách tôi được sử dụng để đánh giá số liệu của chính mình. Có giới hạn về số lượng thông tin bạn có thể đưa vào một con số - bằng cách đặt quá nhiều, cuối cùng bạn có thể khiến người đọc khó hiểu nội dung. Độc giả của bạn sẽ bận tâm đọc những con số thậm chí rất bận rộn nếu họ quan tâm đến công việc của bạn - nhưng một nhân vật ít bận rộn hơn sẽ làm tốt hơn việc truyền đạt thông tin.
milancurcic

Tôi không chắc chắn hoàn toàn có ý nghĩa khi chấp nhận một câu trả lời cho một câu hỏi mơ hồ như vậy, nhưng câu trả lời này dường như mã hóa tốt nhất những ý tưởng mơ hồ mà tôi có trong đầu khi tôi hỏi nó. Vì vậy, bạn nhận được dấu kiểm :-)
David Z

18

Có một vài yếu tố tôi tìm kiếm khi tôi xem xét một cái gì đó "chất lượng xuất bản" trong công việc của chính tôi hoặc những gì tôi đang xem xét khi nhìn vào người khác. Họ đang:

  1. Độ phân giải cao, và tốt nhất là dựa trên vector. Điều này bây giờ khá rõ ràng, nhưng bạn sẽ ngạc nhiên.
  2. Một sự bừa bộn. Tôi sẽ có thể thấy những gì đang xảy ra trong hình của bạn và nhìn thấy nó một cách nhanh chóng. Có vài điều tôi ghét hơn là ai đó cố gắng thực hiện hướng dẫn "High Ink: Paper ratio" và sử dụng nó để cố gắng nhồi nhét toàn bộ bản thảo trong một hình.
  3. In tốt. Đây là một trong những điều thực sự quan trọng nhất đối với tôi và khi tôi xem xét các bài báo, một bài tôi luôn kiểm tra. "Làm số liệu in?" Hơn một lần, tôi đã đạt được những con số có điểm hoàn toàn bị che khuất khi được in bằng thang độ xám, điều này làm cho chúng vô giá trị cho mục đích của tôi (tôi không đọc trên màn hình).
  4. Bằng chứng là người sáng tạo biết cách sử dụng các cài đặt đồ họa. Không có lựa chọn trục bóng lẻ, đánh dấu vào đúng chỗ, v.v.
  5. Kết hợp với # 2, thiếu "hưng thịnh" hoàn toàn là đồ họa trong tự nhiên. Shadows, 3-D không cần thiết, vv mà thực sự không làm gì ngoài việc lãng phí thời gian của độc giả.

Hầu hết trong số đó là trung thực của người sáng tạo, chứ không phải là chương trình cụ thể. Tôi đã thấy các lô khủng khiếp được thực hiện trong R và các lô tuyệt vời được thực hiện trong Excel.


Đồ họa vector thực sự là mong muốn. Nhưng có chương trình vẽ nào được sử dụng rộng rãi không?
Faheem Mitha

2
Vẽ chương trình? Không phải là tôi có thể nghĩ ra. Các chương trình sản xuất lô - gói thống kê và tương tự? Nhiều người trong số họ có định dạng đầu ra không phải là vector có sẵn hoặc là mặc định của họ.
Fomite

14

Nếu chúng ta đang nói về các số liệu dữ liệu, tôi sẽ đi đến các nguồn: Màn hình hiển thị thông tin định tínhbằng chứng đẹp của Edward Tufte .

Ông Tufte tất nhiên đi sâu vào một số chi tiết, nhưng nguyên tắc nổi bật đối với tôi không phải là tốn mực vào khung và trang trí, mà thay vào đó là làm cho càng nhiều mực càng tốt mang thông tin.

Sửa đổi theo yêu cầu của Mark:

Một số điểm chính từ Hiển thị trực quan của thông tin định tính

  • hiển thị dữ liệu theo cách không làm biến dạng hoặc làm xáo trộn những gì nó nói
  • sắp xếp màn hình để cho phép so sánh giữa các dữ liệu khác nhau ở các cấp độ khác nhau
  • tích hợp các khía cạnh đồ họa với các mô tả thống kê và bằng lời nói
  • tối đa hóa dữ liệu theo tỷ lệ mực bằng cách loại bỏ các yếu tố không phục vụ cho bất kỳ mục đích nào (hoặc được làm thừa bởi các yếu tố khác) và sử dụng các yếu tố có để truyền đạt thông tin bổ sung (ví dụ: các trục là biến thể trên boxplot)
  • bội số nhỏ có thể được sử dụng để sắp xếp các tập dữ liệu chiều cao hơn để cho phép so sánh dọc theo các kích thước bổ sung này

Bằng chứng đẹp là một cuốn sách khác nhau trong phạm vi của nó. Tôi sẽ chỉ sao chép tiêu đề chương:

  • Ảnh đã ánh xạ: Hình ảnh là bằng chứng và giải thích
  • Sparklines: Đồ họa có kích thước lớn, đơn giản, có kích thước từ
  • Liên kết và mũi tên nhân quả: Sự mơ hồ trong hành động
  • Từ, số, hình ảnh - Cùng nhau
  • Các nguyên tắc cơ bản của thiết kế phân tích
  • Tham nhũng trong các bản trình bày bằng chứng: Hiệu ứng không có nguyên nhân, hái anh đào, phản ứng thái quá, biểu đồ và cơn thịnh nộ để kết luận
  • Phong cách nhận thức của PowerPoint: Xuất hiện những lỗi tham nhũng
  • Bàn đạp điêu khắc: Ý nghĩa, thực hành, giảm thiểu
  • Điêu khắc phong cảnh

Một trong những quan sát thú vị trong Bằng chứng đẹp là chúng ta thường sử dụng các thiết bị đầu ra mật độ cao (máy in 300 DPI ngày nay là thiết bị có mật độ thấp) cho vật liệu in, nhưng thường vẽ các số liệu của chúng tôi cho máy in màn hình hoặc đường truyền, gây lãng phí tiềm năng to lớn để truyền đạt thông tin.


Trang 13 của Màn hình hiển thị thông tin định lượng bắt đầu bằng một gạch đầu dòng đẹp, tóm tắt về "đồ họa chuyên nghiệp", hoặc như nó có tiêu đề là "Đồ họa xuất sắc".
Brian Diggs

@Brian Diggs - Bạn hoặc dmckee có thể cập nhật câu trả lời này với một bản tóm tắt các điểm chính không? Nhiều người trong chúng ta có thể đủ quan tâm để biết tóm tắt mà không đủ quan tâm để thực sự đi ra ngoài và mua sách.
Đánh dấu gian hàng

@Mark: Tôi sẽ nhận được nó vào ngày hôm sau hoặc lâu hơn ... bản sao của tôi tại văn phòng và ngay bây giờ tôi không.
dmckee

8

Các số liệu tốt nhất mà tôi có thể thực hiện được với cá nhân là với gói TeF PGF / TikZ . Nếu bạn sử dụng LaTex, như nhiều người trong các ngành khoa học khó làm, có lẽ bạn đã nghe nói về nó.

Nó cũng có vẻ là người dẫn đầu trong các gói đồ họa LaTex. Một tỷ lệ đáng kể trên các câu hỏi trên trang web TeX StackExchange là về PGF / TikZ. Tôi không chắc tại sao kết quả lại tốt như vậy, nhưng chắc chắn một lợi thế của PGF / TikZ so với các gói khác khi sử dụng LaTeX là nó đơn giản tích hợp tốt hơn với văn bản. Đối với một điều, các phông chữ trong hình sẽ giống như trong văn bản.


Tất nhiên, thực sự đó cũng là cách yêu thích của tôi để tạo ra các số liệu ;-) Nhưng tôi quan tâm nhiều hơn đến lý do tại sao các lô TikZ được coi là tốt.
David Z

1
@DavidZaslavsky: Tôi không biết. Cho đến khi là một thiên tài? :-)
Faheem Mitha

@DavidZaslavsky: Nghiêm túc mà nói, câu hỏi đó là chủ đề của tex.sx, và có khả năng đã được giải quyết ở đó.
Faheem Mitha

1
@EpiGrad: Tôi chỉ có nghĩa là hỏi cụ thể về TikZ sẽ hữu ích hơn trên tex.sx, nếu David rất bận tâm. Tất nhiên câu hỏi rộng hơn sẽ không thuộc chủ đề cho tex.sx.
Faheem Mitha

1
pgfplots là khá tuyệt vời. Theo mặc định, nó trông khá giống với cách bạn muốn, ví dụ như hình hộp, hình vectơ, nhãn phù hợp với văn bản cơ thể, et. Nhưng nó cũng dễ điều chỉnh. Thủ thuật yêu thích của tôi là tước các trục của âm mưu giả màu Matlab, cắt xén nó, và sau đó quấn rìu xung quanh nó trong TikZ. Bằng cách đó, bạn có được hình ảnh raster cho màu giả (đây là một trong số ít trường hợp sử dụng đồ họa raster) và độ tốt của LaTeX cho trục và nhãn, và thậm chí là thanh màu. Đây là một trong những câu trả lời của tôi khi sử dụng pgfplots
qubyte

6

Hầu như dễ dàng hơn để mô tả những gì tạo thành một biểu đồ xấu hơn những gì làm cho một biểu đồ tốt.

Một số tính năng của đồ thị xấu:

  • Phông chữ và ký hiệu quá lớn hoặc nhỏ
  • Các đường quá mỏng hoặc dày cho các đường cong và các tính năng đồ thị khác
  • Quá nhiều biến khác nhau được hiển thị hoặc thay đổi cùng một lúc
  • Có các lựa chọn trục không phù hợp (log so với tuyến tính, phạm vi, v.v.)
  • Hiển thị xu hướng giữa các điểm dữ liệu với các đường cong rắn biểu thị tiến trình hoặc hành vi có thể không tồn tại
  • Không đưa ra dấu hiệu nào về mức độ không chắc chắn hoặc sai sót
  • Đồ thị có chú thích hoặc nhãn kém (bao gồm cả các đơn vị!)

Tuy nhiên, nhìn chung, trong khi hầu hết các gói phần mềm có khả năng tạo đồ họa tốt, hầu như không có chương trình nào tôi từng làm việc với mặc định ở trạng thái tạo ra đồ họa tốt. Chúng luôn yêu cầu điều chỉnh: kích thước phông chữ, hoặc phạm vi hiển thị, hoặc trục hoặc lựa chọn biểu tượng, v.v. Hiện tại, tôi thích sử dụng matplotlib; những người khác trong nhóm của tôi đã di cư đến SciDavis.


Không chắc chắn ý của bạn là gì khi "Không đưa ra dấu hiệu lỗi". bạn có thể làm rõ? Nếu không, danh sách tốt.
Faheem Mitha

Chỉnh sửa cho rõ ràng: "Không đưa ra dấu hiệu nào cho thấy mức độ không chắc chắn hoặc sai sót." Tuy nhiên, khi các lỗi quá nhỏ không được hiển thị, điều này có thể được chỉ ra trong chú thích.
aeismail

5

Tôi đã thành công hợp lý khi sử dụng gói MathSica LevelScheme . Mô hình thực thi của nó hơi khác so với lập trình Mathicala truyền thống, do đó có đường cong học tập liên quan đến việc sử dụng nó. Nhưng, nó có khả năng cung cấp khả năng kiểm soát tốt cho việc tạo cốt truyện vốn khó khăn trong Mathicala đơn giản. Ngoài ra, là một gói phụ, có một gói để tạo dấu tick tùy chỉnh.

(Khi phiên bản có hỗ trợ Mathicala v.8 xuất hiện, nó sẽ được đổi tên thành SciDraw.)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.