Nên diện tích hoặc chiều dài của hình vuông tỷ lệ thuận với dữ liệu đang được trực quan hóa?


16

Tôi đang thực hiện một trực quan hóa dữ liệu. Mỗi mốc được đại diện bởi một hình vuông. Để làm cho dữ liệu cơ bản trực quan rõ ràng, độ dài của mỗi cạnh của hình vuông hoặc diện tích của mỗi hình vuông sẽ tỷ lệ thuận với mốc đo lường mà nó đại diện?


1
Chưa. Nó có rộng không? Tôi đã hy vọng rằng câu trả lời là chắc chắn (tôi cho rằng đó là "khu vực") nhưng dân gian ở đây sẽ có nhiều thiết kế đồ họa và kiến ​​thức tâm lý học nhận thức để sao lưu điều đó.
dumbledad

1
IIRC này đã được trình bày trong một cuốn sách tiếng Đức mà tôi đã đọc một lần, "Vì vậy, người đàn ông của Statistik" của en.wikipedia.org/wiki/Walter_Krämer - không chắc có tương đương với tiếng Anh không. TL; DR - phụ thuộc vào những gì bạn muốn người đọc của bạn đọc từ trực quan hóa.
Michael Schumacher

Câu trả lời chắc chắn là không xác định. Tất cả phụ thuộc vào chi tiết cụ thể - cụ thể là dữ liệu bạn đang trình bày, cách bạn trình bày và những gì bạn muốn giao tiếp với dữ liệu đã nói.
DA01

Bạn có thể đưa ra ví dụ về các chi tiết cụ thể hoặc những gì chúng tôi muốn người đọc đọc từ trực quan hóa sẽ dẫn chúng tôi chọn làm cho độ dài của cạnh của một hình vuông tỷ lệ với mốc chuẩn thay vì diện tích của hình vuông không?
dumbledad

5
+1 Tại sao mọi câu hỏi thú vị thu hút ít nhất một phiếu bầu gần?!? <grump>
user56reinstatemonica8

Câu trả lời:


10

Nếu bạn, người sáng tạo, không chắc chắn, làm thế nào người đọc sẽ biết đó là gì?

Câu trả lời ngắn: giá trị nên được liên kết 1: 1 với lượng màu trên trang . Vì vậy, trong ví dụ của bạn, nó phải là khu vực. Nhưng còn hơn thế nữa: bạn cũng cần tránh các tín hiệu sai lệch có thể khiến người đọc đọc không chính xác và bạn cần biết lý do tại sao bạn sử dụng diện tích thay vì chiều dài (ví dụ: biểu đồ thanh), bởi vì nó có ưu và nhược điểm thực sự.


Đầu tiên, không bao giờ có cả chiều dài và chiều rộng (tức là diện tích) của một hình dạng thay đổi khi thực sự biến chỉ được liên kết với chiều dài của một bên. Nếu X gấp đôi Y nhưng Y có màu gấp bốn lần trên trang, thì bạn đã đánh lừa độc giả của mình. Loại biến dạng này đôi khi được gọi là " yếu tố dối trá " và thường được coi là một nỗ lực cố ý để đánh lừa và phóng đại sự khác biệt.

nhập mô tả hình ảnh ở đây


Nếu bạn sử dụng diện tích làm thước đo, tôi thực sự khuyên bạn nên:

  • Biết lý do tại sao bạn đang sử dụng khu vực . Bằng cách sử dụng diện tích thay vì kích thước tuyến tính như chiều dài, bạn:

    • Hy sinh khả năng nhìn rõ sự khác biệt về mặt toán học (bạn không thể dễ dàng nói "nhìn này, gấp đôi cái kia")
    • Mời độc giả của bạn xem nó theo cách không trực quan hàng ngày theo cách mà mọi người, ví dụ, so sánh kích thước của những chiếc bánh trong một cửa hàng. Ít tinh vi hơn, nhưng ngay lập tức hơn. Ruột nhiều, ít đầu.
    • Sự khác biệt nhỏ giữa những con số rất giống nhau trở nên gần như vô hình.
    • Khi một biến nhỏ hơn nhiều lần so với biến khác, biến rất nhỏ sẽ không biến mất nhiều như trong biểu đồ thanh, điều này có thể cho phép linh hoạt hơn trong bố cục.

nhập mô tả hình ảnh ở đây

  • Xem xét sử dụng các vòng tròn cho khu vực, không phải hình vuông, căn giữa :

    • Vòng kết nối vì nó không mời sự nhầm lẫn với biểu đồ thanh và tương tự. Chiều cao và chiều rộng ít hơn so với trước: có vẻ như bạn đang mời một so sánh dựa trên chiều cao hoặc chiều rộng.
    • Căn giữa vì không mời mọi người so sánh độ cao

nhập mô tả hình ảnh ở đây

Ví dụ, ở trên, thật khó để thấy hình vuông có nhãn "5" là ba phần tư chiều cao của hình vuông có nhãn "10", vì vậy nó có khả năng gây hiểu nhầm.

Các vòng tròn không mời loại so sánh này: đó là một mức độ ruột, ngay lập tức "Blob đó là khá lớn hơn nhiều so với blob tiếp theo".


Có nhiều bằng chứng từ thử nghiệm người dùng đến các nghiên cứu quy mô nhỏ (sẽ cố gắng tìm ra một số ví dụ sau) rằng loại so sánh dựa trên khu vực trực quan này có thể hấp dẫn hơn, có thể hạ thấp rào cản tiếp cận đối tượng ít tham gia hơn và có thể giúp giữ cho người đọc tập trung vào vấn đề hơn là những chi tiết vụn vặt của những con số. Nhưng điều này phải trả giá khi có được cách phân tích có đầu óc hơn.

Không chọn giữa một chiều (chiều dài hoặc khoảng cách) và hai chiều (khu vực) vì lý do thẩm mỹ: chọn giữa chúng dựa trên đối tượng và thông điệp của bạn.

Cái nào phù hợp hơn cho việc giao tiếp: so sánh mức độ tức thời ở mức độ "lớn hơn nhiều" hoặc được coi là so sánh bằng số ở cấp độ "khoảng 80% so với mức khác"?

Hoặc có những lý do thực tế tại sao bạn cần sử dụng diện tích?

Sau đó, khi bạn đã chọn vì lý do thực tế , áp dụng thẩm mỹ.


'Tỷ lệ thuận với lượng màu trên trang' là một quy tắc rất hữu ích (ít nhất là ở dạng 2D); cảm ơn vì điều đó tôi sẽ sử dụng nó Thiết kế mà tôi chuyển đến dựa trên các vòng tròn, tôi nghĩ bạn đang ở đó
dumbledad

5

Tôi muốn nói khu vực. Về mặt quang học, một hình vuông có cạnh dài gấp hai lần cho thấy diện tích lớn gấp 4 lần. Những người quan sát thông thường sẽ liên quan đến khu vực, thậm chí không cần đọc truyền thuyết của bạn.

Một ví dụ điển hình là biểu đồ huyền thoại này của Randall Munroe của xkcd :

nhập mô tả hình ảnh ở đây ( phiên bản lớn, dễ đọc )


4

Chúng tôi không giỏi trong việc đánh giá sự khác biệt trong khu vực như chiều dài của chúng tôi. Chúng tôi sử dụng chiều dài như một proxy và do đó có xu hướng đánh giá thấp sự khác biệt trong các lĩnh vực.

Vì lý do này, một vòng tròn thực sự có diện tích gấp đôi diện tích của một vùng khác xuất hiện quá nhỏ vì não của chúng ta có liên quan đến bán kính của chúng, khác nhau bởi hệ số 1,4 lần.

Có những nỗ lực thú vị trong việc điều hòa hiện tượng này, chẳng hạn như Ánh xạ biểu tượng theo tỷ lệ trong R , trong đó đề xuất tỷ lệ nhận thức của các biểu tượng để phù hợp chặt chẽ hơn với cách chúng ta đánh giá độ dài và khu vực.

Đây là hình 2 từ bài báo này

nhập mô tả hình ảnh ở đây

Cá nhân tôi không có bất kỳ kinh nghiệm nào với việc này và tránh sử dụng các khu vực nếu cần phải có phán đoán định lượng.

Một tiếp tuyến thú vị là mối quan hệ giữa nhận thức về khối lượng và chiều dài. Sự khác biệt trong cách chúng ta nhìn nhận những điều này thậm chí còn ấn tượng hơn. Điều này có thể được minh họa trong video so sánh kích thước sao này .

Vào thời điểm bạn nhận được để ngôi sao lớn nhất, đó là khoảng 1,700x đường kính của mặt trời, bạn là trái với ấn tượng rằng nó là nhiều lớn hơn 1,700x.

Để có cái nhìn hệ thống hơn về lỗi của chúng tôi trong việc nhận ra sự khác biệt về diện tích và độ dài, hãy xem Crowdsource Nhận thức đồ họa: Sử dụng Turk cơ học để đánh giá thiết kế trực quan của Jeffrey Heer và Michael Bostock.


4

Theo tôi khu vực (D), không phải mỗi bên (E).

Nếu bạn đang sử dụng một cạnh có chiều dài 2, thì diện tích sẽ gấp 4 lần giá trị và bạn sẽ có một biểu đồ rất chồng chéo. (E)

Khi bạn có một biểu đồ thanh bình thường (A), dữ liệu là tuyến tính và với thanh của chỉ dành cho thẩm mỹ. (B)

Trong những trường hợp đó, khu vực một lần nữa là đại diện của dữ liệu vì với các thanh là như nhau. Bạn có thể có một thanh 3D và âm lượng của thanh là thanh đại diện cho dữ liệu (C)

Đồ thị minh họa kích thước khác biệt nhận thức và chồng chéo


4 lần? Nó không phải là sự khác biệt giữa tuyến tính và bình phương?
dumbledad

Hãy để tôi ilustrate và chỉnh sửa bài viết.
Rafael

Giả sử mốc thời gian là 81. Nếu chúng ta sử dụng diện tích thì các cạnh có chiều dài 9 cho diện tích là 81. Nếu chúng ta làm các cạnh thì chúng có chiều dài 81 và diện tích là 6.561. 81 không phải là 4 lần 9 và 6.561 không phải là 4 lần 81. Bạn lấy 4 từ đâu?
dumbledad

"Nếu bạn đang sử dụng một cạnh có độ dài 2, thì diện tích sẽ gấp 4 lần giá trị" Tôi không thể nói bạn đang cố nói gì ở đó. Tôi nghĩ bạn có nghĩa là, nếu bạn đang sử dụng độ dài của cạnh để biểu thị độ lớn của dữ liệu, nhân đôi giá trị dữ liệu sẽ nhân diện tích lên gấp bốn lần.
David Richerby

David - đó là bản chỉnh sửa của tôi! Bài viết gốc của Rafael cho biết "nếu bạn đang sử dụng một bên, diện tích sẽ gấp 4 lần giá trị". Nếu bạn biết một cách tốt hơn để làm rõ điều đó xin vui lòng làm.
dumbledad

1

Tufte xử lý rộng rãi này. Xem:

  • Hiển thị trực quan thông tin định lượng,
  • Thông tin hình dung và những người khác.

Một số nguyên tắc về tính toàn vẹn đồ họa:

  1. Biểu diễn các số, như được đo vật lý trên bề mặt của biểu đồ, phải tỷ lệ thuận với các đại lượng số được biểu thị
  2. Ghi nhãn rõ ràng, chi tiết và kỹ lưỡng nên được sử dụng để đánh bại sự biến dạng và mơ hồ đồ họa. Viết ra các giải thích về dữ liệu trên chính biểu đồ. Dán nhãn các sự kiện quan trọng trong dữ liệu.
  3. Hiển thị biến thể dữ liệu, không phải biến thể thiết kế.
  4. Trong các chuỗi thời gian hiển thị tiền, các đơn vị đo lường tiền tệ xì hơi và tiêu chuẩn hóa gần như luôn luôn tốt hơn các đơn vị danh nghĩa.
  5. Số lượng kích thước mang thông tin (biến) được mô tả không được vượt quá số lượng kích thước trong dữ liệu. Đồ họa không được trích dẫn dữ liệu ra khỏi bối cảnh.

Trong trường hợp của bạn, bạn phải tự hỏi liệu dữ liệu được thể hiện tốt hơn bằng hình ảnh 2D hoặc 3D hoặc một dòng. Một hình khối, hình vuông và một đường thẳng không giống nhau. Đó là một trong những lý do tại sao biểu đồ thanh 3D thường gây hiểu nhầm.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.