Tôi đang thực hiện một trực quan hóa dữ liệu. Mỗi mốc được đại diện bởi một hình vuông. Để làm cho dữ liệu cơ bản trực quan rõ ràng, độ dài của mỗi cạnh của hình vuông hoặc diện tích của mỗi hình vuông sẽ tỷ lệ thuận với mốc đo lường mà nó đại diện?
Tôi đang thực hiện một trực quan hóa dữ liệu. Mỗi mốc được đại diện bởi một hình vuông. Để làm cho dữ liệu cơ bản trực quan rõ ràng, độ dài của mỗi cạnh của hình vuông hoặc diện tích của mỗi hình vuông sẽ tỷ lệ thuận với mốc đo lường mà nó đại diện?
Câu trả lời:
Nếu bạn, người sáng tạo, không chắc chắn, làm thế nào người đọc sẽ biết đó là gì?
Câu trả lời ngắn: giá trị nên được liên kết 1: 1 với lượng màu trên trang . Vì vậy, trong ví dụ của bạn, nó phải là khu vực. Nhưng còn hơn thế nữa: bạn cũng cần tránh các tín hiệu sai lệch có thể khiến người đọc đọc không chính xác và bạn cần biết lý do tại sao bạn sử dụng diện tích thay vì chiều dài (ví dụ: biểu đồ thanh), bởi vì nó có ưu và nhược điểm thực sự.
Đầu tiên, không bao giờ có cả chiều dài và chiều rộng (tức là diện tích) của một hình dạng thay đổi khi thực sự biến chỉ được liên kết với chiều dài của một bên. Nếu X gấp đôi Y nhưng Y có màu gấp bốn lần trên trang, thì bạn đã đánh lừa độc giả của mình. Loại biến dạng này đôi khi được gọi là " yếu tố dối trá " và thường được coi là một nỗ lực cố ý để đánh lừa và phóng đại sự khác biệt.
Nếu bạn sử dụng diện tích làm thước đo, tôi thực sự khuyên bạn nên:
Biết lý do tại sao bạn đang sử dụng khu vực . Bằng cách sử dụng diện tích thay vì kích thước tuyến tính như chiều dài, bạn:
Xem xét sử dụng các vòng tròn cho khu vực, không phải hình vuông, căn giữa :
Ví dụ, ở trên, thật khó để thấy hình vuông có nhãn "5" là ba phần tư chiều cao của hình vuông có nhãn "10", vì vậy nó có khả năng gây hiểu nhầm.
Các vòng tròn không mời loại so sánh này: đó là một mức độ ruột, ngay lập tức "Blob đó là khá lớn hơn nhiều so với blob tiếp theo".
Có nhiều bằng chứng từ thử nghiệm người dùng đến các nghiên cứu quy mô nhỏ (sẽ cố gắng tìm ra một số ví dụ sau) rằng loại so sánh dựa trên khu vực trực quan này có thể hấp dẫn hơn, có thể hạ thấp rào cản tiếp cận đối tượng ít tham gia hơn và có thể giúp giữ cho người đọc tập trung vào vấn đề hơn là những chi tiết vụn vặt của những con số. Nhưng điều này phải trả giá khi có được cách phân tích có đầu óc hơn.
Không chọn giữa một chiều (chiều dài hoặc khoảng cách) và hai chiều (khu vực) vì lý do thẩm mỹ: chọn giữa chúng dựa trên đối tượng và thông điệp của bạn.
Cái nào phù hợp hơn cho việc giao tiếp: so sánh mức độ tức thời ở mức độ "lớn hơn nhiều" hoặc được coi là so sánh bằng số ở cấp độ "khoảng 80% so với mức khác"?
Hoặc có những lý do thực tế tại sao bạn cần sử dụng diện tích?
Sau đó, khi bạn đã chọn vì lý do thực tế , áp dụng thẩm mỹ.
Tôi muốn nói khu vực. Về mặt quang học, một hình vuông có cạnh dài gấp hai lần cho thấy diện tích lớn gấp 4 lần. Những người quan sát thông thường sẽ liên quan đến khu vực, thậm chí không cần đọc truyền thuyết của bạn.
Một ví dụ điển hình là biểu đồ huyền thoại này của Randall Munroe của xkcd :
Chúng tôi không giỏi trong việc đánh giá sự khác biệt trong khu vực như chiều dài của chúng tôi. Chúng tôi sử dụng chiều dài như một proxy và do đó có xu hướng đánh giá thấp sự khác biệt trong các lĩnh vực.
Vì lý do này, một vòng tròn thực sự có diện tích gấp đôi diện tích của một vùng khác xuất hiện quá nhỏ vì não của chúng ta có liên quan đến bán kính của chúng, khác nhau bởi hệ số 1,4 lần.
Có những nỗ lực thú vị trong việc điều hòa hiện tượng này, chẳng hạn như Ánh xạ biểu tượng theo tỷ lệ trong R , trong đó đề xuất tỷ lệ nhận thức của các biểu tượng để phù hợp chặt chẽ hơn với cách chúng ta đánh giá độ dài và khu vực.
Đây là hình 2 từ bài báo này
Cá nhân tôi không có bất kỳ kinh nghiệm nào với việc này và tránh sử dụng các khu vực nếu cần phải có phán đoán định lượng.
Một tiếp tuyến thú vị là mối quan hệ giữa nhận thức về khối lượng và chiều dài. Sự khác biệt trong cách chúng ta nhìn nhận những điều này thậm chí còn ấn tượng hơn. Điều này có thể được minh họa trong video so sánh kích thước sao này .
Vào thời điểm bạn nhận được để ngôi sao lớn nhất, đó là khoảng 1,700x đường kính của mặt trời, bạn là trái với ấn tượng rằng nó là nhiều lớn hơn 1,700x.
Để có cái nhìn hệ thống hơn về lỗi của chúng tôi trong việc nhận ra sự khác biệt về diện tích và độ dài, hãy xem Crowdsource Nhận thức đồ họa: Sử dụng Turk cơ học để đánh giá thiết kế trực quan của Jeffrey Heer và Michael Bostock.
Theo tôi khu vực (D), không phải mỗi bên (E).
Nếu bạn đang sử dụng một cạnh có chiều dài 2, thì diện tích sẽ gấp 4 lần giá trị và bạn sẽ có một biểu đồ rất chồng chéo. (E)
Khi bạn có một biểu đồ thanh bình thường (A), dữ liệu là tuyến tính và với thanh của chỉ dành cho thẩm mỹ. (B)
Trong những trường hợp đó, khu vực một lần nữa là đại diện của dữ liệu vì với các thanh là như nhau. Bạn có thể có một thanh 3D và âm lượng của thanh là thanh đại diện cho dữ liệu (C)
Tufte xử lý rộng rãi này. Xem:
Một số nguyên tắc về tính toàn vẹn đồ họa:
- Biểu diễn các số, như được đo vật lý trên bề mặt của biểu đồ, phải tỷ lệ thuận với các đại lượng số được biểu thị
- Ghi nhãn rõ ràng, chi tiết và kỹ lưỡng nên được sử dụng để đánh bại sự biến dạng và mơ hồ đồ họa. Viết ra các giải thích về dữ liệu trên chính biểu đồ. Dán nhãn các sự kiện quan trọng trong dữ liệu.
- Hiển thị biến thể dữ liệu, không phải biến thể thiết kế.
- Trong các chuỗi thời gian hiển thị tiền, các đơn vị đo lường tiền tệ xì hơi và tiêu chuẩn hóa gần như luôn luôn tốt hơn các đơn vị danh nghĩa.
- Số lượng kích thước mang thông tin (biến) được mô tả không được vượt quá số lượng kích thước trong dữ liệu. Đồ họa không được trích dẫn dữ liệu ra khỏi bối cảnh.
Trong trường hợp của bạn, bạn phải tự hỏi liệu dữ liệu được thể hiện tốt hơn bằng hình ảnh 2D hoặc 3D hoặc một dòng. Một hình khối, hình vuông và một đường thẳng không giống nhau. Đó là một trong những lý do tại sao biểu đồ thanh 3D thường gây hiểu nhầm.