Định dạng biểu đồ: khi nào thì thích hợp để sử dụng điền dưới biểu đồ đường?

12

Đây là một câu hỏi trực quan hóa dữ liệu - tôi hy vọng không sao khi hỏi điều này ở đây.

Khi nào thì thích hợp để sử dụng điền vào biểu đồ đường cho một chuỗi thời gian, như biểu đồ bên dưới? (đang hiển thị thời gian ping trong một ngày)

Biểu đồ đường có điền bên dưới

Tôi đoán nó phổ biến hơn khi sử dụng một đường thẳng, không có phần điền bên dưới, nhưng liệu có thể sử dụng phần tô màu cho sự đa dạng thị giác không?

Tôi đặc biệt thích thú khi biết về bất kỳ nghiên cứu nhận thức nào về chủ đề này, hoặc bất kỳ hướng dẫn về phong cách nào.

data-visualization

— Richard
nguồn

1

Nếu 0slà giới hạn dưới tự nhiên và bạn hiển thị nó, thì tại sao không?

— ttnphns

1

Hỏi một cách khác - tại sao sử dụng điền nếu không cần thiết? Hãy tưởng tượng bạn muốn thêm một đường xu hướng khác và mọi thứ trở nên phức tạp không cần thiết. Tôi cũng sẽ tách (các) đơn vị và tỷ lệ của trục y.

— martin

11

Có một chút nghệ thuật để cân bằng các khía cạnh thẩm mỹ và thông tin của một đồ họa. Nhà tư vấn / tác giả trực quan nổi bật như Edward Tufte và Stephen Few chọn một phương pháp thẩm mỹ tối thiểu để tránh sự phân tâm khỏi các phần thông tin của biểu đồ. Tuy nhiên, đối với một số khán giả, một lượng nhỏ của sự hưng thịnh là hợp lý - ví dụ, xem ứng dụng báo chí trực quan hóa dữ liệu của Alberto Cairo.

Góc nghiên cứu về nhận thức là mọi yếu tố đồ họa truyền đạt một thông điệp, một số yếu tố mà chúng ta không nhận thức được vì vỏ não trực quan của chúng ta xử lý nó (" xử lý trước chú ý "). Các yếu tố bổ sung, thậm chí những yếu tố dư thừa, có thể dẫn đến xử lý thêm. Biểu đồ thích hợp phụ thuộc vào thông điệp cần truyền đạt và đối tượng.

Đối với câu hỏi cụ thể của bạn, một đường kết nối nhấn mạnh xu hướng (và biến thể từ xu hướng). Khu vực đầy nhấn mạnh độ lệch so với đường cơ sở. Biểu đồ thanh hoặc biểu đồ kim sẽ nhấn mạnh các sự kiện riêng biệt lệch khỏi đường cơ sở.

Bối cảnh của đồ họa cũng rất quan trọng. Nếu bạn có một lưới các biểu đồ được đóng gói chặt chẽ, phần điền sẽ giúp liên kết từng dòng với đường cơ sở của nó.

Cuối cùng, một xem xét khác để thêm các yếu tố đồ họa / florishes dư thừa là nó làm cho việc mở rộng biểu đồ với các yếu tố nhiều thông tin hơn trở nên khó khăn hơn. Chẳng hạn, bạn có thể muốn làm nổi bật các giá trị đặc biệt, che phủ các đường xu hướng hoặc các dải phủ khác, chẳng hạn như trong mô hình sau.

nhập mô tả hình ảnh ở đây

— xan
nguồn

1

Tôi đồng ý với điều này. Trừ khi đồ thị cần nhiều màu sắc vì nó là bìa trước của một tạp chí / cuốn sách (và những người tiếp thị muốn nó có màu), màu sắc nên được sử dụng để thông báo. Nếu biểu đồ trông "nhàm chán" thì thủ phạm là thực tế là thông tin cơ bản không thú vị chút nào hoặc không thú vị lắm ở định dạng biểu đồ đường. Trong những trường hợp như vậy, có lẽ nó sẽ hữu ích hơn trong biểu đồ hình tròn, âm mưu radar hoặc thứ gì khác.

— rocinante

1

Tôi đề nghị không sử dụng biểu đồ tròn. Khó nhận thấy sự khác biệt về chiều dài cung và diện tích hình nêm so với sự khác biệt về chiều cao. Nếu bạn không tin tôi, hãy so sánh biểu đồ hình tròn theo tỷ lệ 32:34:33 với cùng biểu đồ thanh. Cái nào dễ đọc hơn?

— Shadowtalker

2

Tôi đã nói một cách chung chung, không cụ thể cho biểu đồ trên. Mỗi loại biểu đồ có giá trị của nó. Một loại biểu đồ nhất định không phù hợp trong mọi tình huống.

— rocinante

4

Một vài điểm để xem xét:

Như đã đề cập trong một nhận xét, phần lấp đầy phần lớn không phù hợp nếu trục x không ở điểm y tự nhiên. Điều này có thể là do trục y được chia tỷ lệ để bắt đầu ở một số khác 0 hoặc do các đơn vị được sử dụng không có cách hiểu bằng 0 tự nhiên (ví dụ: Kelvin có số 0 tự nhiên, trong khi Celsius thì không.)

Thứ hai, một trường hợp khi một khoản lấp đầy đặc biệt hợp lệ là nếu bản thân dữ liệu có thể được coi là không đầy đủ. Ví dụ, biểu đồ đường cho chiều cao của ngọn núi có nghĩa là bị lấp đầy, màu tô tượng trưng cho trái đất, trong khi không lấp đầy đại diện cho không khí.

Một ví dụ liên quan có thể là dữ liệu đếm. Nếu chúng ta xếp chồng tất cả các cá nhân tại mỗi điểm x, chúng ta sẽ có được một biểu đồ thanh. Nếu nội suy giữa các thanh có ý nghĩa, chúng ta sẽ kết thúc với một biểu đồ đường với phần lấp đầy.

Hình ảnh này từ 'hiển thị trực quan thông tin định lượng' Có thể giải thích nó tốt hơn một chút. Nó cho thấy các đơn vị quân đội đã ở châu Âu trong cuộc chiến thứ hai (tôi nghĩ). Xếp chồng các đơn vị tại mỗi thời điểm sẽ cung cấp cho bạn một biểu đồ thanh thiếu. Vẽ một dòng trên đầu dữ liệu cung cấp cho bạn một biểu đồ dòng đầy.

— timcdlucas
nguồn

2

... Các đơn vị quân đội Hoa Kỳ đã ở Châu Âu trong Thế chiến thứ nhất (ngày 1917 và 1918 kể câu chuyện).

— Nick Cox

@nickCox Tất nhiên rồi. Không biết tại sao tôi không thấy điều đó.

— timcdlucas

4

Hai câu trả lời trước bao gồm những điểm quan trọng chính, nhưng có một vài điều vẫn nên được đề cập.

Đầu tiên, tôi nên nói rằng tôi không đồng ý với cách tiếp cận tối giản cực độ đối với đồ thị - rằng tất cả mực thừa phải đi. Mất tập trung, biến đổi không có ý nghĩa nên đi. Nhưng một khu vực vững chắc so với một dòng duy nhất có thể bắt mắt tốt hơn và giao tiếp nhanh hơn. Và như bạn nói, nó có thể thêm "sự đa dạng thị giác".

Tuy nhiên, như @xan chỉ ra, cái nhìn nhanh đó cũng diễn giải một khu vực khác với một dòng, theo cách tiềm thức một phần.

Biểu đồ khu vực ngụ ý tổng số lượng tích lũy khi bạn tiến hành dọc theo trục x. Nếu bạn so sánh hai biểu đồ và một biểu đồ có diện tích lớn hơn được điền vào, cái nhìn của bạn sẽ cho bạn biết rằng nó có tổng số lớn hơn bất kể giá trị bắt đầu và kết thúc.

Ngược lại, biểu đồ đường cho thấy giá trị thay đổi. Trọng tâm là sự thay đổi vị trí từ điểm này sang điểm tiếp theo, không phải trên tổng số tích lũy.

Vậy khi nào bạn nên sử dụng đồ thị diện tích?

khi các giá trị đại diện cho một đại lượng rõ ràng với một điểm 0 xác định được hiển thị trên biểu đồ;
khi giá trị đại diện cho một số tiền được thêm (hoặc loại bỏ) tại mỗi điểm, chẳng hạn như lượng mưa hàng ngày thông thường hoặc lãi / lỗ hàng tháng;
khi giá trị đại diện cho phân bố dân số, nghĩa là tổng diện tích dưới đường cong biểu thị tổng kích thước của mẫu, chẳng hạn như đường cong hình chuông của số học sinh với các lớp khác nhau (về cơ bản là biểu đồ được làm nhẵn).

Ý tưởng là, khi đọc biểu đồ, nếu bạn lấy hai điểm trên trục x, khu vực được hiển thị giữa chúng sẽ đại diện cho một lượng thực tế của một cái gì đó tích lũy trong phạm vi đó. Vì lý do này, nếu các giá trị của bạn bao gồm số tiền âm tôi khuyên bạn nên sử dụng các màu đối lập cho các vùng âm và dương để nhấn mạnh rằng chúng sẽ hủy trong tổng số.

Khi nào bạn không nên sử dụng đồ thị khu vực?

khi điểm 0 là tùy ý (như ở nhiệt độ không tuyệt đối, như @timcdlucas đã nói), không hợp lệ (như trong các phép đo có tỷ lệ của hai giá trị, như tỷ giá hối đoái) hoặc không hiển thị trên biểu đồ vì lý do không gian;
khi các giá trị được hiển thị theo chiều cao của đường đã biểu thị một số đo tích lũy, chẳng hạn như tổng lượng mưa đến ngày (cho tháng / năm) hoặc nợ / tiết kiệm;
khi các giá trị đại diện cho vị trí / giá trị của một thực thể thay đổi duy nhất thay vì tích lũy;
khi bạn muốn so sánh nhiều dòng trên cùng một biểu đồ (nếu bạn không thể nhìn thấy toàn bộ khu vực, bạn sẽ mất ý nghĩa - thay vào đó là so sánh các biểu đồ khu vực cạnh nhau).

Với những nguyên tắc đó, biểu đồ ping của bạn có thể được hiểu theo hai cách.

Một mặt, nếu bạn nghĩ tốc độ ping là một biến duy nhất thay đổi trong suốt cả ngày, thì một biểu đồ đường đơn giản sẽ phù hợp nhất.

Mặt khác, nếu bạn đang so sánh các mẫu tốc độ ping hàng ngày của hai mạng khác nhau (hoặc cùng một mạng vào các ngày / thời gian khác nhau), thì có lẽ bạn muốn nhấn mạnh tổng thời gian cần thiết cho các tác vụ mạng. Ví dụ: nếu biểu đồ của bạn có nhiều đỉnh, thay vì chỉ một, biểu đồ đường sẽ nhấn mạnh đến sự thay đổi về tốc độ trong khi biểu đồ khu vực sẽ nhấn mạnh tổng độ trễ.

So sánh:
Biểu đồ đường Cùng đồ thị với diện tích đầy
Tổng tích lũy lớn hơn một chút trong nửa đầu của biểu đồ (bên trái của đường màu đỏ) so với thứ hai, ngay cả khi các đỉnh đạt giá trị tối đa cao hơn ở bên phải. Điền vào nhấn mạnh rằng khối rắn ở bên trái, để nó cân bằng tốt hơn so với các đỉnh.

(Tha thứ cho chất lượng hình ảnh kém - không thể tìm ra cách để R thực hiện biểu đồ vùng! Phải xuất và chỉnh sửa riêng.)

— AmeliaBR
nguồn