Tôi nên sử dụng một tỷ lệ rời rạc hoặc liên tục để tô màu một chloropleth?


8

Tôi đang tạo ra một bản hợp xướng cho một cuộc đua địa phương sắp tới bằng D3 . Có hai ứng cử viên tranh cử. Đối với bất kỳ đa giác đã cho nào trên bản đồ của tôi, nếu ứng cử viên màu đỏ có nhiều phiếu hơn, màu sẽ là màu đỏ. Nếu ứng cử viên màu xanh có nhiều phiếu hơn, màu nên là màu xanh. Nếu ứng cử viên màu xanh chiến thắng rất nhiều, màu sắc sẽ là màu xanh sâu hơn. Nếu ứng cử viên màu đỏ chiến thắng rất nhiều, màu sắc sẽ là màu đỏ sâu hơn.

Tôi nên sử dụng một quy mô rời rạc hoặc liên tục cho việc này? Có nghĩa là, tôi nên tạo một đoạn màu từ đỏ sang xanh cho độ bão hòa hoặc cường độ nhất định. Hoặc tôi nên tạo các thùng sao cho nếu màu đỏ / xanh rơi vào một phạm vi nhất định, đa giác được gán một trong một vài màu? Từ hướng dẫn, có vẻ như hầu hết mọi người làm thùng.


Đồng thời tìm kiếm chủ đề bản đồ / bản đồ màu bivariate , trong trường hợp bạn muốn có thêm ý tưởng về kỹ thuật đã chọn.
Martin F

Dữ liệu cân bằng (hai loại, tăng trong một loại nhất thiết có nghĩa là giảm trong loại khác), có thể được hình thành như một biến duy nhất. Vì trong nhiều cuộc bầu cử, đại đa số phiếu bầu là dành cho hai ứng cử viên (ngay cả khi có nhiều hơn hai ứng cử viên trong cuộc đua), sự gia tăng cho một người là giảm cho người khác. Do đó, điều này thực sự không cần phải được coi là một bản đồ bivariate.
Lee Hachadoorian

Câu trả lời:


13

Có những lợi ích và nhược điểm đối với từng cách làm. Để làm cho một câu chuyện dài ngắn, tôi khuyên bạn nên tạo ra "thùng". Một số lưu ý để giúp bạn chọn và về thiết kế hợp xướng nói chung:

Ánh xạ trực tiếp của giá trị dữ liệu thành màu (bản đồ 'không được phân loại') có thể được coi là cách chính xác nhất để hiển thị dữ liệu, tuy nhiên bản đồ được phân loại (bản đồ có 'thùng') có thể dễ đọc hơn vì nhiều lý do.

Nếu bạn sử dụng bản đồ chưa được phân loại và dữ liệu bị sai lệch hoặc có các ngoại lệ trong tập dữ liệu, các ngoại lệ sẽ nổi bật rõ ràng, trong khi nhiều đa giác có thể có màu rất giống nhau. Điều này sẽ làm nổi bật thực tế là một vài khu vực khác biệt hoàn toàn so với các khu vực khác (trong trường hợp của bạn, nếu một vài khu vực có sự ưu tiên lớn hơn đáng kể cho một ứng cử viên so với hầu hết các khu vực), nhưng khó phân biệt các mối quan hệ trong đó phần còn lại của khu vực bản đồ.

Trong một bản đồ được phân loại, mỗi lớp phải khác biệt về mặt trực quan, do đó thật dễ dàng để biết một khu vực nằm trong dữ liệu, với chi phí của một số khác biệt nhỏ hơn bị mất.

Một vấn đề khác là nhận thức về cường độ màu không nghiêm ngặt tuyến tính. Vì vậy, nếu bạn có một dải màu từ trắng sang xanh, tương ứng với việc không có ứng cử viên nào nhận được nhiều phiếu bầu hơn cho vị trí dẫn đầu tối đa cho một ứng cử viên, màu có thể được coi là 75% giữa màu trắng và màu xanh lam là 75% cách giữa hai màu và do đó, người dùng bản đồ sẽ đưa ra một giả định sai về giá trị dữ liệu mà nó đại diện.

Mặt khác, các bản đồ được phân loại có thể có màu sắc của từng loại được lựa chọn cẩn thận để được cảm nhận rõ ràng và khác biệt. Tôi không biết đủ để thiết kế một bộ màu thực hiện điều này, nhưng Cynthia Brewer và Mark Harrower đã làm, và họ đã tạo ra colorbrewer2.org , một công cụ tuyệt vời (miễn phí) để giúp người vẽ bản đồ chọn cách phối màu tốt cho bản đồ của họ. Bạn có thể chọn từ nhiều lược đồ khác nhau, chọn số lượng lớp và nó đưa ra bản xem trước về sơ đồ có thể trông như thế nào trong thực tế và các giá trị RBG, HEX hoặc CMYK cho mỗi màu trong lược đồ. Rất hữu ích, và chỉ đơn giản là thú vị để chơi với.

Vì những lý do này, tôi khuyên bạn nên tạo một bản đồ được phân loại. Số lượng các lớp được đề nghị thường là một số lẻ từ 5-9 hoặc hơn. Sử dụng một số lẻ cho giá trị trung bình riêng biệt và số lớp này thường được coi là đủ để cung cấp sự khác biệt hữu ích trong dữ liệu, nhưng không quá nhiều để không thể phân biệt được. Vì bạn đang sử dụng bảng màu phân kỳ (màu sáng ở giữa, hai màu khác nhau ở mỗi đầu), bạn có thể thoát khỏi nhiều lớp hơn, có thể là 7-9.

Đối đầu với colorbrewer, chọn "phân kỳ" cho tính chất của dữ liệu của bạn, chọn bảng màu từ đỏ sang xanh, chọn số lớp của bạn và bạn sẽ đi!

Đối với phần lớn điều này, không có một quy tắc cứng. Tiêu chuẩn là "bản đồ có truyền đạt dữ liệu tốt không?" Chơi xung quanh với các tham số cho đến khi bạn nhận được một cái gì đó "hoạt động" có thể là một điều tốt.

Bây giờ, một lưu ý về việc làm choropleths. Tôi xin lỗi nếu đây là mặt bằng quen thuộc với bạn:

Một điểm đáng chú ý khi sử dụng bản đồ được phân loại là cách dữ liệu được chia thành các lớp. Có phải nó bị phá vỡ trong khoảng thời gian bằng nhau dọc theo phạm vi? Là một số điểm dữ liệu nhất định được gán cho mỗi lớp? Một số độ lệch chuẩn nhất định so với giá trị trung bình? Có phải nó bị hỏng ở mức "tự nhiên" trong dữ liệu? Phương pháp bạn sử dụng tạo ra sự khác biệt trong cách dữ liệu được miêu tả. Tôi không phải là một lập trình viên nhiều, và tôi không chắc kịch bản mà bạn liên kết sử dụng. "Phá vỡ tự nhiên" thường là một lựa chọn tốt. Đối với dữ liệu có điểm giữa rõ ràng như dữ liệu bỏ phiếu (điểm giữa là phân chia 50/50), độ lệch chuẩn có thể hữu ích.

Khi thực hiện một hợp xướng, tốt nhất là sử dụng dữ liệu được chuẩn hóa trên một đơn vị diện tích. Ví dụ, thay vì sử dụng tổng dân số trong một quận, tốt hơn là lập bản đồ dân số trên mỗi dặm vuông trong mỗi hạt. Lý do là một khu vực lớn hơn sẽ có xu hướng có nhiều người trong đó hơn một khu vực nhỏ hơn, do đó, việc chia cho khu vực của mỗi đơn vị được ánh xạ sẽ mô tả chính xác hơn các xu hướng. Dữ liệu cũng có thể được chuẩn hóa theo phần trăm. Ví dụ, tỷ lệ nghèo thay vì một số người nghèo.

Đối với mục đích của bạn, việc tiết lộ tỷ lệ phiếu bầu cho một ứng cử viên sẽ rõ ràng hơn so với số phiếu bầu thô cho ứng cử viên đó.

Dù sao, tôi hy vọng một số điều này hữu ích, và bản đồ của bạn trở nên tốt đẹp!

Trong phần lớn cuộc thảo luận này, tôi đã vẽ về Bản đồ chuyên đề và Geovisualization của Slocum et al.


Những bản đồ màu trên đầu người riêng biệt của NYT ngày nay khá khủng khiếp. Quá nhiều chi tiết bị mất vì thùng màu của chúng rất lớn. Tôi nghĩ đó chắc chắn là một ví dụ trong đó nên sử dụng thang màu liên tục.
Andy

(bản đồ coronavirus đó là)
Andy

5

Bạn giải quyết một trong nhiều khía cạnh của biểu tượng hóa : cách mô tả các giá trị định lượng thông qua biểu diễn màu thay đổi - sử dụng thang đo độ bão hòa hoặc cường độ màu rời rạc hoặc liên tục. Câu hỏi hay. Câu trả lời là, như thường lệ, nó phụ thuộc ...

Bản đồ học theo chủ đề truyền thống nhận ra rằng các bản đồ, như các mô hình đơn giản của thực tế, là sản phẩm của rất nhiều khái quát. Để đơn giản, số lượng được nhóm thành các lớp (thùng) - và đã có nhiều cuộc thảo luận về việc có bao nhiêu lớp như vậy (5 hoặc 7 thường được chào hàng). Ưu điểm: đơn giản hơn nhiều khi xây dựng bằng các phương pháp cơ học ảnh truyền thống và dễ dàng truyền tải thông điệp hơn. Hãy nhìn xem, ở đây Red Ken được ưa chuộng, trong khi ở đằng kia, Blue Peter.

Bản đồ học theo chủ đề đương đại cho phép các bản đồ có độ chi tiết cao hơn nhiều trong đó số lượng liên tục có thể được biểu thị bằng thang màu của các dải rất cao. Những ưu điểm: khách quan và chi tiết hơn. Trình đọc bản đồ có khả năng có thể tạo lại dữ liệu nguồn với độ chính xác cao hơn.

Vì vậy, mục đích sâu hơn của bản đồ của bạn là gì?

Bạn có muốn khách quan hơn, khám phá các biến thể chi tiết có trong dữ liệu? Sử dụng thang màu liên tục. Khái niệm "bản đồ như công cụ điều tra" này đi kèm với các tên (mới) như "trực quan hóa dữ liệu" và "bản đồ nhiệt".

Bạn có muốn kể một câu chuyện đơn giản? Sử dụng thang màu rời rạc. Đây là "bản đồ là công cụ giao tiếp".

Vì bản đồ của bạn đã được khái quát hóa cao về mặt không gian, nên vào các khu vực bỏ phiếu, tôi có thể đề nghị sử dụng thang màu liên tục như một sự thỏa hiệp - bạn có sự phân biệt không gian nhưng liên tục thống kê. Chỉ là một ý tưởng.

Cuối cùng, tùy bạn. Tại sao không thử nghiệm với một vài biến thể?


Tôi nghĩ rằng nếu lịch sử hình dung đã bắt đầu với các máy tính hiện đại thay vì in giá rẻ với số lượng màu mực hạn chế, mọi người sẽ dễ sử dụng thang màu liên tục hơn.
Andy

1

Tôi thấy hai Tùy chọn:

a) bạn chỉ sử dụng thùng: (số chỉ là một ví dụ)

  • Ứng cử viên Đỏ có> 50% - 70% số phiếu -> màu đỏ nhạt
  • Ứng cử viên Đỏ có> 70% số phiếu -> màu đỏ đậm
  • cho màu xanh phù hợp

b) bạn sử dụng đoạn đường nối Màu.

  • colorramp liên tục từ đỏ nhạt / xanh dương đến đỏ đậm / xanh lam với ánh xạ liên tục của các giá trị từ> 50% đến 100% đến các màu từ sáng đến đỏ / xanh đậm.

Những gì bạn chọn phụ thuộc vào những gì bạn muốn giao tiếp với bản đồ. Nếu thông tin "đang thắng" và "đang thắng xy%" là đủ, hãy chọn a). Nếu Độc giả của bạn có thể ước tính được bao nhiêu% ứng cử viên màu đỏ hoặc màu xanh đang dẫn đầu, hãy chọn b)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.