Có những lợi ích và nhược điểm đối với từng cách làm. Để làm cho một câu chuyện dài ngắn, tôi khuyên bạn nên tạo ra "thùng". Một số lưu ý để giúp bạn chọn và về thiết kế hợp xướng nói chung:
Ánh xạ trực tiếp của giá trị dữ liệu thành màu (bản đồ 'không được phân loại') có thể được coi là cách chính xác nhất để hiển thị dữ liệu, tuy nhiên bản đồ được phân loại (bản đồ có 'thùng') có thể dễ đọc hơn vì nhiều lý do.
Nếu bạn sử dụng bản đồ chưa được phân loại và dữ liệu bị sai lệch hoặc có các ngoại lệ trong tập dữ liệu, các ngoại lệ sẽ nổi bật rõ ràng, trong khi nhiều đa giác có thể có màu rất giống nhau. Điều này sẽ làm nổi bật thực tế là một vài khu vực khác biệt hoàn toàn so với các khu vực khác (trong trường hợp của bạn, nếu một vài khu vực có sự ưu tiên lớn hơn đáng kể cho một ứng cử viên so với hầu hết các khu vực), nhưng khó phân biệt các mối quan hệ trong đó phần còn lại của khu vực bản đồ.
Trong một bản đồ được phân loại, mỗi lớp phải khác biệt về mặt trực quan, do đó thật dễ dàng để biết một khu vực nằm trong dữ liệu, với chi phí của một số khác biệt nhỏ hơn bị mất.
Một vấn đề khác là nhận thức về cường độ màu không nghiêm ngặt tuyến tính. Vì vậy, nếu bạn có một dải màu từ trắng sang xanh, tương ứng với việc không có ứng cử viên nào nhận được nhiều phiếu bầu hơn cho vị trí dẫn đầu tối đa cho một ứng cử viên, màu có thể được coi là 75% giữa màu trắng và màu xanh lam là 75% cách giữa hai màu và do đó, người dùng bản đồ sẽ đưa ra một giả định sai về giá trị dữ liệu mà nó đại diện.
Mặt khác, các bản đồ được phân loại có thể có màu sắc của từng loại được lựa chọn cẩn thận để được cảm nhận rõ ràng và khác biệt. Tôi không biết đủ để thiết kế một bộ màu thực hiện điều này, nhưng Cynthia Brewer và Mark Harrower đã làm, và họ đã tạo ra colorbrewer2.org , một công cụ tuyệt vời (miễn phí) để giúp người vẽ bản đồ chọn cách phối màu tốt cho bản đồ của họ. Bạn có thể chọn từ nhiều lược đồ khác nhau, chọn số lượng lớp và nó đưa ra bản xem trước về sơ đồ có thể trông như thế nào trong thực tế và các giá trị RBG, HEX hoặc CMYK cho mỗi màu trong lược đồ. Rất hữu ích, và chỉ đơn giản là thú vị để chơi với.
Vì những lý do này, tôi khuyên bạn nên tạo một bản đồ được phân loại. Số lượng các lớp được đề nghị thường là một số lẻ từ 5-9 hoặc hơn. Sử dụng một số lẻ cho giá trị trung bình riêng biệt và số lớp này thường được coi là đủ để cung cấp sự khác biệt hữu ích trong dữ liệu, nhưng không quá nhiều để không thể phân biệt được. Vì bạn đang sử dụng bảng màu phân kỳ (màu sáng ở giữa, hai màu khác nhau ở mỗi đầu), bạn có thể thoát khỏi nhiều lớp hơn, có thể là 7-9.
Đối đầu với colorbrewer, chọn "phân kỳ" cho tính chất của dữ liệu của bạn, chọn bảng màu từ đỏ sang xanh, chọn số lớp của bạn và bạn sẽ đi!
Đối với phần lớn điều này, không có một quy tắc cứng. Tiêu chuẩn là "bản đồ có truyền đạt dữ liệu tốt không?" Chơi xung quanh với các tham số cho đến khi bạn nhận được một cái gì đó "hoạt động" có thể là một điều tốt.
Bây giờ, một lưu ý về việc làm choropleths. Tôi xin lỗi nếu đây là mặt bằng quen thuộc với bạn:
Một điểm đáng chú ý khi sử dụng bản đồ được phân loại là cách dữ liệu được chia thành các lớp. Có phải nó bị phá vỡ trong khoảng thời gian bằng nhau dọc theo phạm vi? Là một số điểm dữ liệu nhất định được gán cho mỗi lớp? Một số độ lệch chuẩn nhất định so với giá trị trung bình? Có phải nó bị hỏng ở mức "tự nhiên" trong dữ liệu? Phương pháp bạn sử dụng tạo ra sự khác biệt trong cách dữ liệu được miêu tả. Tôi không phải là một lập trình viên nhiều, và tôi không chắc kịch bản mà bạn liên kết sử dụng. "Phá vỡ tự nhiên" thường là một lựa chọn tốt. Đối với dữ liệu có điểm giữa rõ ràng như dữ liệu bỏ phiếu (điểm giữa là phân chia 50/50), độ lệch chuẩn có thể hữu ích.
Khi thực hiện một hợp xướng, tốt nhất là sử dụng dữ liệu được chuẩn hóa trên một đơn vị diện tích. Ví dụ, thay vì sử dụng tổng dân số trong một quận, tốt hơn là lập bản đồ dân số trên mỗi dặm vuông trong mỗi hạt. Lý do là một khu vực lớn hơn sẽ có xu hướng có nhiều người trong đó hơn một khu vực nhỏ hơn, do đó, việc chia cho khu vực của mỗi đơn vị được ánh xạ sẽ mô tả chính xác hơn các xu hướng. Dữ liệu cũng có thể được chuẩn hóa theo phần trăm. Ví dụ, tỷ lệ nghèo thay vì một số người nghèo.
Đối với mục đích của bạn, việc tiết lộ tỷ lệ phiếu bầu cho một ứng cử viên sẽ rõ ràng hơn so với số phiếu bầu thô cho ứng cử viên đó.
Dù sao, tôi hy vọng một số điều này hữu ích, và bản đồ của bạn trở nên tốt đẹp!
Trong phần lớn cuộc thảo luận này, tôi đã vẽ về Bản đồ chuyên đề và Geovisualization của Slocum et al.