Hiển thị hiệu quả dữ liệu nhân khẩu học trên bản đồ in


29

Tôi muốn vẽ dữ liệu sau cho mỗi vùng (tổng cộng 30 vùng) trên bản đồ có thể in / không tương tác:

  • Tuổi trung bình
  • Thu nhập hộ gia đình trung bình
  • Số hộ
  • Mật độ dân số
  • Số người
  • Số lượng công nhân

Làm thế nào bạn sẽ hiển thị 6 lớp trên một cách hiệu quả trên một bản đồ?


1
Làm thế nào lớn là các khu vực liên quan đến kích thước trang? Bạn có thể phù hợp với một âm mưu nhỏ trong từng khu vực? (ví dụ: biểu đồ radar)
djq

@celenius - Đây là một loại khảo sát điều tra dân số điển hình, trong đó các khu vực trung tâm thành phố nhỏ hơn rất nhiều so với các khu dân cư nhỏ hơn đáng kể so với các khu vực ngoại ô / nông thôn
dassouki

1
6 lớp trên bản đồ tĩnh là một công việc thiết kế khó khăn. Vấn đề ngăn chặn sử dụng bản đồ tương tác là gì?
Trevesy

@Trevesy - đối với hầu hết các phần, yêu cầu là thiết kế một bản đồ có thể in nổi bật 6 biến để thúc đẩy phân tích trực quan
dassouki

1
Tôi đã lấy tự do để thêm thẻ trực quan hóa, vui lòng xóa nó nếu bạn cho rằng nó không phù hợp.
Andy W

Câu trả lời:


20

Tôi muốn nói rằng bạn không thể bao gồm tất cả dữ liệu đó trên một bản đồ và nó có ý nghĩa gì không. Tôi khuyên bạn nên suy nghĩ theo nguyên tắc bội số nhỏ của Tufte, có nhiều bản đồ nhỏ hơn của cùng một khu vực, mỗi bản đồ sử dụng một biến khác nhau. Ví dụ: http://www.juiceanalytics.com/wr/better-ledge-visualization-small-multiples/

Thậm chí sau đó, bạn có một vấn đề là bạn đang sử dụng một loạt các đơn vị khác nhau, vì vậy bạn cần một loạt các phím. Một cách khác để xem dữ liệu (nhưng không có trong bản đồ) là sử dụng bảng có tất cả các giá trị, được tô màu (nghĩa là - các màu khác nhau cho mức trung bình, trung bình, trên trung bình)

Cũng muốn đề nghị bạn xem tập bản đồ điều tra dân số để biết thêm ý tưởng bản đồ: http : //www.c tắc.gov / population / www / cen2000 / c điều traatlas /

Có thể giúp phản ánh nhiều hơn về thông điệp bạn đang cố gắng truyền đạt, chính xác (không chỉ là dữ liệu bạn có).


5
1 Đây là xa tốt hơn so với thực hiện một mess bằng cách cố gắng để tượng trưng cho sáu biến cùng một lúc. Ngoài ra, tại sao không in một bảng dữ liệu? Sáu cột + id, 30 hàng: nó đủ nhỏ và cung cấp tất cả các chi tiết mà bất kỳ ai cũng cần.
whuber

13

Không thể hiển thị hiệu quả quá nhiều dữ liệu trên một bản đồ. Hai khả năng:

  • Sản xuất 6 bản đồ,

  • Phân tích dữ liệu của bạn để phân loại các khu vực của bạn và hiển thị kết quả của phân loại. Một phân tích thành phần chính có thể giúp xác định các mối tương quan quan trọng nhất trong biến của bạn. Phương pháp này đã được sử dụng để sản xuất bản đồ tổng hợp này:

văn bản thay thế

từ những cái này:

văn bản thay thế văn bản thay thế


Vấn đề với việc có 6 bản đồ là rất khó để xác định trực quan bất kỳ xu hướng nào. Đôi khi, thật tuyệt khi nhìn vào một bản đồ với nhiều biến số và xem mọi thứ sắp xếp như thế nào
dassouki

2
@dassouki, để xem mọi thứ sắp xếp như thế nào, bạn không nhất thiết phải lập bản đồ. Các biểu đồ tán xạ Bivariate sẽ đáp ứng các tiêu chí đó, và sẽ dễ giải thích hơn nhiều.
Andy W

3
Các lợi thế của việc có 6 bản đồ là nó dễ dàng để xác định xu hướng thị giác! Khi bạn cố gắng tập hợp sáu (hoặc nhiều) biến vào một bản đồ, việc tìm mẫu sẽ trở nên khó khăn. (Nếu bản đồ này liên quan đến hàng ngàn tính năng, tôi sẽ thay đổi nhận xét này: một số loại ánh xạ nhất định, chẳng hạn như trực quan hóa glyph , có thể có hiệu quả đáng kể để tìm các mẫu trong bộ dữ liệu đa biến phong phú: lmi.bwh.harvard.edu/ con / con / KindlmannTVCG2006.html )
whuber

@julien, Những thứ hay ho, bạn có thể quan tâm đến bài viết này tôi mới bắt gặp, e-publications.org/ims/submission/index.php/AOAS/user/ , nó có bản đồ với phân tích PCA liên quan đến đa biến tương tự dữ liệu cũng như mã R để thực hiện các ô.
Andy W

Thực sự thú vị, tôi sẽ phải đọc về điều này.
neuhausr

9

Tôi đồng ý rằng bội số nhỏ có lẽ là một cách tốt để tiếp cận vấn đề này. Để bổ sung cho bản đồ, tôi cũng sẽ đề xuất một ma trận phân tán các biến của bạn, trong đó sẽ xác định các mối tương quan bivariate. Mặc dù bạn mất khía cạnh địa lý của dữ liệu, việc hình dung mối quan hệ giữa các biến trong biểu đồ phân tán sẽ đơn giản hơn nhiều so với so sánh hai bản đồ (thậm chí cạnh nhau).

Nếu bạn vẫn muốn một số loại xu hướng không gian được nắm bắt, bạn có thể bao gồm số liệu thống kê không gian (chẳng hạn như I của Moran địa phương) giữa các bản phân phối và / hoặc các biến ban đầu.

Chỉnh sửa: Gần đây tôi đã bắt gặp một số công việc xem lại số liệu thống kê đạo đức được xuất bản bởi Andre-Michel Guerry (ban đầu vào năm 1883) có mục tiêu trực quan hóa các mối quan hệ đa biến trong không gian. Việc triển khai của các tác giả này rất giống với những gì đã được đề xuất trong chủ đề này, bội số nhỏ, phân tích thành phần chính, ma trận biểu đồ phân tán và trong các sơ đồ đa giác. Kèm theo là một số hình ảnh từ A.-M. Thống kê đạo đức của Guerry của Pháp: Những thách thức đối với phân tích không gian đa biến bằng cách: Michael Friendly Science Science, Vol. 22, Số 3. (Tháng 8 năm 2007), trang 368-399 (Bản PDF miễn phí). Ngoài ra một bài viết khác ( Dray và Jombart, 2010 ) phân tích cùng một dữ liệu và có một số mã nguồn trong R để thực hiện các âm mưu nói trên.

Một hình ảnh là một ma trận phân tán, hình kia là một sơ đồ sao (đây chỉ là một cách khác để biểu thị các biểu đồ thanh như Pablo đề xuất). văn bản thay thế văn bản thay thế


8

Dưới đây là một ví dụ tuyệt vời về bội số nhỏ được đăng trên Andrew Gelman (và blog của công ty) Mô hình thống kê, suy luận nguyên nhân và Khoa học xã hội . Bản đồ là sự ủng hộ của cử tri đối với các chứng từ trường học theo tiểu bang, có điều kiện về thu nhập và các chủng tộc và tôn giáo khác nhau. Những người không truyền giáo da trắng thực sự không thích chứng từ trường học! (Nếu bạn vào blog thực tế mặc dù nó xuất hiện trong dữ liệu khảo sát năm 2004, họ sẽ hỗ trợ nhiều hơn cho các chứng từ trường học trong nhóm đó). nhập mô tả hình ảnh ở đây


Đồ thị rất tuyệt, nhưng thang màu thật kinh khủng. Tại sao 50% được ưu tiên như vậy, bằng cách làm cho nó màu xám? Chắc chắn nó chỉ nên sử dụng màu sắc bản đồ nhiệt, hoặc cái gì đó? Ngoài ra, tại sao chỉ có người da trắng chia thành tôn giáo? chắc chắn sẽ có ý nghĩa hơn khi phân chia theo chủng tộc và sau đó bởi tôn giáo?
ness101

@ naught101, tôi hơi bối rối bởi sự tiêu cực của bạn. Chắc chắn màu xám được khử màu so với các màu sáng hơn hoặc tối hơn ở hai đầu của quang phổ. Mặc dù tôi không hài lòng về việc phân kỳ tùy ý ở mức 45%, IMO khi tạo nhiều bản đồ nhỏ như thế này, nó có lợi cho các giá trị tương phản cao. Nhận xét về sự chia rẽ tôn giáo / chủng tộc không có ý nghĩa gì cả IMO. Đây là những danh mục rõ ràng có liên quan cao đến việc liệu một chứng từ không hỗ trợ, và có vẻ như một số tập hợp con mà bạn đề xuất không tồn tại. tiếp ...
Andy W

IE Tôi rất nghi ngờ có tồn tại đủ "Công giáo da đen" trong cuộc khảo sát để nói bất cứ điều gì thực sự về một nhóm như vậy (cũng không phải là "Tin lành gốc Tây Ban Nha). Tôi sẽ đề nghị bạn đọc bài viết của Gelman và hy vọng điều đó sẽ làm sáng tỏ động lực cho các nhóm nhỏ.
Andy W

có lẽ đó chỉ là một màu xám đặc biệt xuất hiện trên màn hình của tôi. Tôi nghĩ sẽ tốt hơn với màu trắng và có thể là nền màu xám để phân biệt. Cũng đáng chú ý rằng hai hình ảnh trên blog của Gelman có tỷ lệ khác nhau ... Tôi có ấn tượng rằng dân số da đen cao hơn nhiều, nhưng tôi chỉ nhìn vào dữ liệu điều tra dân số và đứng chính xác. Mặc dù vậy, một điều kỳ lạ là điều tra dân số xác định nguồn gốc Tây Ban Nha là trực giao với chủng tộc (đó là một câu hỏi riêng). Tôi đoán sự khác biệt của Gelman được định nghĩa khác nhau ..
naught101

@ naught101 đây không phải là thông tin từ cuộc điều tra dân số, nó là từ một số khảo sát khác (điều tra dân số không có bất cứ ý kiến ​​nào về nó)
Andy W

5

Để chọn giữa các giải pháp được trình bày ở đây, bạn có thể cung cấp hai thông tin chính:

  • mục đích của bản đồ là gì? (Khám phá, phơi bày?)
  • công chúng dự định của bản đồ là gì? (Bạn, nhà phân tích đồng nghiệp, kế hoạch thành phố, công cộng?)

Các giải pháp được trích dẫn ở đây có thể có hiệu quả khác nhau tùy theo mục đích và công chúng.

Tôi muốn khái quát câu trả lời của Julien (một bản đồ tổng hợp bằng PCA) bằng cách trích dẫn kỹ thuật đường chéo ma trận, được mô tả bởi J. Bertin. Nó hữu ích khi người ta tìm kiếm sau một tổng hợp tất cả các thông tin, thay vì một bản trình bày dữ liệu hoàn chỉnh.

Tóm lại, nó bao gồm việc biểu diễn mỗi biến bằng một biểu đồ, sắp xếp một ngăn xếp các biểu đồ theo cách sao cho các giá trị (các vùng bản đồ) được căn chỉnh theo kiểu đường chéo, để có được một kiểu chữ:

văn bản thay thế

(Nguồn: http://books.google.com.vn/books?id=2tlQAAAAMAAJ&dq=bertin%20graphique%20inatures&hl=fr&source=gbs_similarbooks )


4

Đó là rất nhiều thông tin và thực tế là một bản đồ duy nhất kết hợp tất cả chúng theo cách theo chủ đề sẽ dẫn đến một bài thuyết trình vô dụng vì ô nhiễm thị giác. Mặt khác, có 30 khu vực, vì vậy, nhiều bản đồ cho mỗi khu vực cũng sẽ dẫn đến ô nhiễm.

Giải pháp của tôi: Chọn thông tin nào là thông tin quan trọng nhất, giả sử 'thu nhập hộ gia đình', sau đó phân vùng bản đồ theo một số loại thu nhập. Và cuối cùng cho mỗi điểm thu nhập, hãy vẽ một cuộc trò chuyện trên thanh với 5 thuộc tính khác.

Với bản đồ đó có thể đưa ra một số so sánh như, ví dụ: "Khu vực thu nhập cao luôn cho thấy số lượng lớn công nhân và độ tuổi trung bình hơn 21 tuổi".

Nhìn vào ví dụ...

văn bản thay thế


4

Có lẽ một số trong những ý tưởng có thể giúp đỡ?

Giả sử bạn có sáu chiều:

1: Choropleth : Ví dụ thu nhập hộ gia đình 0

2, 3 và 4: Biểu tượng : Biểu thị số người dưới dạng dấu chấm, có thể cho phép bạn xem nền: ví dụ 1, ví dụ 2 sử dụng thang độ xám cho công nhân / người không làm việc và bảng màu khác nhau để hiển thị tuổi

5: 3D : Sử dụng mật độ dân số làm ví dụ địa hình 3

6: (Tôi không thể nghĩ ra cách thứ 6!)

Có thừa không khi hiển thị 'Số hộ gia đình', 'Mật độ dân số' và 'Số người'?

Tôi sẽ hoài nghi nếu một bản đồ với sự phức tạp này sẽ rõ ràng với bất cứ ai ngoài bạn. Nếu tôi trình bày nó, tôi sẽ hiển thị từng yếu tố riêng biệt trước, sau đó thêm nó vào để khán giả có thể hiểu các bước.


Một cách khác (nếu bạn không có chỗ cho biểu đồ radar cho từng khu vực, có thể là tạo một 'glyph' đại diện cho thông tin này ví dụ 4, hình 10.28 . Tôi nghĩ chúng thường khó hiểu và không dễ thiết kế rõ ràng, nhưng ví dụ liên kết có thể được sử dụng trong trường hợp này.


Một suy nghĩ khác mà tôi có, sẽ là đưa các đa giác lên cùng một chiều cao cho mỗi đa giác, và sau đó sử dụng một phần của chiều cao để biểu diễn các tham số này. Tương tự như tạo biểu đồ thanh cho từng khu vực, nhưng trong đó mỗi phần được xếp chồng lên nhau theo các khoảng tương tự. Điều này cần phải được xem từ 3D, điều đó có nghĩa là một phần của nó sẽ bị che khuất.


Tôi yêu, và tôi có nghĩa là tất cả các đề nghị của bạn. Tôi có kế hoạch thực hiện 1-> 4. Tuy nhiên, đối với nội dung 3d: Tôi thấy rằng khi bạn thực hiện bản đồ 3d, các khu vực trung tâm thành phố, thường nằm ở vị trí trung tâm, phần lớn độ cao, chặn rất nhiều khu vực phía sau chúng
dassouki

@dassouki - Tôi đồng ý rằng đó thường là trường hợp. Có lẽ bạn có thể sử dụng một biến không có phạm vi lớn cho độ tuổi này (tuổi trung bình?) Hoặc nếu có, bạn có thể chuyển đổi logarit một cách logarit.
djq

3
@celenius Câu hỏi thú vị về sự dư thừa có thể có: mật độ dân số là số người so với diện tích ; số người là một con số tuyệt đối ; và số hộ gia đình cung cấp thông tin về cách mọi người sống cùng nhau. Mặc dù rõ ràng ba biến này có liên quan (và có thể tạo ra các vấn đề gần như cộng tuyến trong hồi quy) chúng thực sự là ba thông tin khác nhau. BTW, đó là "choropleth". (May mắn thay, Google nhận ra lỗi đánh máy này và thực hiện tìm kiếm theo dự định.)
whuber

1
@whuber - Tôi nghĩ có lẽ nó đã được thực hiện bằng cách sử dụng flash (thật đáng buồn!).
djq

2
Tôi rất nghi ngờ về đề xuất của 3D. AFAIK không ai cho thấy 3D là rất có thể sử dụng. Liên kết đến tội phạm San Fran hoạt động nhưng chỉ vì nó rất đơn giản - một mô hình phức tạp hơn sẽ khó giải mã. Tôi không nghĩ 3D là cách tốt nhất trong trường hợp này.
Trevesy

2

Đó là một nhiệm vụ đầy thách thức. Câu trả lời của tôi là đi với một bản đồ đa biến. Kiểm tra bản đồ này . Bản đồ sẽ trông bận rộn nếu bạn hiển thị tất cả các biến trên một bản đồ. Hãy chắc chắn rằng bạn chọn bảng màu phù hợp nếu bạn chọn đi với bản đồ đa biến.


Google Docs bị chặn nơi tôi làm việc :(
dassouki


cũng không hoạt động và tôi không thể cạo nó nếu nó không có phần mở rộng tập tin ở cuối của nó
dassouki

Vẫn không đi ....
dassouki

Tht là khối từ phía tôi. :( Tôi không ngại gửi cho bạn bản đồ qua email.
Raj

0

Một mức độ đơn giản hóa sẽ là thể hiện một mục, chẳng hạn như mật độ dân số, thông qua bản đồ, tức là làm biến dạng diện tích của mỗi đơn vị sao cho tỷ lệ với dân số:

Bầu cử tổng thống Mỹ 2008
(nguồn: amherst.edu )

Hạn chế chính là người xem phải có thể nhận ra sự biến dạng của các khu vực từ hình dạng "thông thường" của chúng.

Thêm thông tin ở đây: http://gis.amherstma.gov/data/SpringNearc2009/Session4Cartograms.pdf


1
Tôi nghĩ rằng điều này có tiềm năng, nhưng không rõ bản đồ có thể được áp dụng tốt như thế nào cho tình huống cụ thể này (đồng thời xem nhiều thuộc tính trên cùng một không gian). Về mặt lý thuyết bạn có thể tạo ra nhiều bản đồ nhỏ, nhưng có thể khó diễn giải (bạn mất tính nhất quán giữa các bản đồ, đây là loại thiết yếu cho bội số nhỏ). Có lẽ bản đồ có thể được kết hợp với màu sắc theo những cách thú vị hơn để hiển thị nhiều thuộc tính.
Andy W

1
Một ví dụ về nhiều bản đồ nhỏ, gisandscience.com/2011/12/07/ trên
Andy W
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.