Các công cụ thống kê không gian: phân tích phân cụm trên dữ liệu raster


9

Tôi có một vấn đề rõ ràng đơn giản, nhưng tôi không thể tìm ra một phương pháp rõ ràng để sử dụng.

Tôi được giao nhiệm vụ phân định "các khu vực đô thị" bằng các đa giác lồi vector, sử dụng bộ dữ liệu Dân số Thế giới từ CIESIN

Bộ dữ liệu này cung cấp các giá trị mật độ dân số trên toàn thế giới, dưới dạng tệp raster. Vấn đề là, như bạn đã đoán, các giá trị mật độ rất thay đổi và định nghĩa của "đô thị" là khá tương đối.

Tôi đã thử sử dụng một cách tiếp cận cổ điển và tính toán các độ dốc như thể các giá trị mật độ là độ cao, nhưng các giá trị độ dốc cũng rất khác nhau và phức tạp về mặt không gian, phức tạp.

Tôi đã xem xét các thuật toán phân cụm không gian, các công cụ LISA (Indocators of Spatial Association), với ArcGIS và GeoDa, nhưng tôi khá lạc lõng giữa các công cụ rất cụ thể. Một số phương pháp chỉ hoạt động trên các hình dạng vectơ, do đó cần phải phân loại lại và vector hóa (tính toán dài).

Bạn có thể giúp tôi tinh chỉnh bộ phương pháp và công cụ để sử dụng không? Cảm ơn !


2
Chính xác định nghĩa lại "đô thị"? BTW, tôi không mong đợi tất cả các khu vực đô thị sẽ được mô tả đầy đủ bởi các đa giác lồi . Nhiều người có hình dạng được kiểm soát bởi các đặc điểm địa lý - núi, bờ biển và sông - rất không lồi.
whuber

Định nghĩa không được đưa ra, không phải là một hằng số. Tôi nghĩ mục tiêu là tìm ra những khu vực dày đặc hơn đáng kể về môi trường của chúng, khác nhau. Vì vậy, ý tưởng về thống kê không gian và LISA. Bạn nói đúng về sự lồi lõm, tôi nên viết "không tự giao nhau và không giao nhau với các đa giác khác".
Laurent Jégou

Để bổ sung, tôi tìm thấy toàn bộ mô-đun R dành riêng cho các công cụ tích tụ không gian: spdep.
Laurent Jégou

Câu trả lời:


4

Tôi đã thực hiện một số công việc này cho MSc của mình http://ian01.geog.psu.edu/ con / mscthesis.pdf - về cơ bản tôi đã làm việc về thay đổi độ dốc nhưng cuộc thảo luận có thể giúp bạn với điều này.


Cảm ơn, tôi sẽ đọc nó sớm, nhưng điều đó đầy hứa hẹn :-)
Laurent Jégou

Tôi đã thử phương pháp phái sinh Sobel thứ 2 mà bạn mô tả trong luận án, trên một khu vực thử nghiệm hạn chế, và nó rất thú vị! Hạt nhân đô thị rõ ràng bị cô lập, desptite giá trị mật độ rất khác nhau. Rất cám ơn :) Nhân tiện, tôi đã sử dụng một phần mềm miễn phí và mã nguồn mở để tính toán các kết quả và toán raster: Opticks.
Laurent Jégou

Một thước đo ánh sáng nhân tạo sẽ là một đại diện tốt cho điều kiện đô thị. Một tìm kiếm google nên tìm các nghiên cứu ví dụ.
b_dev

@indiehacker - Tôi đã xem xét điều đó nhưng nó phụ thuộc về văn hóa, ví dụ như Pháp tối hơn Vương quốc Anh.
Ian Turton

6

Từ quan điểm về mật độ dân số, một "khu vực đô thị" thường phải đáp ứng chỉ một vài tiêu chí tiên đề :

  1. Ranh giới của nó không được bao gồm bất kỳ điểm nào có mật độ cao (tương đối) so với mật độ tối đa bên trong nó.

  2. Nó nên được kết nối đơn giản (không có "lỗ").

  3. Mật độ dân số trung bình của nó phải vượt quá một số ngưỡng quy định trước.

Tiên đề (1) là tự nhiên nhất: nếu một điểm biên có mật độ cao, chúng ta sẽ chỉ di chuyển ranh giới ra bên ngoài để bao gồm điểm đó trong khu vực đô thị. Tôi muốn đề xuất rằng "tương đối" có nghĩa là một tỷ lệ tối đa , chẳng hạn như một phần mười hoặc một phần trăm hoặc bất cứ điều gì. Tiên đề (2) tránh loại trừ các công viên và các khu vực mật độ thấp khác xảy ra tự nhiên trong các thành phố. Tiên đề (3) , bởi vì nó phụ thuộc vào một ngưỡng có phần tùy ý, loại bỏ các làng nhỏ gọn.

Trên thực tế, có ít nhất một yếu tố khác của sự độc đoán: bất kỳ bản đồ mật độ dân số nào được ghi nhận trung bình dân số trên các vùng lân cận địa phương (trong một số trường hợp và bằng bán kính hạt nhân cho ước tính mật độ hạt nhân). Chúng ta hãy chấp nhận kích thước vùng lân cận ngầm định này (có thể được thay đổi bằng các phương tiện tiêu cự đầu tiên chạy hoặc làm mịn hạt nhân khác trên bản đồ mật độ ban đầu), ngưỡng dân số này và ý nghĩa "tương đối cao" trong tiên đề 1 là các tham số có thể xác định được của người dùng kiểm soát kết quả.

Các tiên đề này dẫn đến một thuật toán khá đơn giản : người ta phải xác định vị trí cực đại cục bộ, tìm trong vùng lân cận của chúng cho đến khi tìm thấy một ranh giới để thỏa mãn tiên đề (1), điền vào bất kỳ lỗ nào để thỏa mãn tiên đề (2), và sau đó sàng lọc tất cả các khu vực ứng cử viên đó theo (3). Điều này được thực hiện như sau:

  1. Tùy chọn, làm mịn bản đồ mật độ.

  2. Thực hiện thuật toán "điền" vào bản đồ liên quan đến mật độ (xem bên dưới).

  3. Groupgroup kết quả.

  4. Loại bỏ các lỗ khỏi đa giác của Groupgrouped.

  5. Thực hiện các tổng số của mật độ dân số trên các đa giác đầy.

  6. Loại bỏ bất kỳ đa giác có tổng (hoặc mật độ trung bình) dưới ngưỡng dân số (mật độ).

Những gì còn lại là giải pháp của bạn.

Hãy để tôi nói thêm một chút về bước (1), đó là chìa khóa. Một thuật toán điền xác định "chìm" và "lấp đầy" chúng đến một mức không đổi trên độ cao của chúng. Đây chính xác là những gì Axiom (1) yêu cầu chúng ta làm, với điều kiện (a) chúng ta có thể làm cho "chìm" đóng vai trò "tối đa cục bộ" và (b) làm cho "số lượng không đổi ở trên" đóng vai trò là " phần không đổi của. " Cách để làm điều này là bằng cách điền vào logarit âm của mật độchứ không phải là mật độ chính nó. (Thêm một hằng số nhỏ đầu tiên vào mật độ - giả sử, khoảng 0,1 người trên mỗi km vuông - trước khi ghi nhật ký, để bất kỳ ô nào chứa số 0 sẽ không gây ra vấn đề.) "Hồ" trong mật độ nhật ký âm xác định ứng cử viên khu vực thành thị. Bạn vẫn có ba tham số độc lập để chơi (nhập ở các bước 0, 1 và 5); thiết lập chúng sẽ đòi hỏi một số suy nghĩ về những gì bạn thực sự có nghĩa là "khu vực đô thị" cũng như một số thử nghiệm.


Cảm ơn câu trả lời chi tiết của bạn. Tôi sẽ cố gắng tìm các công cụ phần mềm phù hợp (hoặc lập trình chúng) để kiểm tra thuật toán điền với nhật ký phủ định, điều đó có vẻ là một hướng dẫn tốt.
Laurent Jégou
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.