Câu trả lời:
Như mọi khi, nó phụ thuộc vào mục tiêu của bạn và bản chất của dữ liệu. Đối với dữ liệu được ánh xạ hoàn toàn , một công cụ mạnh mẽ là hàm L của Ripley, họ hàng gần của hàm K của Ripley . Rất nhiều phần mềm có thể tính toán điều này. ArcGIS có thể làm điều đó ngay bây giờ; Tôi chưa kiểm tra. CrimeStat làm điều đó. Vì vậy, làm GeoDa và R . Một ví dụ về việc sử dụng nó, với các bản đồ liên quan, xuất hiện trong
Sinton, DS và W. Huber. Lập bản đồ polka và di sản dân tộc của nó ở Hoa Kỳ. Tạp chí Địa lý tập. 106: 41-47. 2007
Dưới đây là ảnh chụp màn hình CrimeStat của phiên bản "L function" của Ripley's K:
Đường cong màu xanh ghi lại sự phân bố các điểm rất không ngẫu nhiên, bởi vì nó không nằm giữa các dải màu đỏ và màu xanh lá cây bao quanh số 0, là nơi mà dấu vết màu xanh cho hàm L của phân phối ngẫu nhiên sẽ nằm.
Đối với dữ liệu được lấy mẫu, phần lớn phụ thuộc vào bản chất của mẫu. Một nguồn tài nguyên tốt cho việc này, có thể truy cập được đối với những người có nền tảng hạn chế (nhưng không hoàn toàn vắng mặt) về toán học và số liệu thống kê, là sách giáo khoa của Steven Thompson về Lấy mẫu .
Nhìn chung, trường hợp hầu hết các so sánh thống kê có thể được minh họa bằng đồ họa và tất cả các so sánh đồ họa tương ứng hoặc đề xuất một đối tác thống kê. Do đó, bất kỳ ý tưởng nào bạn nhận được từ tài liệu thống kê đều có khả năng đề xuất các cách hữu ích để lập bản đồ hoặc so sánh bằng đồ họa hai bộ dữ liệu.
Lưu ý: những điều sau đây đã được chỉnh sửa sau bình luận của người đánh bóng
Bạn có thể muốn áp dụng một cách tiếp cận Monte Carlo. Đây là một ví dụ đơn giản. Giả sử bạn muốn xác định xem phân phối của các sự kiện tội phạm A có giống nhau về mặt thống kê với B hay không, bạn có thể so sánh thống kê giữa các sự kiện A và B với phân phối theo kinh nghiệm của các biện pháp đó cho các 'dấu hiệu' được gán lại ngẫu nhiên.
Chẳng hạn, được phân phối A (trắng) và B (xanh dương),
bạn ngẫu nhiên gán lại nhãn A và B cho TẤT CẢ các điểm trong bộ dữ liệu kết hợp. Đây là một ví dụ về một mô phỏng duy nhất:
Bạn lặp lại điều này nhiều lần (giả sử 999 lần) và với mỗi mô phỏng, bạn tính một thống kê (thống kê trung bình lân cận gần nhất trong ví dụ này) bằng cách sử dụng các điểm được gắn nhãn ngẫu nhiên. Đoạn mã theo sau nằm trong R (yêu cầu sử dụng thư viện spatstat ).
nn.sim = vector()
P.r = P
for(i in 1:999){
marks(P.r) = sample(P$marks) # Reassign labels at random, point locations don't change
nn.sim[i] = mean(nncross(split(P.r)$A,split(P.r)$B)$dist)
}
Sau đó, bạn có thể so sánh kết quả bằng đồ họa (đường dọc màu đỏ là thống kê ban đầu),
hist(nn.sim,breaks=30)
abline(v=mean(nncross(split(P)$A,split(P)$B)$dist),col="red")
hoặc bằng số.
# Compute empirical cumulative distribution
nn.sim.ecdf = ecdf(nn.sim)
# See how the original stat compares to the simulated distribution
nn.sim.ecdf(mean(nncross(split(P)$A,split(P)$B)$dist))
Lưu ý rằng thống kê hàng xóm trung bình gần nhất có thể không phải là thước đo thống kê tốt nhất cho vấn đề của bạn. Các số liệu thống kê như hàm K có thể rõ ràng hơn (xem câu trả lời của người đánh bóng).
Những điều trên có thể dễ dàng thực hiện bên trong ArcGIS bằng Modelbuilder. Trong một vòng lặp, gán lại ngẫu nhiên các giá trị thuộc tính cho từng điểm sau đó tính toán thống kê không gian. Bạn sẽ có thể kiểm đếm kết quả trong một bảng.
spatstat
gói.
Bạn có thể muốn kiểm tra CrimeStat.
Theo trang web:
CrimeStat là một chương trình thống kê không gian để phân tích các địa điểm xảy ra sự cố tội phạm, được phát triển bởi Ned Levine & Associates, được tài trợ bởi các khoản tài trợ từ Viện Tư pháp Quốc gia (tài trợ 1997-IJ-CX-0040, 1999-IJ-CX-0044, 2002-IJ-CX-0007 và 2005-IJ-CX-K037). Chương trình này dựa trên Windows và giao diện với hầu hết các chương trình GIS trên máy tính để bàn. Mục đích là để cung cấp các công cụ thống kê bổ sung để hỗ trợ các cơ quan thực thi pháp luật và các nhà nghiên cứu tư pháp hình sự trong các nỗ lực lập bản đồ tội phạm của họ. CrimeStat đang được sử dụng bởi nhiều sở cảnh sát trên thế giới cũng như công lý hình sự và các nhà nghiên cứu khác. Phiên bản mới nhất là 3.3 (CrimeStat III).
Một cách tiếp cận đơn giản và nhanh chóng có thể là tạo ra các bản đồ nhiệt và bản đồ khác biệt của hai bản đồ nhiệt đó. Liên quan: Làm thế nào để xây dựng bản đồ nhiệt hiệu quả?
Giả sử bạn đã xem xét tài liệu về tương quan tự động không gian. ArcGIS có nhiều công cụ điểm và nhấp khác nhau để thực hiện điều này cho bạn thông qua các tập lệnh Hộp công cụ: Công cụ thống kê không gian -> Phân tích mẫu .
Bạn có thể làm việc ngược - Tìm một công cụ và xem xét thuật toán được triển khai để xem liệu nó có hợp với kịch bản của bạn không. Thỉnh thoảng tôi đã sử dụng Moran's Index trong khi điều tra mối quan hệ không gian trong sự xuất hiện của khoáng chất đất.
Bạn có thể chạy phân tích tương quan bivariate trong nhiều phần mềm thống kê để xác định mức độ tương quan thống kê giữa hai biến và mức ý nghĩa. Sau đó, bạn có thể sao lưu các kết quả thống kê của mình bằng cách ánh xạ một biến bằng sơ đồ chloropleth và biến còn lại sử dụng các ký hiệu chia độ. Sau khi phủ, bạn có thể xác định khu vực nào hiển thị các mối quan hệ không gian cao / cao, cao / thấp và thấp / thấp. Bài trình bày này có một số ví dụ tốt.
Bạn cũng có thể thử một số phần mềm geovisualization độc đáo. Tôi thực sự thích CommonGIS cho loại hình ảnh này. Bạn có thể chọn một vùng lân cận (ví dụ của bạn) và tất cả các số liệu thống kê và lô hữu ích sẽ có sẵn cho bạn ngay lập tức. Nó làm cho việc phân tích các bản đồ đa biến khá dễ dàng.
Một phân tích ô tiêu chuẩn sẽ là tuyệt vời cho việc này. Đó là một cách tiếp cận GIS có thể làm nổi bật và so sánh các mô hình không gian của các lớp dữ liệu điểm khác nhau.
Một phác thảo của phân tích ô tiêu chuẩn định lượng các mối quan hệ không gian giữa các lớp dữ liệu điểm có thể được tìm thấy tại http://www.nccu.edu/academics/sc/artsandscatics/geospatialscience/_document/se_daag_poster.pdf .