Câu trả lời này mô tả một phương pháp khách quan để đo lường sự khác biệt tùy ý giữa hai bộ dữ liệu không gian. Sự khác biệt như vậy có thể bao gồm thay đổi vị trí, thay đổi hình dạng và các tính năng có trong một tập dữ liệu nhưng không có trong một tập dữ liệu khác. Câu trả lời này không cung cấp bất kỳ phương tiện nào để xác định cái nào là "tốt hơn", bởi vì điều đó phụ thuộc nhiều vào không chỉ dữ liệu và nó đặc biệt phụ thuộc vào dữ liệu sẽ được sử dụng cho mục đích gì.
Lý lịch
Một nền tảng tốt cho một tập hợp lớn các phép đo như vậy phụ thuộc vào biến đổi khoảng cách Euclide của mỗi tập dữ liệu. Điều này xem mỗi tập dữ liệu là đại diện cho một tập hợp các điểm trong mặt phẳng. Hãy gọi các bộ sưu tập B này cho các tính năng màu xanh và R cho các tính năng màu đỏ.
Đối với bất kỳ điểm x trong mặt phẳng, khoảng cách Euclide chuyển đổi của một tập điểm Một tính vĩ đại nhất dưới của khoảng cách giữa x và Một . Chúng tôi có thể nghĩ về điều này thay đổi khi tạo ra một "bề mặt" có chiều cao tại x bằng với khoảng cách ngắn nhất từ x để A . Như vậy bề mặt này có các thung lũng ở tất cả các điểm A , nơi mà chiều cao của nó là không, và tăng ở tỷ lệ 1: 1 dốc xa Một . Rõ ràng là biến đổi khoảng cách lần lượt xác định A (hoặc về mặt kỹ thuật đóng số liệu của nó , đối với các bộ dữ liệu GIS giống như A) là tập hợp tất cả các điểm ở độ cao bằng không. Do đó, biến đổi khoảng cách nắm bắt hoàn toàn tất cả thông tin không gian của A mà GIS có thể biểu diễn.
Hình này cho thấy các biến đổi khoảng cách của B (ở bên trái) và R (ở bên phải) trong giả phù điêu.
So sánh hai detsets
Để so sánh B và R , hãy chồng từng lớp với biến đổi khoảng cách của nhau:
Các giá trị khoảng cách được hiển thị dưới dạng màu được phân chia từ màu xanh lam (gần 0) đến màu đỏ.
Bản đồ trái, ví dụ, chương trình các điểm B và màu sắc họ theo khoảng cách của họ từ R . Vai trò của B và R được chuyển đổi trong bản đồ bên phải.
Những điều này đã giúp mắt trong việc so sánh: mỗi bản đồ hiển thị các điểm của một tập dữ liệu và, bằng cách sử dụng màu sắc, nhấn mạnh các điểm khác xa bất kỳ điểm nào trong tập dữ liệu khác. Lưu ý rằng cả hai bản đồ đều cần thiết để so sánh, vì mỗi bản đồ không hiển thị các điểm khác.
Trên bản đồ chi tiết, màu sắc có thể khó nhìn thấy, vì vậy chúng tôi có thể chọn làm mờ nó một chút để trình bày hoặc đánh giá trực quan:
Lưu ý: Màu sắc không thể so sánh giữa hai bản đồ: trong mỗi bản đồ, chúng được chia tỷ lệ để hiển thị toàn bộ khoảng cách trong bản đồ đó.
Phân tích thống kê về sự khác biệt
Vẻ đẹp của phương pháp này nằm ở những gì có thể được thực hiện trong quá trình xử lý hậu kỳ. Sử dụng raster để biểu diễn các biến đổi khoảng cách và lớp phủ của chúng, chúng ta có thể dễ dàng thu được số liệu thống kê - cục bộ và toàn cầu - để đo lường sự khác biệt. Chẳng hạn, chúng ta có thể tập trung vào tất cả các khoảng cách lớn hơn một số ngưỡng nhỏ để khám phá phân phối tần số của chúng:
Trong biểu đồ này, các thanh màu xanh dành cho các tính năng màu xanh, các thanh màu đỏ cho các tính năng màu đỏ. (Lưu ý thang đo logarit trên trục hoành.) Biểu đồ này hiển thị dữ liệu phủ ban đầu, không phải dữ liệu mờ đạo hàm. Nó chỉ chọn những khoảng cách lớn hơn ba pixel trong ảnh gốc.
Các biểu đồ này cho thấy nhiều khả năng các tính năng màu xanh nằm xa các tính năng màu đỏ hơn là ngược lại : các thanh màu xanh cao hơn màu đỏ và chúng mở rộng ra khoảng cách lớn hơn (ở bên phải). Toàn bộ kho thống kê mô tả hiện có sẵn để định lượng sự khác biệt giữa hai bộ dữ liệu. Các thống kê này có thể được áp dụng cho toàn bộ khu vực quan tâm hoặc "cửa sổ" trên đó để khám phá cách hai bộ dữ liệu khác nhau tùy theo vị trí.
Thực hiện
Hầu hết các GIS raster cung cấp một biến đổi khoảng cách Euclide (như EuclideanDistance trong ArcGIS và r.grow.distance trong GRASS), và tất cả đều hỗ trợ lớp phủ đơn giản (che lấp) cần thiết để thực hiện phân tích này. Làm mờ, nếu muốn, có thể được thực hiện với trung bình lân cận hoặc tích chập hạt nhân (bao gồm "độ mờ Gaussian" có sẵn trong tất cả các phần mềm xử lý ảnh). Hầu hết GISes làm không cung cấp hỗ trợ đầy đủ cho việc phân tích thống kê đầy đủ các dữ liệu raster, mặc dù, nhưng họ rất giỏi trong việc xuất khẩu dữ liệu đó trong các định dạng có thể đọc được bằng phần mềm thống kê và toán học như R
hoặc Mathematica (khiến tất cả các con số ở đây).