Tôi có một bộ dữ liệu vector cũ với các đa giác bao phủ một lục địa. Dữ liệu được công bố lần đầu tiên trên giấy ở tỷ lệ 1: 5 000 000 và sau đó được số hóa. Tôi không có dữ liệu gốc và không có thông tin về vector hóa hoặc bất kỳ siêu dữ liệu nào. Tôi đoán rằng khoảng cách giữa các đỉnh chứ không phải độ chính xác giới hạn độ phân giải.
Các đỉnh được lưu với độ phân giải cao (ví dụ: "nnn.nnnnnnnnn", "- nn.nnnnnnnnn"). Tập dữ liệu có một vài điểm có thể được tham chiếu địa lý hoặc bất kỳ nút nào được xác định là tọa độ (ví dụ: ở các mức độ chẵn hoặc UTM). Khi tôi so sánh một số đoạn bờ biển, lỗi lên tới +/- 20km.
Tôi muốn tìm một công thức để ước tính sai số tối đa dựa trên sự phân bố các đỉnh. Tôi có quyền truy cập vào bất kỳ ứng dụng GIS nào nhưng muốn tham khảo thống kê mạnh mẽ.
Làm cách nào để tính toán sai số tối đa của tập dữ liệu, giả sử rằng tất cả các đỉnh đều đúng? Hoặc diễn đạt khác nhau: Tôi có thể sử dụng phương pháp nào để tìm độ phân giải lớn nhất của tập dữ liệu?
Tôi đã cố gắng rasterize bộ dữ liệu ở các kích thước ô khác nhau và sau đó ghép nó thành một kích thước ô nhỏ để phát hiện rasterizing nhỏ nhất có thể mà không mất độ phân giải, nhưng điều đó khá tốn thời gian và không phải là phương pháp toán học.