Ước tính độ phân giải của dữ liệu vectơ?


8

Tôi có một bộ dữ liệu vector cũ với các đa giác bao phủ một lục địa. Dữ liệu được công bố lần đầu tiên trên giấy ở tỷ lệ 1: 5 000 000 và sau đó được số hóa. Tôi không có dữ liệu gốc và không có thông tin về vector hóa hoặc bất kỳ siêu dữ liệu nào. Tôi đoán rằng khoảng cách giữa các đỉnh chứ không phải độ chính xác giới hạn độ phân giải.

Các đỉnh được lưu với độ phân giải cao (ví dụ: "nnn.nnnnnnnnn", "- nn.nnnnnnnnn"). Tập dữ liệu có một vài điểm có thể được tham chiếu địa lý hoặc bất kỳ nút nào được xác định là tọa độ (ví dụ: ở các mức độ chẵn hoặc UTM). Khi tôi so sánh một số đoạn bờ biển, lỗi lên tới +/- 20km.

Tôi muốn tìm một công thức để ước tính sai số tối đa dựa trên sự phân bố các đỉnh. Tôi có quyền truy cập vào bất kỳ ứng dụng GIS nào nhưng muốn tham khảo thống kê mạnh mẽ.

Làm cách nào để tính toán sai số tối đa của tập dữ liệu, giả sử rằng tất cả các đỉnh đều đúng? Hoặc diễn đạt khác nhau: Tôi có thể sử dụng phương pháp nào để tìm độ phân giải lớn nhất của tập dữ liệu?

Tôi đã cố gắng rasterize bộ dữ liệu ở các kích thước ô khác nhau và sau đó ghép nó thành một kích thước ô nhỏ để phát hiện rasterizing nhỏ nhất có thể mà không mất độ phân giải, nhưng điều đó khá tốn thời gian và không phải là phương pháp toán học.


Tôi sẽ nói rằng ít nhất các đỉnh chỉ có thể chính xác đến 0,1 mm trên giấy có nghĩa là 500 m ở tỷ lệ 1: 500000. Ở trên có thể rất khó để nói ảnh hưởng của đơn giản hóa và các yếu tố khác là gì, đặc biệt là nếu bản đồ gốc được vẽ bằng tay.
dùng49584

Vâng, đó sẽ là trường hợp tốt nhất. Thật không may, tôi nghĩ rằng độ phân giải hữu ích của tôi thấp hơn nhiều vì các đa giác có các đỉnh khá thưa thớt và có vẻ góc cạnh hơn tôi mong đợi từ dữ liệu tự nhiên, ví dụ như khí tượng học. Tôi cũng không có quyền truy cập vào các bản đồ gốc, tôi nên đề cập.
Tactopoda

1
@ user30184 0.1 mm khá lạc quan, tôi muốn có 0,3 mm
radouxju

Và blog này coi 1 mm là kích thước nhỏ nhất có thể phát hiện được blog.esri.com/esri/arcgis/2010/12/12/ . Nó có nghĩa là 5000 m ở tỷ lệ 1: 5000000 (Tôi đã bỏ một số không từ nhận xét của tôi ở trên khi viết).
dùng49584

Câu trả lời:


2

Câu hỏi tuyệt vời - Tôi đã thấy loại câu hỏi này xuất hiện nhiều lần và thật không may, nhiều người thực hiện phân tích GIS định lượng đã bỏ qua thành phần TIÊU CHUẨN để tính toán độ không đảm bảo trong các bộ dữ liệu không gian. Có những khái niệm và thuật ngữ quan trọng cần được làm rõ trước khi loại nhiệm vụ này có thể được đưa vào kết quả định lượng.

Tính toán lỗi trong bộ dữ liệu không gian giả định kiến ​​thức trước về dòng dữ liệu. Vì siêu dữ liệu không có sẵn từ bất kỳ bước nào của quy trình, loại định lượng này là không thể. Độ chính xác của tọa độ trong bộ dữ liệu vectơ không đảm bảo cho rằng dữ liệu đó chính xác ở bất kỳ mức độ nào. Rasterising một bộ dữ liệu sẽ kế thừa mức độ lỗi và sự không chắc chắn của chính nó trong dữ liệu.

Nếu không có siêu dữ liệu và tính toán liên tục về lỗi và độ không chắc chắn, bộ dữ liệu có thể được coi là một bức tranh đẹp. Mặc dù có vẻ như là một quy trình đơn giản để sử dụng tỷ lệ của bản đồ gốc và bản chất chính xác của tọa độ đa giác vector, các khái niệm cơ bản về địa lý sẽ bị vi phạm nếu lỗi và độ không đảm bảo không được tính ở mỗi bước tạo dữ liệu từ:

  1. bản gốc của bộ dữ liệu (lỗi và không chắc chắn được giới thiệu)
  2. tạo bản đồ giấy (khái quát hóa được thực hiện)
  3. số hóa bản đồ giấy sang tệp vectơ kỹ thuật số (nhiều lỗi hơn, không chắc chắn hơn)

Mặc dù đây có thể không phải là câu trả lời mà bạn đang tìm kiếm, nhưng đây là một nơi tốt để bắt đầu cho bất cứ ai trong tình huống tương tự:

  • Nếu bạn có nhiệm vụ tính toán độ chính xác định lượng của độ không đảm bảo của mô hình không gian, tôi khuyên bạn nên nghiên cứu chủ đề về độ không chắc chắn và lan truyền lỗi trong dữ liệu không gian, vì chủ đề này có chiều sâu, toán học và thống kê dày đặc.

  • Nếu bạn đang sử dụng tập dữ liệu như một bức tranh đẹp, thì hãy bắt đầu ánh xạ.


0

Tôi đồng ý với Alex, vì không có siêu dữ liệu nào khả dụng và dòng dữ liệu được đặt không xác định, nên việc đánh giá lỗi là khó khăn. Lỗi nên được định lượng tại vị trí đã biết chính xác nếu tồn tại trong phạm vi hte của tập dữ liệu.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.