Được:
- một cơ sở dữ liệu địa lý A chứa 100 bộ dữ liệu được đặt tên là 1 .. một 100
- một cơ sở dữ liệu địa lý B chứa 100 bộ dữ liệu có tên b 1 .. b 100
Tôi muốn xác định theo chương trình (*) cho mỗi cặp dữ liệu ( a i , b i ) xem chúng có nội dung giống hệt nhau không. Vì tôi đang so sánh 100 cặp, tôi cần một phương pháp so sánh hiệu quả. Lý tưởng nhất là toàn bộ so sánh sẽ chỉ mất vài giây.
(*) Lưu ý: Tôi đề cập đến thuật ngữ "lập trình", không phải vì tôi đang tìm kiếm các ví dụ mã (mặc dù tôi sẵn sàng chấp nhận chúng), nhưng để nhấn mạnh rằng tôi đang tìm kiếm một phương pháp so sánh rất nhanh, sẽ không bao giờ có thể khi so sánh 100 cặp dữ liệu bằng tay.
Tôi đang lên kế hoạch tự thực hiện phương pháp so sánh này, vì vậy điều tôi thực sự tìm kiếm là một thuật toán chứ không phải là một công cụ sẵn sàng sử dụng (trừ khi có lẽ khi nó là nguồn mở).
Tôi biết rằng tôi có thể yêu cầu điều không thể, vì điều này sẽ yêu cầu so sánh nội dung hoàn chỉnh của bộ dữ liệu (có lẽ với các công cụ trong Bộ công cụ quản lý dữ liệu → So sánh dữ liệu ); hoặc ít nhất là so sánh giá trị băm / dữ liệu, nhưng việc tạo ra các bản tóm tắt cũng sẽ yêu cầu phải đi qua tất cả dữ liệu của bộ dữ liệu trước tiên.
Vì vậy, cách tiếp cận tốt nhất của tôi cho đến nay là:
Trước tiên hãy xác định cặp dữ liệu nào ( a i , b i ) có thể có nội dung giống hệt nhau.
Thực hiện so sánh dữ liệu đầy đủ chỉ cho các cặp dữ liệu còn lại.
Những câu hỏi của tôi:
ArcGIS có xảy ra để tự động tính toán một số loại dữ liệu mà tôi có thể truy vấn không? Nếu vậy thì thế nào?
(Tôi không biết bất cứ điều gì thuộc loại đó, vì vậy tôi mong câu trả lời là "không". Vui lòng chứng minh tôi sai.)
Một số cách rất hiệu quả, đáng tin cậy để xác định xem hai bộ dữ liệu có thể có nội dung giống hệt nhau không?
.