Đo lường sự khác biệt hiệu suất giữa Hợp nhất và Nối trong Máy tính để bàn ArcGIS?


12

Thường thì tôi thấy mình trong một tình huống mà tôi không quan tâm liệu công cụ của mình có tạo ra một lớp tính năng mới hay không, nhưng tôi quan tâm mất bao lâu để kết hợp tất cả các bộ dữ liệu lớn của mình. Có phải mất nhiều thời gian hơn để tạo ra một lớp tính năng mới bằng cách sử dụng công cụ Hợp nhất thay vì công cụ Nối thêm hoặc Hợp nhất và Nối cơ bản giống nhau về hiệu suất?


2
Một số bằng chứng giai thoại: Tôi luôn thấy Hợp nhất nhanh hơn, đặc biệt là khi xử lý một lượng lớn các tính năng.
Devdatta Tengshe

nhưng chắp thêm hoạt động tốt nhất khi bạn có tên miền và kiểu con được xác định trước.
Mapperz

Câu trả lời:


6

Hợp nhất lấy cả hình học và thuộc tính và kết hợp (hợp nhất) toàn bộ tập dữ liệu thành tập dữ liệu tính năng mới. nhập mô tả hình ảnh ở đây

Nối thêm là cách tốt để nối dữ liệu bổ sung vào bộ dữ liệu hiện có - nó có thể có các tùy chọn để kiểm soát các kiểu con của các tính năng được nối thêm.

http://resource.arcgis.com/en/help/main/10.1/index.html#//001700000055000000

Sự khác biệt chính là

Nếu loại Schema TEST được chỉ định, lược đồ (định nghĩa trường) của bộ dữ liệu đầu vào phải khớp với dữ liệu của bộ dữ liệu đích để các tính năng được thêm vào. Nếu Loại lược đồ NO_TEST được chỉ định, lược đồ tập dữ liệu đầu vào (định nghĩa trường) không phải khớp với tập dữ liệu đích. Tuy nhiên, bất kỳ trường nào từ bộ dữ liệu đầu vào không khớp với các trường của bộ dữ liệu đích sẽ không được ánh xạ tới tập dữ liệu đích trừ khi ánh xạ được đặt rõ ràng trong điều khiển Bản đồ trường.

kiểu con (Tùy chọn) Mô tả kiểu con để gán kiểu con đó cho tất cả dữ liệu mới được thêm vào tập dữ liệu đích.

http://resource.arcgis.com/en/help/main/10.1/index.html#//001700000050000000

nhập mô tả hình ảnh ở đây

Bạn có thể quan tâm đến 'Xử lý lát dữ liệu lớn'

http://resource.arcgis.com/en/help/main/10.1/index.html#//01m10000000r000000


1
Tôi nhận thức được sự khác biệt giữa các công cụ, nhưng tôi tự hỏi liệu những khác biệt này có dẫn đến sự khác biệt đáng kể về thời gian xử lý hay không. Tôi thường sử dụng NO_TEST khi sử dụng công cụ chắp thêm vì tôi đảm bảo rằng các định nghĩa trường của tôi khớp với trước khi nối / hợp nhất.
MTerry

5

Lấy câu trả lời này dựa trên chính các công cụ chứ không phải điểm chuẩn thực tế:

Công cụ hợp nhất tạo ra một lớp tính năng mới, cần có thời gian, trước khi nó kết hợp hai bộ dữ liệu lại với nhau.

Công cụ chắp thêm với tùy chọn TEST giả định rằng cả hai bộ dữ liệu có cùng một trường (tên trường) và nhồi nhét chúng với nhau mà không phải tạo một lớp tính năng mới (âm thanh nhanh hơn).

Công cụ chắp thêm với tùy chọn NO TEST cho phép ánh xạ trường kết hợp như các lớp đối tượng có thể có các tên trường khác nhau. Điều này đòi hỏi một số hậu trường thử nghiệm có điều kiện, sẽ mất nhiều thời gian hơn.

Khi kích thước của tập dữ liệu tăng lên, lượng thời gian cần thiết để tạo một fc mới dường như không đáng kể. Cách duy nhất để biết chắc chắn sẽ là thực hiện một số điểm chuẩn với bộ dữ liệu lớn của bạn và đăng câu trả lời tại đây!

Tôi nghi ngờ sự khác biệt không phải là nhiều hơn về những gì bạn muốn từ công cụ cuối cùng (ánh xạ trường so với lớp tính năng mới so với không có lớp tính năng mới)


0

Tôi chỉ chạy cả ba biến thể. Tôi luôn luôn kết hợp 63 shapefiles giống nhau. Mỗi shapefile chứa khoảng 63000 điểm được tạo từ thao tác RasterToPoint. Tất cả các shapefile có cùng bảng thuộc tính.

Các biến thể khác nhau cần các lần sau để biên dịch:

  • Hợp nhất: 13 phút 57 giây
  • Nối với TEST: 8 phút 34 giây
  • Nối với NO_TEST: 9 phút 12 giây

Có vẻ như Nối với TEST làm tham số đầu vào là nhanh nhất. Rõ ràng việc lựa chọn sử dụng Append nào không phụ thuộc vào tốc độ mà phụ thuộc vào các tệp đầu vào của bạn như được giải thích ở trên.

Hy vọng nó hữu ích.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.