Chất lượng mã hóa địa lý: Nominatim so với PostGIS Geocoder so với Geocoder :: US 2.0


14

Thỉnh thoảng tôi cần mã hóa địa lý >> 500.000 địa chỉ đường phố Hoa Kỳ (không có tính năng hoặc giao lộ). Tôi muốn thiết lập một dịch vụ mã hóa địa phương để xử lý các mã địa lý số lượng lớn này.

Trước đây, tôi đã sử dụng Geocoder dựa trên Tiger :: US 2.0 cục bộ. Điểm chuẩn ban đầu mang lại độ chính xác hợp lý đối với các địa chỉ được mã hóa địa lý của Google, đặc biệt là khi tôi không dựa vào trình phân tích cú pháp Ruby và tôi chuyển các phần tử địa chỉ cho trình mã hóa địa lý một cách rõ ràng.

Tôi cũng đã đọc rất nhiều về Bộ mã hóa địa lý PostGIS . Vì dữ liệu của tôi đã có trong PostGIS, điều này nghe có vẻ hấp dẫn, nhưng tôi đã không thiết lập nó cục bộ để dùng thử.

Ngoài ra, một số người khuyên tôi nên thử Nominatim tại địa phương. Tôi không biết nhiều về điều đó ngoại trừ việc nó không dựa trên Tiger (theo như tôi có thể nói), và tôi tự hỏi liệu tôi có nhận được kết quả đáng tin cậy hơn không.

Câu hỏi của tôi cho bất cứ ai có kinh nghiệm với các giải pháp trên: Làm thế nào để độ chính xác của ba so sánh? Cụ thể, nơi cung cấp mã địa lý đáng tin cậy nhất cho các địa chỉ đường phố Hoa Kỳ? Tôi không quá quan tâm đến tốc độ hoặc thiết lập sự phức tạp.

Câu trả lời:


14

Tôi chưa có cơ hội thử nghiệm bộ mã hóa địa lý Nominatim và Geocoder US. Mặc dù vậy, tôi hiểu rằng Geocoder và Nominatim không thể chạy trực tiếp trong cơ sở dữ liệu, điều này đối với tôi là một bất lợi lớn vì nó khiến chúng khó sử dụng trong những thứ như kích hoạt hoặc cập nhật hàng loạt trực tiếp trong cơ sở dữ liệu.

Bộ mã hóa địa lý PostGIS là một tập hợp các hàm plpgsql thuần túy của PostGIS / postgresql, chạy hoàn toàn trong cơ sở dữ liệu. Tôi hy vọng các kết quả của trình mã hóa địa lý US và PostGIS sẽ ngang bằng và từ những gì tôi đã kiểm tra bằng cách sử dụng công cụ web. Google tốt hơn một chút vì họ tận dụng tên địa điểm.

Tôi nghĩ rằng Nominatum vì nó sử dụng dữ liệu OSM gián tiếp sử dụng dữ liệu hổ vì nhập OSM cho Hoa Kỳ phần lớn đến từ TIGER với sự điều chỉnh do người dùng đóng góp. Tôi không chắc chắn những gì cổ điển (năm) của Tiger OSM hiện đang trên. Từ việc chơi với các giao diện web trực tuyến, nó cũng tận dụng tên địa điểm và có một điểm thú vị ở chỗ nó cho phép bạn chỉ định mức thu phóng của mã hóa địa lý cho phép mã hóa địa lý nhanh hơn bằng cách đặt độ chính xác thu phóng bạn cần.

Tiết lộ đầy đủ - Tôi đã thực hiện rất nhiều công việc trên PostGIS Geocoder và đã viết hướng dẫn trực tuyến cho nó. Tôi sẽ nói với bạn một lỗi tôi đang làm là tôi nghĩ rằng vị trí của điểm mà nó nội suy nằm ở phía bên trái của đường phố. Tôi đang làm việc để sửa nó. Nếu bạn có thể quan tâm ít hơn về phía nào của đường phố (hoặc ít nhất là đôi khi), thì đó có thể là một vấn đề không phải là vấn đề với bạn.

Có thể có giá trị trong khi thử nghiệm với các phiên bản trực tuyến so sánh một số kết quả địa chỉ: ví dụ: nomatim bạn có thể kiểm tra tại đây: http://open.mapquestapi.com/nominatim/v1/search.php

Đối với các trường hợp sử dụng của tôi, tôi đã thấy việc kiểm tra mờ của nomatum không tốt như những gì GeGoder PostGIS có. Ví dụ: địa chỉ đường phố phù phiếm của tôi (địa chỉ gửi thư) là 1 Devonshire Place, Boston MA. PostGIS trả lời câu trả lời gần giống như tôi nhớ, Google trả lời câu trả lời, nhưng tôi không thể khiến Nominatim trả lời câu trả lời. Để công bằng, ngay cả hồ sơ bưu kiện Boston cũng không có manh mối về việc này và được liệt kê trong hồ sơ bưu kiện là đường washington. PostGIS có thể tìm thấy nó vì nó thực hiện nhiều cấp độ kiểm tra và giao lộ khác nhau, v.v. Tôi đã kiểm tra các trường hợp khác khi tôi cố tình nhập sai zip hoặc một cái gì đó và PostGIS quay lại với một bộ tùy chọn chính xác. Google cũng vậy.


Nhận xét bổ sung: Có thể có giá trị trong khi thử nghiệm với các phiên bản trực tuyến so sánh một số kết quả địa chỉ: ví dụ: nomatim
LR1234567 18/03/2016

Cảm ơn vì sự trả lời! Tôi sẽ thực hiện một số điểm chuẩn trong tuần tới hoặc lâu hơn, nhưng tôi đã rất ấn tượng với bộ mã hóa PostGIS Tiger cho đến nay.
danpelota

Cản trở việc gác máy thỉnh thoảng cho một newbie, tất nhiên: postgis.refractions.net/pipermail/postgis-users/2011-March/...
danpelota

tigergeocoder.com sử dụng dữ liệu TIGER 2013, sẵn sàng chạy phiên bản máy chủ của riêng bạn trong đám mây Amazon EC2 và mã địa lý 1.000.000+ mỗi ngày. PostGIS như bạn đã đề cập, cũng đã tải Zvel Vùng lân cận và trả về mã Trin cho các phần địa chỉ. API REST tương tự như Google nhưng máy chủ của riêng bạn, không cần hạn ngạch.
Biba

Nominatim chạy nhanh và có xu hướng chính xác hơn vào năm 2019, dữ liệu hổ trước mới. Nó không ước tính các khu vực và đoán địa chỉ chỉ là tốt hơn.
Andrew Scott Evans

-1

Về mặt kỹ thuật, bạn có thể xếp các cơ sở dữ liệu Tiger và OSM vào một máy chủ khổng lồ và xây dựng chúng bên trong Nominatum OSM. Tiger có thể được nhập dễ dàng và nó bổ sung cho máy chủ OSM.

Bất cứ ai, chất lượng của dữ liệu bạn sẽ nhận được sẽ không phải là trên sân thượng. OSM thiếu độ chính xác cho các địa chỉ đường phố ở Mỹ. Trong một số trường hợp tôi đã thấy nó như xa như 90 dặm từ mục tiêu ban đầu.

Cơ sở dữ liệu Tiger cũng không chính xác do thuật toán nội suy được gán cho nó để dự đoán vị trí số đường phố. Nói chung họ sẽ bù đắp những mục tiêu thực tế từ 300 feet đến vài dặm.

Tôi nghĩ bạn cần đánh giá thời gian và lưu trữ tài nguyên nếu xây dựng trình mã hóa địa lý riêng so với sử dụng tài nguyên thương mại. Với một thương mại, bạn sẽ có được vị trí trên sân thượng và không phải lo lắng về bất cứ điều gì. Giá 500k sẽ vào khoảng $ 600 đến $ 800 với các nhà cung cấp khác nhau.


2
Câu trả lời của bạn có liên quan gì đến công ty của bạn? Có vẻ như bạn đang bao gồm một chữ ký có liên kết đến trang web của bạn trong trường hợp, trong trường hợp này, từ chối trách nhiệm không cần thiết, và vì vậy tôi đang chỉnh sửa nó. Trong mọi trường hợp xin vui lòng không bao gồm một liên kết trong bất kỳ từ chối trách nhiệm.
PolyGeo
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.