Cách dễ nhất để thực hiện mã địa lý khối lượng một lần là gì? (580.000 địa chỉ tại Hoa Kỳ)


13

Tôi đang làm việc trong một dự án liên quan đến công dân và tôi cần có thể hiển thị tất cả các tài sản trong Thành phố Philadelphia trên bản đồ, vì vậy tôi sẽ cần lấy vĩ độ & kinh độ cho tất cả 580.000 khách sạn. (Chỉ một lần)

Hầu hết các API như Google / Yahoo có giới hạn 5.000 mỗi ngày và thậm chí BatchGeo cũng có giới hạn tương tự.

Có cách nào để tôi có thể thực hiện mã hóa địa lý một lần cho tất cả các địa chỉ này không?


4
Cách dễ nhất là tìm một nhà cung cấp thương mại tốt.
Matthew Snape

1
Yêu tên người dùng của bạn!
nmpeterson

Câu trả lời:


14

Bạn có thể thử công cụ Địa chỉ đường để tọa độ từ Bộ công cụ khoa học dữ liệu.

This API takes either a single string representing a postal address, or a JSON-encoded  
array of addresses, and returns a JSON object with a key for every address. The value 
for each key is either null if no information was found for the address, or an object 
containing location information, including country, region, city and latitude/longitude 
coordinates. Here's an example:

Không chắc chắn giới hạn API là gì đối với bản sao được lưu trữ của Pete Warden nhưng bạn có thể tự chạy bộ công cụ và xử lý ngoại tuyến như @Devdatta gợi ý. Có một máy ảo có thể tải xuống được chứa tất cả các công cụ trong trang web. Chúc may mắn :)


Cảm ơn rất nhiều! Tôi sẽ thử nó và cho bạn biết nếu nó hoạt động.
Tobias Fünke

Nó hoạt động rất tốt cho đến nay! Tôi đang chạy VM nên hy vọng không có giới hạn. Nó đang lấy từ cơ sở dữ liệu cục bộ hay nó đang kiểm tra một số API web?
Tobias Fünke

1
VM sử dụng đi kèm với một cơ sở dữ liệu về địa điểm nên vâng, không có giới hạn. Bảo hiểm rất tốt cho Hoa Kỳ nếu tôi không nhầm. Bạn có thể chơi xung quanh với nguồn nếu bạn quan tâm :) github.com/petewarden/dstkgithub.com/petewarden/dstkdata
RK

1
Phải mất tám ngày
Tobias Fünke

1
Cảm ơn bạn đã tham khảo @RK Tôi tự hỏi tại sao datasciencetoolkit không phổ biến hơn. Họ đã không đến trong nghiên cứu của tôi vài ngày qua, phải đào sâu hơn. Chúc mừng!
dchhetri

3

Với lượng dữ liệu này, tôi sẽ đề nghị bạn thực hiện mã hóa địa lý ngoại tuyến. Chỉ cần các yêu cầu http cho nhiều bản ghi này sẽ được phân loại là một cuộc tấn công DoS bởi bất kỳ máy chủ nào.


4
Không hoàn toàn đúng. Nếu bạn sử dụng một dịch vụ được thiết kế để xử lý nhiều yêu cầu mã hóa địa lý thì đó sẽ không phải là vấn đề. API LiveAddress có thể dễ dàng xử lý 1000 yêu cầu địa chỉ mỗi giây. Điều đó sẽ hạ gục 598k trong khoảng 10 phút. (Tôi làm việc tại xác minh địa chỉ và mã hóa địa lý cả ngày - Tôi làm việc tại SmartyStreets)
Jeffrey

3

Mã hóa địa lý sẽ dẫn đến điểm - 580.000 trong số họ. Bạn có chắc chắn muốn hiển thị tất cả chúng trên bản đồ? Vì vậy, nhiều điểm nhóm có thể sẽ làm cho bản đồ không thể đọc được. Những vấn đề này giả định rằng bạn tìm một cách để mã hóa địa lý rất nhiều hồ sơ.

Hồ sơ bưu kiện của Thành phố Philadelphia có sẵn dưới dạng một lớp đa giác. Hơn nữa, những đa giác đã có sẵn như là một dịch vụ bản đồ. Nếu dữ liệu / dịch vụ phù hợp với nhu cầu của bạn thì bạn không phải lo lắng về mã hóa địa lý rất nhiều điểm và đa giác rất có thể sẽ trông tốt hơn rất nhiều điểm trên bản đồ.

Thông tin về dữ liệu (bao gồm siêu dữ liệu và tải xuống) và dịch vụ bản đồ:

http://www.pasda.psu.edu/uci/MapService.aspx?Dataset=462

Xem trước dịch vụ bản đồ (phóng to để xem tốt hơn)

http://maps.psiee.psu.edu/preview/map.ashx?layer=462



2

Bạn có thể thử Geocoda: https://geocoda.com cho API JSON. Geocoda có API cho phép bạn nhận lat / lon cho một địa chỉ, phù hợp với yêu cầu của bạn. Geocoda không có giới hạn truy vấn hàng ngày, nhưng có giới hạn tài khoản ban đầu là 10 truy vấn mỗi giây.

Tuyên bố miễn trừ trách nhiệm: Tôi làm việc tại Geocoda. Hãy cho tôi biết nếu bạn muốn bất kỳ trợ giúp nào bắt đầu hoặc nếu bạn muốn xem trước API hàng loạt của chúng tôi.


1

Bạn có thể dùng thử SVB Mapper có thể tải xuống từ đây và hoạt động rất tốt với Excel và Bing Maps. Bạn có thể chạy ánh xạ và phân tích ngay trong Excel. Bạn có thể phải kiểm tra hạn ngạch và giới hạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.