Tôi có danh sách với vài triệu tên địa điểm đến từ hồ sơ Flickr. Người dùng đã cung cấp các dấu vị trí này dưới dạng văn bản miễn phí, vì vậy chúng trông như thế này:
Roma, Italy
Kennesaw, USA
Saginaw, MI
Rucker, Missouri, USA
Melbourne, Australia
Madrid, Spain
live in Sarnia / work in London, Canada
Valladolid, España
Italia
West Hollywood, United States
Tôi muốn định hướng những tên địa danh này. Tôi biết rằng trong một số trường hợp không có giải pháp đơn giản nào, nhưng tôi sẵn sàng sống với một số định kiến sai và với "không có câu trả lời" cho một số nơi. Nếu một tên địa điểm tương ứng với tên của nhiều thành phố, thì tôi muốn gán địa điểm đó cho thành phố lớn nhất mà nó tương ứng.
Api công cụ tìm địa điểm của Yahoo sẽ là một giải pháp tốt cho vấn đề này, nhưng tôi sẽ cần thực hiện quá nhiều lệnh gọi API để vượt qua danh sách của mình, vì vậy tôi muốn một giải pháp cục bộ (nghĩa là một giải pháp không phụ thuộc vào api từ xa) . Có ai biết bất kỳ thư viện python nào làm điều này, hoặc bất kỳ giải pháp địa phương nào khác không?
(Tôi cũng đã hỏi câu hỏi này trên stackoverflow .)