Tạo dịch vụ web mã hóa / gazetteer?


14

Tôi muốn viết một dịch vụ web mã hóa địa lý cho phả hệ trong Java. Bởi vì nó là dành cho phả hệ, tôi không cần phải xuống cấp đường phố. Tôi chỉ cần xuống quận.

Nhìn vào dữ liệu phả hệ, tên sai chính tả là rất phổ biến. Mọi người cũng sử dụng rất nhiều chữ viết tắt không chuẩn. Ví dụ, Hạt Baltimore có thể trông giống như:

  1. Baltimore
  2. Hạt Baltimore
  3. Công ty TNHH
  4. Baltimore Cty

Câu trả lời:


10

Tôi không nghĩ câu hỏi này rõ ràng là theo địa lý, bởi vì bạn chỉ quan tâm đến tên, vì vậy bạn có thể muốn hỏi nó trên Stack Overflow . Bạn có thể trả lời câu hỏi của mình bằng hai mẩu thông tin: tiểu bang và tên quận được sửa. Để thực hiện chỉnh sửa, bạn có thể muốn sử dụng khoảng cách Levenshtein ( ví dụ & triển khai java ) để khớp dữ liệu mờ với các giá trị được sửa.


+1 Điều đó có lẽ đúng. Levenshtein có vẻ là một nơi tốt để bắt đầu và có vẻ như Postgres thậm chí còn hỗ trợ nó. Cảm ơn.
Jay Askren

Tôi nghĩ rằng việc kết hợp khoảng cách Levenshtein với dữ liệu từ Geonames ( geonames.org ) có thể phù hợp với tôi. Cảm ơn.
Jay Askren

5

Dịch vụ mã hóa địa lý cần dữ liệu hình học địa lý, bộ công cụ liên quan (để xử lý các lựa chọn thay thế tên và tên) và giao diện người dùng (để làm trung gian tìm kiếm). Đối với trình mã hóa địa lý đảo ngược, bạn sẽ cần thêm trình xác nhận cấu trúc liên kết. Đối với Java, Bộ cấu trúc liên kết JTS mã nguồn mở sẽ là lựa chọn tự nhiên: http://www.vividsolutions.com/jts/jtshome.htmlm

Hình học của quận tại Hoa Kỳ có thể được tìm thấy tại Điều tra dân số: http://www.cencies.gov/geo/www/cob/co2000.html

Để bắt đầu trên công báo, Hội đồng Tên địa lý Hoa Kỳ có cơ sở dữ liệu: http://geonames.usgs.gov/

Tạo một cơ sở dữ liệu gazetteer vững chắc và các thuật toán dệt chấp nhận các kết quả tìm kiếm gần đúng là phần khó khăn.


Các thuật toán là những gì tôi đang tìm kiếm.
Jay Askren

Thắc mắc về thuật toán tương tự ngữ nghĩa có thể có nhiều người trả lời trên trang web stackoverflow chính.
glennon


1

Google có một API đẹp cho mã hóa địa lý , nếu bạn có thể tuân theo các điều khoản dịch vụ của họ. Bản demo cơ bản có thể được tìm thấy ở đây .

Sử dụng dịch vụ của họ phải chịu một số hạn chế, nhưng kết quả là trực quan, nhanh chóng, chính xác và quen thuộc với hầu hết người dùng. Nó sẽ cho phép bạn tập trung vào phát triển phần phả hệ trong dịch vụ của bạn.


Tôi thực sự muốn lưu trữ mọi thứ trong nhà và không phụ thuộc vào một api bên ngoài.
Jay Askren

Vì vậy, bạn đang tìm kiếm một DB mã hóa địa lý được cấp phép nguồn mở?
Adam Matan
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.