Các phương thức được sử dụng bởi các dịch vụ GeoIP bên cạnh thông tin WHOIS là gì? [đóng cửa]


11

Tôi chỉ tự hỏi làm thế nào các dịch vụ GeoIP thu thập dữ liệu về vị trí địa lý của IP bên cạnh việc kiểm tra thông tin địa chỉ IP của WHOIS. Ví dụ: tôi tình cờ thấy trang web này, nói rằng IP 74.207.244.221 đang được đặt tại Fremont, California: https://ipinfo.io/74.207.244.221

Nhưng tôi không thể tìm thấy thông tin này trên thông tin whois IP này. ipinfo.io nói rằng:

Ban đầu API của chúng tôi đã sử dụng dữ liệu MaxMind, nhưng chúng tôi đã rất bận rộn trong việc tạo dữ liệu định vị địa lý của riêng mình. Chúng tôi đã đạt được nhiều tiến bộ và hiện chúng tôi sử dụng dữ liệu của riêng mình để phục vụ khoảng một nửa số yêu cầu. Chúng tôi vẫn dự phòng dữ liệu MaxMind

Và điều này khiến tôi quan tâm, những cách thức mà các dịch vụ như ipinfo.io và MaxMind thu thập dữ liệu GeoIP là gì?

Câu trả lời:


11

Các dịch vụ như vậy thường sử dụng 3 cách để định vị địa chỉ IP:

  1. Đi qua cơ sở dữ liệu whois để tìm kiếm một địa chỉ;
  2. Theo dõi các truy vấn DNS ngược để thử và tìm manh mối dựa trên các bản ghi tên miền hoặc theo dõi đường dẫn của gói được gửi đến đích, ví dụ cũng có thể đưa ra manh mối (ví dụ sử dụng traceroute).
  3. Và cuối cùng, họ sử dụng tam giác RTT.

Tam giác thời gian khứ hồi (RTT) là phương pháp được sử dụng để có được vị trí địa lý gần đúng của một địa chỉ IP bằng cách đo độ trễ ping từ ba vị trí khác nhau.

Ví dụ: nếu bạn có ba máy chủ trải khắp thế giới theo hình tam giác và nếu bạn ping một địa chỉ IP từ cả ba và nhận được kết quả giống nhau về độ trễ, thì điều đó có nghĩa là địa chỉ IP được đặt ngay trong tâm của tam giác đó. Đó là cách thức hoạt động của tam giác, tuy nhiên, trong trường hợp này, nó được sử dụng với các lệnh ICMP.

Tài nguyên bạn có thể đọc:
ping là gì? @ Wikipedia
SIGCOMM giấy về tam giác RTT


5
Wow, tôi sẽ không bao giờ nghĩ rằng có một tam giác dựa trên RTT. Hấp dẫn. Vì vậy, nếu một số máy chủ muốn tránh bị định vị địa lý, nó có thể đưa ra độ trễ ngẫu nhiên trong các phản hồi ICMP.
Học viên

Tôi muốn nói thêm rằng có thể hữu ích khi xem tracert / traceroute, như đã viết trên iplocation.net: "Bạn có thể sử dụng lệnh 'traceroute' để tìm manh mối về vị trí của địa chỉ IP. Tên của các bộ định tuyến thông qua đó các gói dữ liệu từ máy chủ của bạn đến máy chủ đích có thể gợi ý đường dẫn địa lý của vị trí cuối cùng. "
Học viên

1
@Learner đó là một bổ sung hay, tuy nhiên, đó đã có trong câu trả lời của tôi dưới dạng "theo dõi truy vấn DNS ngược". Mặc dù traceroute không thực sự làm điều đó, nhưng nó cho bạn thấy tất cả các tên miền / địa chỉ mà qua đó một truy vấn đi qua. Tuy nhiên, tôi sẽ thêm một ghi chú để làm cho nó rõ ràng hơn :)
Fanatique

5

Tôi là người sáng lập IPinfo , vì vậy tôi chắc chắn có thể cung cấp một số chi tiết xung quanh vấn đề này! Không có một phương pháp nào chúng tôi sử dụng hoặc một nguồn dữ liệu duy nhất để tạo cơ sở dữ liệu định vị địa lý của riêng chúng tôi (hoặc bất kỳ bộ dữ liệu nào khác của chúng tôi, như IP cho công ty hoặc IP cho nhà mạng). Đó là sự kết hợp của một loạt các tập dữ liệu khác nhau, kỹ thuật xử lý dữ liệu và bài học kinh nghiệm trong vài năm nay!

Một số nguồn dữ liệu và kỹ thuật không thường được đề cập bao gồm:

  • Nguồn cấp dữ liệu trực tiếp từ ISP. Dịch vụ của chúng tôi xử lý khoảng 500 triệu yêu cầu API mỗi ngày và được sử dụng trên nhiều trang web phổ biến. Do đó, các ISP được khuyến khích cung cấp cho chúng tôi dữ liệu định vị địa lý cập nhật chính xác để khách hàng của họ có được trải nghiệm tuyệt vời trên web. Chúng tôi đang làm việc trực tiếp với ngày càng nhiều ISP hơn.

  • Dữ liệu vị trí GPS. Có thể thu thập thông tin vị trí chính xác bằng GPS trên thiết bị di động. Bạn có thể ghép nối với địa chỉ IP và một số suy luận cấu trúc liên kết mạng để tìm ra vị trí cho các dải IP được đưa ra chỉ bằng một vài phép đo.

  • Người dùng gửi chỉnh sửa. Khi chúng tôi nhận được vị trí sai (hoặc nó chưa được cập nhật sau khi thay đổi), chúng tôi thường sẽ nhanh chóng nhận được phản hồi từ người dùng và có thể tự sửa vị trí hoặc điều chỉnh thuật toán của chúng tôi để đảm bảo vị trí chính xác trong lần chạy tiếp theo đường ống xử lý dữ liệu của chúng tôi.

Đối với tập dữ liệu IP cho công ty của chúng tôi, chúng tôi thực sự cạo từng tên miền duy nhất mỗi tháng và tham chiếu chéo dữ liệu chúng tôi trích xuất ở đó với thông tin sở hữu IP, hồ sơ cá nhân và hơn thế nữa. Sau đó, chúng tôi cũng sử dụng dữ liệu nạo tên miền để hiển thị tên miền nào được lưu trữ trên địa chỉ IP nào và trong phân loại loại IP của chúng tôi, cùng với nhiều nguồn dữ liệu khác, để xác định xác suất địa chỉ IP được sử dụng chủ yếu như một ISP dân cư, kinh doanh, hoặc nhà cung cấp dịch vụ lưu trữ. Chúng tôi cũng phân tích cấu trúc liên kết của những trang đó cũng cho thấy một số dữ liệu này trên host.io .


Cảm ơn! Tôi không mong đợi rằng người sáng lập trang web này sẽ trả lời câu hỏi của tôi :) Nó rất thú vị.
Học viên
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.