Tôi là người sáng lập IPinfo , vì vậy tôi chắc chắn có thể cung cấp một số chi tiết xung quanh vấn đề này! Không có một phương pháp nào chúng tôi sử dụng hoặc một nguồn dữ liệu duy nhất để tạo cơ sở dữ liệu định vị địa lý của riêng chúng tôi (hoặc bất kỳ bộ dữ liệu nào khác của chúng tôi, như IP cho công ty hoặc IP cho nhà mạng). Đó là sự kết hợp của một loạt các tập dữ liệu khác nhau, kỹ thuật xử lý dữ liệu và bài học kinh nghiệm trong vài năm nay!
Một số nguồn dữ liệu và kỹ thuật không thường được đề cập bao gồm:
Nguồn cấp dữ liệu trực tiếp từ ISP. Dịch vụ của chúng tôi xử lý khoảng 500 triệu yêu cầu API mỗi ngày và được sử dụng trên nhiều trang web phổ biến. Do đó, các ISP được khuyến khích cung cấp cho chúng tôi dữ liệu định vị địa lý cập nhật chính xác để khách hàng của họ có được trải nghiệm tuyệt vời trên web. Chúng tôi đang làm việc trực tiếp với ngày càng nhiều ISP hơn.
Dữ liệu vị trí GPS. Có thể thu thập thông tin vị trí chính xác bằng GPS trên thiết bị di động. Bạn có thể ghép nối với địa chỉ IP và một số suy luận cấu trúc liên kết mạng để tìm ra vị trí cho các dải IP được đưa ra chỉ bằng một vài phép đo.
Người dùng gửi chỉnh sửa. Khi chúng tôi nhận được vị trí sai (hoặc nó chưa được cập nhật sau khi thay đổi), chúng tôi thường sẽ nhanh chóng nhận được phản hồi từ người dùng và có thể tự sửa vị trí hoặc điều chỉnh thuật toán của chúng tôi để đảm bảo vị trí chính xác trong lần chạy tiếp theo đường ống xử lý dữ liệu của chúng tôi.
Đối với tập dữ liệu IP cho công ty của chúng tôi, chúng tôi thực sự cạo từng tên miền duy nhất mỗi tháng và tham chiếu chéo dữ liệu chúng tôi trích xuất ở đó với thông tin sở hữu IP, hồ sơ cá nhân và hơn thế nữa. Sau đó, chúng tôi cũng sử dụng dữ liệu nạo tên miền để hiển thị tên miền nào được lưu trữ trên địa chỉ IP nào và trong phân loại loại IP của chúng tôi, cùng với nhiều nguồn dữ liệu khác, để xác định xác suất địa chỉ IP được sử dụng chủ yếu như một ISP dân cư, kinh doanh, hoặc nhà cung cấp dịch vụ lưu trữ. Chúng tôi cũng phân tích cấu trúc liên kết của những trang đó cũng cho thấy một số dữ liệu này trên host.io .