Đối với một ứng dụng học máy, nhóm của tôi cần tính khoảng cách Euclide với hàng xóm gần nhất thứ trong một tập cho mỗi (cho trong khoảng từ 5 đến khoảng 100 và vài trăm đến vài triệu). Hiện tại chúng tôi đang sử dụng phương pháp tiếp cận hoặc phương pháp rõ ràng với cây kd trên , khi cao vàlà tương đối thấp không bao giờ chiến thắng. (Mọi thứ đều trong bộ nhớ.)
Dường như phải có một cách tốt hơn so với vũ phu, mặc dù vậy - ít nhất là một lợi thế của bất đẳng thức tam giác, hoặc có thể với băm nhạy cảm cục bộ. Một xấp xỉ hợp lý chặt chẽ cũng có khả năng ổn.
Nghiên cứu mà tôi có thể tìm thấy dường như tập trung vào vấn đề tìm kiếm người hàng xóm gần nhất (hoặc một người gần nhất). Có phải vấn đề tôi đang tìm kiếm theo một tên khác, hoặc có liên quan đến một vấn đề liên quan mà tôi chưa từng nghĩ đến?