Năm 1999, Beyer và cộng sự. hỏi, khi nào "Hàng xóm gần nhất" có ý nghĩa?
Có cách nào tốt hơn để phân tích và hình dung ảnh hưởng của độ phẳng khoảng cách đối với tìm kiếm NN từ năm 1999 không?
Tập dữ liệu [đã cho] có cung cấp câu trả lời có ý nghĩa cho vấn đề 1-NN không? Vấn đề 10-NN? Vấn đề 100-NN?
Làm thế nào bạn sẽ các chuyên gia tiếp cận câu hỏi này ngày hôm nay?
Chỉnh sửa Thứ Hai ngày 24 tháng 1:
Làm thế nào về "khoảng cách khoảng cách" như một tên ngắn hơn cho "độ phẳng khoảng cách với kích thước tăng"?
Một cách dễ dàng để xem xét "khoảng cách trắng" là chạy 2-NN và vẽ khoảng cách đến hàng xóm gần nhất và hàng xóm gần thứ hai. Cốt truyện dưới đây cho thấy dist 1 và dist 2 cho một loạt các cụm và kích thước, bởi Monte Carlo. Ví dụ này cho thấy độ tương phản khoảng cách khá tốt cho sự khác biệt tuyệt đối được chia tỷ lệ | dist 2 - dist 1 |. (Sự khác biệt tương đối | dist 2 / dist 1 | → 1 là thứ nguyên →, vì vậy trở nên vô dụng.)
Việc sử dụng lỗi tuyệt đối hay lỗi tương đối nên được sử dụng trong một ngữ cảnh cụ thể tất nhiên phụ thuộc vào tiếng ồn "thực" hiện tại: khó khăn.
Gợi ý: luôn chạy 2-NN; 2 hàng xóm hữu ích khi họ thân thiết, và hữu ích khi không.