Tôi đã đặt một câu hỏi tương tự hỏi về khoảng cách giữa các "tài liệu" (bài viết trên Wikipedia, tin tức, v.v.). Tôi đặt câu hỏi này thành một câu hỏi riêng vì các truy vấn tìm kiếm nhỏ hơn đáng kể so với tài liệu và đáng chú ý hơn. Do đó tôi không biết (và nghi ngờ) nếu các số liệu khoảng cách tương tự sẽ được sử dụng ở đây.
Hoặc số liệu khoảng cách từ vựng vanilla hoặc số liệu khoảng cách ngữ nghĩa hiện đại được ưa thích, với ưu tiên mạnh mẽ hơn cho sau này.