Đặt là một hàm mà chúng ta gọi là hàm tương tự . Ví dụ về chức năng tương tự là khoảng cách cosine, l 2 định mức, khoảng cách Hamming, độ tương tự Jaccard, v.v.
Xem xét vectơ nhị phân có độ dài k : → v ∈ ( { 0 , 1 } k ) n .
Mục tiêu của chúng tôi là nhóm các vectơ tương tự nhau. Chính thức hơn, chúng tôi muốn tính toán một biểu đồ tương đồng nơi các nút là các vectơ và các cạnh đại diện cho vectơ mà là tương tự ( ).
và k là những số rất lớn và việc so sánh haivectơ k có giá trị rất đắt, chúng ta không thể thực hiện tất cả các phép toán O ( n 2 ) brute-force. Chúng tôi muốn tính toán biểu đồ tương tự với các hoạt động ít hơn đáng kể.
Điều này có thể không? Nếu không, chúng ta có thể tính xấp xỉ cho biểu đồ chứa tất cả các cạnh trong biểu đồ tương tự cộng với có thể nhiều nhất là các cạnh khác không?