Tôi là một người trực quan. Đây là những gì làm việc cho tôi như một trực giác.
Nói mỗi thứ bạn muốn tìm kiếm xấp xỉ là những vật thể như quả táo, khối lập phương, ghế.
Trực giác của tôi đối với một LSH là nó tương tự như lấy bóng của những vật thể này. Giống như nếu bạn lấy bóng của khối lập phương 3D, bạn sẽ có hình vuông 2D trên một tờ giấy hoặc hình cầu 3D sẽ giúp bạn có một hình bóng giống như hình tròn trên một tờ giấy.
Cuối cùng, có nhiều hơn ba chiều trong một vấn đề tìm kiếm (trong đó mỗi từ trong văn bản có thể là một chiều) nhưng tương tự bóng vẫn rất hữu ích với tôi.
Bây giờ chúng ta có thể so sánh hiệu quả các chuỗi bit trong phần mềm. Một chuỗi bit có độ dài cố định là loại, nhiều hay ít, giống như một dòng trong một chiều.
Vì vậy, với LSH, tôi chiếu bóng của các đối tượng cuối cùng dưới dạng các điểm (0 hoặc 1) trên một chuỗi dòng / bit có độ dài cố định duy nhất.
Toàn bộ mẹo là lấy các bóng sao cho chúng vẫn có ý nghĩa ở chiều thấp hơn, ví dụ như chúng giống với vật thể ban đầu theo cách đủ tốt để có thể nhận ra.
Một bản vẽ 2D của một hình khối trong phối cảnh cho tôi biết đây là một hình khối. Nhưng tôi không thể phân biệt dễ dàng một hình vuông 2D với bóng hình khối 3D mà không có phối cảnh: cả hai đều trông giống như một hình vuông đối với tôi.
Làm thế nào tôi trình bày đối tượng của mình ra ánh sáng sẽ xác định xem tôi có nhận được bóng tốt hay không. Vì vậy, tôi nghĩ rằng một LSH "tốt" là người sẽ biến các vật thể của tôi ra trước ánh sáng sao cho cái bóng của chúng có thể nhận ra tốt nhất là đại diện cho đối tượng của tôi.
Tóm lại: Tôi nghĩ về những thứ cần lập chỉ mục với LSH là các vật thể vật lý như khối lập phương, bàn hoặc ghế và tôi chiếu bóng của chúng thành 2D và cuối cùng dọc theo một đường (một chuỗi bit). Và một "chức năng" LSH "tốt" là cách tôi trình bày các vật thể của mình trước ánh sáng để có được hình dạng gần như có thể phân biệt được trong vùng phẳng 2D và sau đó là chuỗi bit của tôi.
Cuối cùng khi tôi muốn tìm kiếm nếu một đối tượng tôi có giống với một số đối tượng mà tôi đã lập chỉ mục, tôi lấy bóng của đối tượng "truy vấn" này bằng cách sử dụng cùng một cách để trình bày đối tượng của mình trước ánh sáng (cuối cùng kết thúc bằng một chút chuỗi quá). Và bây giờ tôi có thể so sánh mức độ tương tự của chuỗi bit đó với tất cả các chuỗi bit được lập chỉ mục khác của tôi, đó là một proxy để tìm kiếm toàn bộ các đối tượng của tôi nếu tôi tìm thấy một cách tốt và dễ nhận biết để trình bày các đối tượng của mình với ánh sáng của tôi.