Tìm cặp gần nhất giữa hai bộ điểm trên hypercube


11

Cho hai tập con của hypercube -dimensional (nghĩa là ), tôi đang tìm kiếm một thuật toán lấy các điểm st khoảng cách (hoặc -distance trên hypercube) là tối thiểu. Thuật toán ngây thơ chỉ kiểm tra mỗi cặp cần thời gian, có kết quả nào tốt hơn được biết không?M , N { 0 , 1 } d m M , n N L 1 d H ( m , n ) | M | | N | ddM,N{0,1}dmM,nNL1dH(m,n)|M||N|d

Để đơn giản, chúng ta có thể giả sử rằng .|M|=|N|=d


hừm Có thêm động lực / ứng dụng? nghi ngờ có một sự tương tự đa chiều của thuật toán euclid / phẳng này nhưng wikipedia không trích dẫn bất cứ điều gì & không nghe thấy về nó ở nơi khác .... nó có thể giúp tìm kiếm một thuật toán cho các vectơ n-dim. phần đầu của bài viết dường như khẳng định nó có thể được giải trong cho kích thước cao hơn nhưng không đưa ra trích dẫn. có thể ở đâu đó trong refs? d > 2O(nlogn)d>2
vzn

1
Đối số phân chia và chinh phục dựa trên một bao bì bị ràng buộc. Trong các kích thước cao hơn, điều này giới thiệu một yếu tố trong sự tái phát, nhưng sự phụ thuộc vào vẫn giống nhau. Vì vậy, nếu bạn không nhớ các thuật ngữ theo cấp số nhân trong , bạn có thể sử dụng phương pháp này. Nếu bạn muốn một cái gì đó chính xác, bạn không thể làm tốt hơn được nữa. n d2dnd
Suresh Venkat


1
Điều này dường như không thể. Hãy suy nghĩ về n + m chuỗi ngẫu nhiên trên hypercube. Bằng cách nào đó, khoảng cách hãm của mỗi cặp là khoảng d / 2 và bạn phải kiểm tra tất cả các cặp để tìm ra cặp gần nhất.
Sariel Har-Peled

@Sariel Har-Peled: Như Suresh đã viết, vấn đề có thể được giải quyết trong thời gian O (n log n) (trong đó n = max {| M |, | N |}) cho mọi hằng số d. Do đó, bạn phải kiểm tra tất cả các cặp để tìm cặp gần nhất mà âm thanh không đúng với tôi.
Tsuyoshi Ito

Câu trả lời:


6

Chỉ cần nhận ra rằng bạn đang yêu cầu trường hợp đó . Sau đó, bạn có thể làm phép nhân ma trận, phải không? Viết là ma trận hàng , dưới dạng ma trận cột , phủ định các mục nhập của và tính ma trận . Rõ ràng, là khoảng cách Hamming giữa th điểm và điểm thứ . Theo những đột phá cuối cùng, thời gian này đã chạy (nhưng tôi có một bản thảo 50.000 trang cho thấy cách thực hiện phép nhân ma trận này trongM X N Y Y Z = X Y z i , j i M j N O ( d 2.3727 ) O ( d 2.3726999999 )|M|=|N|=dMXNYYZ=XYzi,jiMjNO(d2.3727)O(d2.3726999999) thời gian bằng một thuật toán thực sự đơn giản).

Bạn có thể có được hiệu ứng tương tự nếu ma trận không phải là hình vuông. Tôi nghĩ rằng Uri Zwick có một bài viết về nhân ma trận nhanh trong trường hợp này.

Ở một khía cạnh nào đó, điều này không quá thú vị - chúng tôi muốn tránh thuật ngữ . Những cải tiến trong thuật ngữ là loại meh, meh ...dO(|M||N|)d


Tuyệt vời tìm thấy. Một lưu ý khác, một đồng nghiệp của tôi đã tìm thấy bài báo này: toc.cse.iitk.ac.in/articles/v008a014/v008a014.pdf và chỉ bây giờ tôi mới nhận ra rằng đó là (cũng) do bạn viết. Trang 17+ đặc biệt thú vị ..
HdM

Đúng. Trông có vẻ quen thuộc - nhưng lưu ý rằng đây là xấp xỉ - Suresh đã hỏi về kết quả chính xác ...
Sariel Har-Peled

-3

như trong các bình luận, vấn đề này thường liên quan chặt chẽ đến cùng một vấn đề trong không gian Hilbert và các thuật toán gần như có thể áp dụng được. Một ví dụ về điều này có thể được tìm thấy trong bài báo này của Arya et al [1] p29 trong đó các tác giả đánh giá thuật toán lân cận không gian Hilbert gần nhất của họ bằng cách sử dụng khối boolean và định mức . thuật toán của họ hoạt động trên bất kỳ số liệu Minkowski. như bạn chỉ ra (nhưng wikipedia dường như không có nhiều giới thiệu khác), số liệu khoảng cách Hamming tương đương với số liệu không gian Minkowski hoặc "số liệu taxi" trên tọa độ nhị phân. thuật toán của họ mất thời gian tiền xử lý (L mLLm O ( d n log n ) dL1O(dnlogn)dkích thước) và thời gian "truy vấn" logarit (mỗi điểm). xem thêm [2]

[1] Thuật toán tối ưu cho tìm kiếm hàng xóm gần nhất gần đúng theo kích thước cố định Arya et al, 30pp

[2] Hàng xóm gần nhất có hiệu quả tìm kiếm trên siêu khối, với các ứng dụng cho Cazals phân cụm


1
thời gian truy vấn bị ràng buộc đã được chứng minh trong Arya et al là . bất kỳ thuật toán tầm thường nào làm tốt hơn trên một hypercube. họ tranh luận trên trang 29 rằng các thí nghiệm cho thấy ràng buộc là quá bi quan nhưng họ chỉ nhìn vào chiều <= 16.Ω(dd)
Sasho Nikolov
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.