Hãy là một tập hợp hữu hạn và giả sử chúng ta muốn tính toán kích thước của một số tập con .chữ X
Động lực : Nếu chúng ta có thể tạo các phần tử của cách ngẫu nhiên, thì chúng ta có thể ước tính kích thước của bằng cách lấy mẫu ngẫu nhiên. Nghĩa là, chúng ta lấy mẫu ngẫu nhiên từ , nếu trong số chúng thuộc về , thì . Thật không may, cho những gì tôi làm, thường làlà đồ sộ và(trong khi đồ sộ) khá nhỏ đối với. Vì vậy, nếu tôi cố gắng thực hiện ước tính trên, tôi có thể nhận được , trong khi, không vô dụng, thực sự không thỏa mãn lắm.A A n A m X | X | / | Một | ≈ m / n | Một | | X | | Một | m = 0
Vì vậy, tôi có một ý tưởng rằng tôi hy vọng sẽ đẩy nhanh quá trình này. Thay vì ném phi tiêu vào một bảng phi tiêu đồ sộ, tại sao tôi không ném bóng? Nghĩa là, thay vì lấy mẫu các yếu tố , chúng tôi tập con mẫu . Chắc chắn tôi sẽ có thể suy luận điều gì đó về mật độ trong từ thí nghiệm này.A X A
Giả sử được trang bị một số liệu (tôi có ý nghĩ về khoảng cách Hamming). Với mọi hãy để là bóng kín của bán kính trong tâm tại . Vì chúng ta có thể lấy mẫu các phần tử cách ngẫu nhiên, chúng ta có thể lấy mẫu -balls một cách ngẫu nhiên.d ( x , y ) y ∈ A Y ( y ) = { x ∈ A : d ( x , y ) ≤ k } k A t x ∈ A k Y k ( t )
Giả sử (a) mọi thuộc về chính xác cùng số lượng -ball và (b) mỗi -ball có cùng kích thước .k k r
Bây giờ, giả sử tôi tạo -balls một cách ngẫu nhiên và giả sử. Có vẻ như chúng ta có thể ước tínhtheo cách tương tự, đó là .Y 1 , Y 2 , ... , Y n m = Σ n i = 1 | Y i ∩ X | | Một | | X | / | Một | ≈ m
Vì vậy, câu hỏi của tôi là:
Tôi có đúng không khi chúng ta có thể tính gần đúngcách này? Nếu vậy, tôi nghi ngờ tôi là người đầu tiên nghĩ về điều này, vậy có tên cho phương pháp này không?
Tôi đã thực sự kiểm tra điều này trên một số bộ, và nó dường như phù hợp với những gì tôi yêu cầu.
Có bất kỳ nhược điểm nào đối với phương pháp này không? (ví dụ như nó kém chính xác hơn? tôi có cần nhiều mẫu hơn không?)