Giới hạn dưới để kiểm tra độ gần trong định mức


11

Tôi đã tự hỏi nếu có bất kỳ ràng buộc thấp hơn (về độ phức tạp mẫu) được biết đến cho vấn đề sau:

Với mẫu truy cập oracle để hai phân bố chưa biết D1 , D2 trên {1,,n} , kiểm tra (WHP) liệu

  • D1=D2
  • d2(D1,D2)=D1D22=i=1n(D1(i)D2(i))2ϵ

Batu et al. [BFR + 00] cho thấy các mẫu là đủ, nhưng tôi không tìm thấy bất kỳ đề cập nào về giới hạn dưới?O(1ϵ4)

Tôi cho rằng người ta luôn có thể hiển thị bị ràng buộc thấp hơn bằng cách giảm nhiệm vụ phân biệt đồng xu thiên vị so với cho vấn đề này (mô phỏng phân phối chỉ được hỗ trợ trên hai điểm và trả lời các truy vấn của người kiểm tra theo các lần tung đồng xu iid), nhưng điều đó vẫn để lại một khoảng cách bậc hai ...εΩ(1ϵ2)ϵ

(Một điểm khác tôi quan tâm là giới hạn thấp hơn trong việc ước tính (tối đa phụ gia ) khoảng cách này - một lần nữa, tôi không tìm thấy tài liệu tham khảo nào về kết quả như vậy trong tài liệu)L 2ϵL2

Cảm ơn bạn đã giúp đỡ,


Vấn đề hứa hẹn này có vẻ rất giống với vấn đề được gọi là sự khác biệt thống kê của Sahai và Vadhan, đây là một vấn đề hoàn chỉnh đối với lớp SZK (kiến thức không thống kê); tuy nhiên, họ sử dụng khoảng cách . cs.ucla.edu/~sahai/work/web/2003%20Publications/J.ACM2003.pdf . (Chỉnh sửa: tôi cũng nghĩ rằng họ đang giả sử rằng bạn có một mạch điện toán phân phối, chứ không phải truy cập L1
orory

Xin chào, như đã đề cập trong một nhận xét khác, sự khác biệt giữa chỉ tiêu và thực sự rất quan trọng ở đây - hơn nữa, trong bài báo, họ đã thiết lập một ngưỡng rõ ràng (và không tùy ý) (trong một trong những nhận xét, họ giải thích rằng ngưỡng này cần phải thỏa mãn một số ràng buộc cụ thể); và muốn phân biệt so với (gần bằng cách kiểm tra dung sai / ước lượng khoảng cách hơn so với "kiểm tra thông thường", trong đó bạn muốn kiểm tra so với (nhưng đối với bất kỳ cố định )). L 1 τ = 1 / 3 d 1τ d 21 - τ d 2 = 0 d 2ε εL2L1τ=1/3d1τd21τd2=0d2ϵϵ
Clement C.

Câu trả lời:


6

Dường như các mẫu - như usul chỉ ra bên dưới - là đủ để thử nghiệm, do đó độ phức tạp của mẫu chính xác là ; trên thực tế, nó quay ra con số này của mẫu chúng tôi thậm chí đủ cho học lên đến một chất phụ gia wrt chuẩn mực.Θ ( 1 / ε 2 ) D ε L 2O(1/ϵ2)Θ(1/ϵ2) DϵL2


Đặt là hàm mật độ thực nghiệm thu được bằng cách vẽ iid mẫu và đặt Sau đó trong đó . cácD^s 1 , ... , s m ~ D D ( k )ms1,,smDD - D2 2

D^(k)=def1m=1m1{s=k},k[n]
Xk
DD^22=k=1n(1m=1m1{s=k}D(k))2=1m2k=1n(=1m1{s=k}mD(k))2=1m2k=1n(XkEXk)2
Xkk[n] ED - D2 2Xk=def=1m1{s=k}Bin(m,D(k))Xk(đối với ) không độc lập, nhưng chúng ta có thể viết sao cho , và áp dụng bất đẳng thức Markov k[n] m3
EDD^22=1m2k=1nE[(XkEXk)2]=1m2k=1nVarXk=1m2k=1nmD(k)(1D(k))1mk=1nD(k)=1m
ED - D 2 2ε2m3ϵ2 P{D - D2ε}1
EDD^22ϵ23
P{DD^2ϵ}13.

(Tôi đã đề cập đến câu trả lời của usul bắt đầu bằng "Tôi sẽ cố gắng chuộc lại lỗi trước đó của mình bằng cách hiển thị một cái gì đó ngược lại [...]" - thực sự nằm trên cái này. Tôi không mong đợi điều này :)) trên ràng buộc, nó có thể được chỉ ra rằng các thuật toán ngây thơ nhất (có nghĩa là, một trong đó thu hút mẫu, và đầu ra mật độ thực nghiệm định nghĩa này) mang lại một bản phân phối mà là, với xác suất không đổi, - đóng vào trong khoảng cách . D ε D L 2m=O(1/ϵ2)D^ϵDL2
Clement C.

@DW Mình mới chỉnh sửa câu trả lời của mình.
Clement C.

3

Tôi sẽ cố gắng khắc phục lỗi trước đó bằng cách hiển thị một cái gì đó ngược lại - rằng các mẫu là đủ (giới hạn dưới của gần như chặt chẽ)! Xem những gì bạn nghĩ ....1/ε2Θ~(1ϵ2)1/ϵ2

Trực giác quan trọng bắt đầu từ hai quan sát. Đầu tiên, để các bản phân phối có khoảng cách là , phải có các điểm có xác suất cao ( ). Ví dụ: nếu chúng tôi có điểm xác suất , chúng tôi sẽ có . ε Ohm ( ε 2 ) 1 / ε 3 ε 3D 1 - D 2 2L2ϵΩ(ϵ2)1/ϵ3ϵ3D1D221ϵ3(ϵ3)2=ϵ3/2<ϵ

Thứ hai, xem xét phân phối đồng đều với khoảng cách là . Nếu chúng ta có điểm xác suất , thì mỗi điểm sẽ khác nhau bởi các mẫu và sẽ đủ. Mặt khác, nếu chúng ta có các điểm , thì mỗi điểm sẽ cần khác nhau bởi các mẫu và một lần nữa các mẫu (một số không đổi trên mỗi điểm) đủ. Vì vậy, chúng tôi có thể hy vọng rằng, trong số các điểm có xác suất cao được đề cập trước đó, luôn có một số điểm khác nhau "đủ" để phân biệt nó. ε O ( 1 ) O ( 1 ) O ( ε ) 1 / ε 2 O ( 1 / ε 2 ) O ( ε 2 ) O ( 1 / ε 2 ) O ( 1 / ε 2 )L2ϵO(1)O(1)O(ϵ)1/ϵ2O(1/ϵ2)O(ϵ2)O(1/ϵ2)O(1/ϵ2)

Thuật toán. Cho và tham số độ tin cậy , đặt . Vẽ các mẫu từ mỗi bản phân phối. Đặt là số mẫu tương ứng cao hơn, thấp hơn cho điểm . Nếu có bất kỳ điểm nào mà và , hãy khai báo phân phối khác nhau. Nếu không, tuyên bố chúng như nhau.M X = M log ( 1 / ε 2 ) XϵMX=Mlog(1/ϵ2) ai,biii[n]aiXXϵ2ai,biii[n] mộti-biaiX8aibiaiX4

Giới hạn chính xác và độ tin cậy ( ) phụ thuộc vào bổ đề sau đây nói rằng tất cả độ lệch trong khoảng cách đến từ các điểm có xác suất khác nhau bởi . L 2 Ω ( ε 2 )1eΩ(M)L2Ω(ϵ2)

Yêu cầu. Giả sử . Đặt. Đặt . Sau đó delta i = | D 1 ( i ) - D 2 ( i ) | S k = { i : δ i > ε 2D1D22ϵδi=|D1(i)D2(i)|Σi S k δ 2 iε2(1-2Sk={i:δi>ϵ2k}

iSkδi2ϵ2(12k).

Bằng chứng . Chúng tôi có Chúng ta hãy ràng buộc tổng thứ hai; chúng tôi muốn tối đa hóa theo chủ đề . Vì hàm hoàn toàn lồi và tăng, chúng ta có thể tăng mục tiêu bằng cách lấy bất kỳ và tăng bằng trong khi giảm bằng . Do đó, mục tiêu sẽ được tối đa hóa với càng nhiều điều khoản càng tốt ở các giá trị tối đa của chúng và phần còn lại ởΣ i S k δ 2 i Σ i S k δi2xx2δiδjδiγδjγ0 ε 2

iSkδi2 + iSkδi2ϵ2.
iSkδi2iSkδi2xx2δiδjδiγδjγ0. Giá trị tối đa của mỗi thuật ngữ là và có nhiều nhất các điều khoản của giá trị này (vì chúng có tổng số nhiều nhất là ). Vì vậy, 2kϵ2k 2ΣiSkδ 2 i2k2kϵ22
iSkδi22kϵ2(ϵ2k)2=2ϵ2k.    

Yêu cầu . Đặt . Nếu , tồn tại ít nhất một điểm với và .D 1 - D 2 2ε i [ n ] p i > ε 2pi=max{D1(i),D2(i)}D1D22ϵi[n] δiεpi>ϵ24δiϵpi2

Bằng chứng . Đầu tiên, tất cả các điểm trong đều có theo định nghĩa (và không thể để trống cho theo yêu cầu trước đó).p idelta i > ε 2Sk Skk>2piδi>ϵ2kSkk>2

Thứ hai, vì , chúng tôi có hoặc, sắp xếp lại, do đó, bất đẳng thức giữ ít nhất một điểm trong . Bây giờ chọn . Σ i S k δ 2 iε 2 ( 1ipi2ΣiSk(δ 2 i -piε2(1

iSkδi2ϵ2(121k)iSkpi,
δ2ipiε2(1
iSk(δi2piϵ2(121k))0,
Skk=4
δi2piϵ2(121k)
Skk=4

Yêu cầu (dương tính giả) . Nếu , thuật toán của chúng tôi khai báo chúng khác với xác suất nhiều nhất là .e - Ω ( M )D1=D2eΩ(M)

Phác thảo . Hãy xem xét hai trường hợp: và . Trong trường hợp đầu tiên, số lượng mẫu của sẽ không vượt quá từ một trong hai phân phối: Số lượng mẫu trung bình là và giới hạn đuôi nói rằng với xác suất , mẫu 's không vượt quá trung bình của họ bằng một chất phụ gia ; nếu chúng ta cẩn thận giữ giá trị ở đuôi bị ràng buộc, chúng ta có thể liên kết với chúng cho dù có bao nhiêu điểm như vậy (theo trực giác, ràng buộc giảm theo cấp số mũ theo số điểm có thể).pi<ϵ2/16piϵ2/16iX/8<X/16eΩ(X/pi)=ϵ2eΩ(M/pi)iX/16pi

Trong trường hợp , chúng ta có thể sử dụng ràng buộc Chernoff: Nó nói rằng, khi chúng ta lấy mẫu và một điểm được rút ra với xác suất , xác suất khác với trung bình của nó bởi nhiều nhất là . Ở đây, hãy để , do đó xác suất được giới hạn bởi .piϵ2/16mppmcpmeΩ((cpm)2/pm)=eΩ(c2)c=X16eΩ(X)=ϵ2eΩ(M)

Vì vậy, với xác suất , (cho cả hai bản phân phối) số lượng mẫu của nằm trong có nghĩa là . Do đó, bài kiểm tra của chúng tôi sẽ không bắt được những điểm này (chúng rất gần nhau) và chúng tôi có thể liên kết với tất cả trong số chúng. 1ϵ2eΩ(M)ipiXϵ2X16piXϵ216/ϵ2

Yêu cầu (phủ định sai) . Nếu , thuật toán của chúng tôi khai báo chúng giống hệt với xác suất nhiều nhất là .D1D22ϵϵ2eΩ(M)

Phác thảo . Có một số điểm với và . Cùng một giá trị ràng buộc như trong tuyên bố trước đó nói rằng với xác suất , số lượng mẫu của khác với trung bình của nó nhiều nhất là . Đó là cho phân phối (WLOG) có ; nhưng có xác suất thậm chí thấp hơn về số lượng mẫu của từ phân phốiipi>ϵ2/4δiϵpi/21ϵ2eΩ(M)ipimpimX161pi=D1(i)=D2(i)+δii2 khác với giá trị trung bình của nó bởi lượng phụ gia này (vì giá trị trung bình và phương sai thấp hơn).

Vì vậy, với xác suất cao, số lượng mẫu của từ mỗi phân phối nằm trong phạm vi về ý nghĩa của nó; nhưng xác suất của chúng khác nhau bởi , vì vậy phương tiện của chúng khác nhau bởi ipiXϵ2X16δi

Xϵ2δiXpi2ϵ=piXϵ2X2.

Vì vậy, với xác suất cao, đối với điểm , số lượng mẫu khác nhau ít nhất là . i#samples(1)X4

Để hoàn thành các bản phác thảo, chúng ta cần chỉ ra một cách chặt chẽ hơn rằng, với đủ lớn, số lượng mẫu của đủ gần với ý nghĩa của nó, khi thuật toán sử dụng thay vì , nó không thay đổi bất cứ điều gì (điều này nên đơn giản bằng cách để một số phòng ngọ nguậy trong các hằng số).Mi#samplesmean


Xin chào, Cảm ơn vì điều này - Tôi có một vài câu hỏi về thuật toán và phân tích (liên quan đến một vài điểm tôi không chắc chắn nhận được): giả sử cuối cùng tôi chỉ muốn xác suất không đổi thành công, điều đó có nghĩa là không đổi, nếu tôi hiểu chính xác (trừ khi tôi không hiểu là gì)? Vì vậy, trong trường hợp này, chuyển sang : theo thuật toán, nó trở thành - điều đó có đúng không? 2/3MMXΘ(log1ϵ)
Clement C.

@ClementC. Xin lỗi tôi đã không rõ ràng! Khiếu nại là nếu chúng ta vẽ các mẫu , thì xác suất bị sai là , vì vậy xác suất không đổi là sai, các mẫu . 1ϵ2Mlog(1/ϵ2)O(eM)O(1ϵ2log(1/ϵ2))
usul

OK, đó là những gì tôi thu thập được. Tôi sẽ xem xét bằng chứng này trong tâm trí - cảm ơn lần nữa vì đã dành thời gian cho việc này!
Clement C.

1

Bạn có thể bắt đầu bằng cách cố gắng giải quyết vấn đề này cho trường hợp . Tôi khá chắc chắn các mẫu sẽ là cần thiết và đủ, trong trường hợp đó.n=2Θ(1/ϵ2)

Có thể bạn sẽ thấy hữu ích khi xem xét chuyển đổi giữa khoảng cách và khoảng cách (tổng khoảng cách biến thể).L2L1

  • Người ta biết rằng, với một mẫu, nếu biết các phân phối, tổng khoảng cách biến thể hoàn toàn mô tả lợi thế mà người ta có thể phân biệt với . Do đó, nếu tổng khoảng cách biến thể lớn và phân phối được biết đến, người ta có thể xây dựng một thử nghiệm chính xác với xác suất cao; nếu tổng khoảng cách biến đổi nhỏ, người ta không thể. Tôi không biết người ta có thể nói gì về trường hợp tổng khoảng cách biến đổi lớn nhưng phân phối không xác định.D1D2

  • Tiếp theo, bạn có thể xem các bản phân phối sản phẩm, và . Sử dụng tổng khoảng cách biến thể (khoảng cách ), dường như không có bất kỳ giới hạn tốt nào liên quan đến . Tuy nhiên, khi sử dụng khoảng cách , tôi tin rằng có các ước tính tốt về là một hàm của . (Thật không may, tôi dường như không thể đào lên một tham chiếu cụ thể cho những ước tính / giới hạn, vì vậy tôi hy vọng tôi không misremembering.) Ngoài ra còn có giới hạn gọi cho phép bạn ước tính khoảng cách như một chức năng của khoảng cách .D1nD2nL1||D1nD2n||1||D1D2||1L2||D1nD2n||2||D1D2||2L1L2

  • Do đó, một cách tiếp cận bạn có thể thử là bị ràng buộc , sau đó từ đó bị ràng buộc vào .||D1nD2n||2||D1nD2n||1

Tôi không biết liệu điều này sẽ dẫn đến bất cứ nơi nào tốt hay không; nó chỉ là một ý tưởng Có lẽ các tác giả của bài báo mà bạn trích dẫn sẽ đã thử hoặc xem xét một cái gì đó như thế này.

Có thể tài liệu tham khảo hữu ích:


Chào, cảm ơn cho câu trả lời của bạn! Tuy nhiên, tôi quan tâm đến giới hạn dưới tiệm cận, khi . Cụ thể, mối quan hệ giữa các chỉ tiêu và liên quan đến yếu tố - có nghĩa là chúng thực sự tương đương với hằng số, nhưng khác biệt rất khác nhau; sử dụng công cụ làm proxy không phải là một tùy chọn, theo như tôi có thể biết (như để kiểm tra mức độ gần gũi trong khoảng cách , độ phức tạp chính xác được biết là [BFR + 10 , Val11 ]nL2L1nnL1L1Θ(n2/3/poly(ϵ))
Clement C.

0

EDIT: điều này không chính xác! Xem các cuộc thảo luận trong các ý kiến ​​- Tôi sẽ chỉ ra lỗ hổng dưới đây.

Tôi nghĩ rằng chúng ta có thể nói rằng là bắt buộc.1ϵ4

Đặt . Đặt là phân phối đồng đều (xác suất của mỗi điểm ) và để khác với thống nhất bởi một lượng phụ gia tại mỗi điểm. Kiểm tra xem khoảng cách là .n=Θ(1ϵ2)D1=Θ(ϵ2)D2±Θ(ϵ2)L2ϵ

Vì vậy, chúng ta phải phân biệt một -sided đồng xu công bằng từ một -sided xu -biased. Tôi nghĩ rằng điều này ít nhất cũng khó như việc nói một đồng xu công bằng mặt từ một đồng xu có mặt , sẽ yêu cầu . Chỉnh sửa: điều này không chính xác! Đồng xu được cộng gộp thiên vị, nhưng nó được thiên vị nhân với một yếu tố không đổi. Như DW chỉ ra, điều đó có nghĩa là số lượng mẫu không đổi trên mỗi điểm sẽ phân biệt với .nnΘ(ϵ2)22Θ(ϵ2)Θ(1(ϵ2)2)=Θ(1ϵ4)ϵ2D1D2


Lưu ý rằng là đến mức chúng ta có thể đẩy dòng đối số này. Cụ thể, giả sử chúng tôi đã cố gắng tăng lên, giả sử, . Trong phân phối đồng đều, mỗi điểm có xác suất . Nhưng trong , chúng tôi cần mỗi điểm thay đổi so với đồng phục theo . Điều đó là không thể vì .1ϵ4n1ϵ3ϵ3D2ϵ2.5ϵ2.5ϵ3

Tóm tắt hơn, giả sử chúng ta muốn mỗi điểm thay đổi so với đồng phục theo . Sau đó, phần lớn chúng ta có thể đặt thành sẽ là . Để có được khoảng cách của , chúng ta cần thỏa mãn rằng căn bậc hai của tổng khoảng cách là , vì vậy , vì vậy nên và chúng tôi nhận được .ϵkn1ϵkL2ϵϵn(ϵk)2=ϵϵk/2=ϵk=2n=1ϵ2

Ngoài ra, tôi nghĩ rằng lập luận tương tự nói rằng, nếu chúng ta quan tâm đến khoảng cách với , chúng tôi yêu cầu , vì vậy chúng tôi sẽ chọn , vì vậy số lượng mẫu sẽ là . Tôi nghĩ rằng điều này có ý nghĩa như là một ràng buộc độc lập với . Nó tiếp cận vô hạn như . Nếu bạn đang cố gắng phân biệt hai bản phân phối ở khoảng cách của mà không bị ràng buộc với , tôi sẽ làm cho lớn không giới hạn và phân tán sự khác biệt mỏng tùy ý, vì vậy bạn không bao giờ có thể phân biệt được chúng (Lpp>1k=pp1n=1/ϵpp11/ϵ2pp1np1L1ϵnntức là không có số lượng mẫu cố định đủ cho tất cả ). Nó cũng tiếp cận dưới dạng ; điều này có ý nghĩa như là một ràng buộc bởi vì, đối với định mức , chúng ta có thể đặt và để mọi điểm khác nhau bởi ; chúng ta cần lấy mẫu một số điểm lần để chắc chắn rằng nó khác với đồng phục, sẽ lấy các mẫu .n1ϵ3pLn=1ϵΘ(ϵ)1ϵ21ϵ3


1. Bạn có thực sự muốn nói rằng khác với đồng phục bởi tại mỗi điểm không? Tôi nghi ngờ đó là một lỗi đánh máy và bạn có nghĩa là . D2±1/ϵ2±ϵ2
DW

1
2. Tôi không mua phân biệt với yêu cầu mẫu. Có vẻ như tôi mẫu là đủ. Giải thích (trực giác): giả sử chúng tôi thu thập mẫu và đếm số lần mỗi giá trị có thể xảy ra. Nếu chúng đến từ , mỗi lần xuất hiện 100 lần (với std dev 10). Nếu chúng đến từ , mỗi lần xuất hiện 200 lần (std dev 14) cho một nửa trong số chúng, / 0 lần (std dev 0) cho nửa còn lại. Điều đó đủ dễ để phân biệt giữa hai người, nếu bạn biết bạn đang giao dịch với hoặc . D1D21/ϵ4Θ(1/ϵ2)m=100/ϵ2D1D2D1D2
DW

@DW (1) bạn đúng! Đã sửa. (2) Khi bạn nói, tôi đồng ý, nhưng tôi nghĩ với các lựa chọn khác nhau của hằng số thì khó hơn. Tôi đang hình dung một cái gì đó như thế này: , vì vậy đặt xác suất cho mỗi điểm. Sau đó, khác nhau trên mỗi điểm (kiểm tra xem khoảng cách là ), do đó, nó đặt xác suất hoặc cho mỗi điểm. n=1/100ϵ2D1100ϵ2D210ϵ2L2ϵ90ϵ2110ϵ2
usul

1
Tôi nghĩ các mẫu vẫn đủ. Tập hợp các mẫu và đếm số lần mỗi giá trị có thể xảy ra. Đối với , mỗi lần xảy ra 1.000.000 lần (std dev ). Đối với , mỗi lần xuất hiện 900.000 lần (std dev ) hoặc 1.100.000 lần (std dev ). Điều đó đủ dễ để phân biệt giữa hai loại, nếu chúng ta biết chúng ta đang giao dịch với hoặc , bởi vì sự khác biệt giữa 1.000.000 và 1.100.000 là 100 độ lệch chuẩn, nghĩa là rất lớn. m = 10 6 n D 1 1000 D 21000 1000 D 1 D 2O(1/ϵ2)m=106nD11000D210001000D1D2
DW

@DW Tôi nghĩ về nó nhiều hơn - bạn nói đúng. Nếu phương tiện của chúng khác nhau bởi một hệ số nhân không đổi thì một số lượng mẫu không đổi trên mỗi điểm sẽ phân biệt chúng. Đó là yếu tố nhân không phải là phụ gia. Cách tiếp cận này sau đó chỉ đưa ra giới hạn dưới . 1/ϵ2
usul
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.