Có thuộc tính phân phối nào mà cực kỳ khó kiểm tra không?


13

Thuật toán thử nghiệm phân phối cho thuộc tính phân phối P (chỉ là một tập hợp con của tất cả các phân phối trên [n]) được phép truy cập vào các mẫu theo một số phân phối D và được yêu cầu quyết định (whp) nếu hoặc ( ở đây thường là khoảng cách ). Thước đo phức tạp phổ biến nhất là số lượng mẫu được sử dụng bởi thuật toán.d ( D , P ) > ε d 1DPd(D,P)>ϵd1

Bây giờ, trong kiểm tra thuộc tính tiêu chuẩn, nơi bạn có quyền truy cập truy vấn vào một đối tượng nào đó, giới hạn truy vấn thấp hơn tuyến tính rõ ràng là giới hạn dưới mạnh nhất có thể, vì truy vấn sẽ tiết lộ toàn bộ đối tượng. Đây có phải là trường hợp để thử nghiệm phân phối là tốt?n

Theo như tôi hiểu, giới hạn trên "tầm thường" đối với các thuộc tính thử nghiệm của các bản phân phối là --- bởi giới hạn của Chernoff, điều này đủ để "ghi lại" một bản phân phối D 'gần với D trong khoảng cách , và sau đó chúng ta có thể kiểm tra xem có bất kỳ phân phối nào gần với D 'trong P không (điều này có thể mất thời gian vô hạn, nhưng điều này không liên quan đến độ phức tạp của mẫu).1O(n2logn)1

  • Có một thử nghiệm "tầm thường" tốt hơn cho tất cả các thuộc tính phân phối?
  • Có bất kỳ thuộc tính phân phối nào mà chúng ta biết giới hạn mẫu mạnh hơn tuyến tính không?

có vẻ tương tự như việc chứng minh sự phân tách lớp phức tạp và giống như nó có thể gần với một số vấn đề mở đã biết ...?
vzn

Chỉ cần nhìn thấy điều này ... Tôi không chắc chắn làm thế nào bạn có được bị ràng buộc , nhưng lưu ý rằng thực sự học phân phối (trên miền có kích thước ) cho khoảng cách TV / với xác suất thực sự có thể được thực hiện với các mẫu (và điều này là chặt chẽ). Vì vậy, trừ khi bạn đang xem xét các giá trị không cố định của tham số lân cận , không có bất kỳ hy vọng nào có được giới hạn thấp hơn ...n 1 ε 2 / 3 O ( n / ε 2 ) ε w ( n )O(n2logn)n1ε2/3O(n/ε2)εω(n)
Clement C.

Câu trả lời:


5

Xin lỗi vì đã làm sáng tỏ bài đăng này - nó khá cũ, nhưng tôi đoán rằng nó đã được trả lời có thể không phải là một ý tưởng tồi.

Đầu tiên, có vẻ như bạn đã thực hiện ràng buộc Chernoff của mình với một số cài đặt tham số hơi kỳ lạ. Lưu ý rằng để thực hiện đề nghị "thử nghiệm bằng cách học hỏi" của bạn tiếp cận, nó là đủ để tìm hiểu những phân phối trong tổng số khoảng cách biến thể (hoặc , nếu bạn thích, đó là lên cùng một yếu tố 2) để khoảng cách ε1 . (trước khi kiểm tra "ẩn" nếu có bất kỳ phân phốip'có thuộc tínhPnmà chính nó là ở khoảng cách tối đa làεε2pPn từ bạn học giả thuyết p ). Điều này sẽ ngây thơ dẫn đến mộtO(nlognε2p^độ phức tạp mẫu giới hạn trên cho phương pháp này; Tuy nhiên, nó được biết đến (và "văn hóa dân gian") rằng việc học một phân phối tùy ý trên một lĩnh vực kích thướcnlên đến khoảng cáchε(trong tổng số khoảng cách dao động) có thể được thực hiện với chỉO(nO(nlognε2)nεmẫu (và điều này là chặt chẽ).O(nε2)

Vì vậy, đường cơ sở nên thực sự là , đó là đã tuyến tính trongn. Bây giờ, người ta có thể đặt câu hỏi tiếp theo -có các thuộc tính "tự nhiên" nào cho việc kiểm tra (giả sử cho hằng sốε) yêu cầu sự phụ thuộc tuyến tính trong kích thước miềnnkhông?O(nε2)nεn

Câu trả lời là (theo như tôi biết) "không hoàn toàn, nhưng gần gũi." Cụ thể, sau một dòng công việc quan trọng về ước tính các thuộc tính của phân phối (hoặc tương đương, kiểm tra thuộc tính khoan dung), kết quả của Valiant và Valiant ngụ ý (STOCS'11, FOCS'11 và một số khác) rằng tài sản khá bị chiếm đoạt "là -close để thống nhất" có mẫu phức tạp q ε ( n1/10.Θε(nlogn)

(Lưu ý rằng đó là một chút "gian lận", theo nghĩa là tài sản chỉ đơn giản là một cách để đưa ra một câu hỏi kiểm tra khoan dung và đặt lại tên đó là kiểm tra một tài sản ad hoc ).

Nếu điều đó không hoàn toàn đủ để làm dịu cơn khát của bạn, người ta cũng có thể chỉ ra rằng đối với thuộc tính (tự nhiên?) Của "là một biểu đồ " (là hằng số phân phối trên một tập hợp các khoảng k chưa biết?), Đặt k = n / 10 ví dụ cũng dẫn đến một Ω ( nkkk= =n/10ràng buộc thấp hơn(nó nằm trong một bài báo của tôi từ năm 2016; giới hạn dưới theo sau việc giảm khá đơn giản đối với kết quả của Valiants). Bây giờ, cho dù bạn xem xét "là mộtnΩ(nđăng nhậpn) -histogram "để trở thành một tài sản tự nhiên là tùy thuộc vào bạn.n100

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.