Phân tích quả bóng và thùng trong chế độ : khoảng trống


23

Giả sử chúng ta đang ném bi vào thùng, trong đó . Đặt là số lượng bóng kết thúc trong bin , là thùng nặng nhất, X_ \ min là thùng nhẹ nhất và X _ {\ mathrm {sec-max}} là thùng nặng thứ hai. Nói một cách đơn giản, X_i - X_j \ sim N (0,2m / n) , và vì vậy chúng tôi mong đợi | X_i - X_j | = \ Theta (\ sqrt {m / n}) cho bất kỳ hai i, j cố định . Sử dụng liên kết bị ràng buộc, chúng tôi mong đợi X _ {\ max} - X _ {\ min} = O (\ sqrt {m \ log n / n}) ; có lẽ, chúng ta có thể có một kết quả khớp thấp hơn bằng cách xem xét n / 2mnmnXiiXmaxXminXsecmaxXiXjN(0,2m/n)|XiXj|=Θ(m/n) i,jXmaxXmin=O(mlogn/n)n/2cặp thùng rời nhau. Đối số (không hoàn toàn chính thức) này khiến chúng tôi hy vọng rằng khoảng cách giữa XmaxXminΘ(mlogn/n) với xác suất cao.

Tôi quan tâm đến khoảng cách giữa XmaxXsecmax . Đối số được nêu ở trên cho thấy XmaxXsecmax=O(mlogn/n) với xác suất cao, nhưng yếu tố logn có vẻ không liên quan . Có bất cứ điều gì đã biết về phân phối XmaxXsecmax không?

Tổng quát hơn, giả sử rằng mỗi bóng có liên quan đến một tổ chức phi tiêu cực điểm cho mỗi bin, và chúng tôi đang quan tâm đến tổng số điểm của mỗi thùng sau khi ném m bóng. Kịch bản thông thường tương ứng với điểm số của biểu mẫu (0,,0,1,0,,0) . Giả sử rằng phân phối xác suất của điểm số là bất biến dưới sự hoán vị của các thùng (trong kịch bản thông thường, điều này tương ứng với thực tế là tất cả các thùng đều được trang bị). Với sự phân phối điểm số, chúng ta có thể sử dụng phương pháp của đoạn đầu tiên để có một ràng buộc tốt về XmaxXmin . Giới hạn sẽ chứa hệ số lognxuất phát từ một liên kết ràng buộc (thông qua xác suất đuôi của một biến thông thường). Yếu tố này có thể giảm nếu chúng ta quan tâm đến việc giới hạn XmaxXsecmax ?


Mỗi điểm nằm trong [0,1]?
Neal Young

Điều đó không thực sự quan trọng, bạn luôn có thể mở rộng quy mô sao cho trong [0,1] .
Yuval Filmus

Câu trả lời:


21

Trả lời: Θ(mnlogn) .

Áp dụng một phiên bản đa chiều của Định lý giới hạn trung tâm, chúng ta nhận thấy rằng vectơ có phân phối Gaussian đa biến không đối xứng với và Chúng ta sẽ giả sử bên dưới rằng một vectơ Gaussian (và không chỉ xấp xỉ một vectơ Gaussian). Chúng ta hãy thêm một biến ngẫu nhiên Gaussian với phương sai cho tất cả ( độc lập với tất cả ). Đó là, hãy V a r [ X i ] = m ( 1(X1,,Xn)C o v ( X i , X j ) = - m / n 2 . X Z m / n 2 X i Z X i ( Y 1 Y 2Y n ) = ( X 1 + Z X 2 + Z X n + Z ) . ( Y 1

Var[Xi]=m(1n1n2),
Cov(Xi,Xj)=m/n2.
X Zm/n2XiZXi
(Y1Y2Yn)=(X1+ZX2+ZXn+Z).
Chúng ta có một vectơ Gaussian . Bây giờ mỗi có phương sai : và tất cả đều độc lập: Y i m / n V một r [ Y i ] = V một r [ X i ] + 2 C o v ( X i , Z ) =(Y1,,Yn)Yim/n
Var[Yi]=Var[Xi]+2Cov(Xi,Z)=0+Var[Z]=m/n,
Yi
Cov(Yi,Yj)=Cov(Xi,Xj)+Cov(Xi,Z)+Cov(Xj,Z)=0+Cov(Z,Z)=0.

Lưu ý rằng . Do đó, vấn đề ban đầu của chúng tôi tương đương với vấn đề tìm . Trước tiên chúng ta hãy phân tích trường hợp đơn giản khi tất cả có phương sai .YiYj=XiXjYmaxYsecmaxYi1

Vấn đề. Chúng tôi được cung cấp Gaussian rv với trung bình và phương sai . Ước tính kỳ vọng của .nγ1,,γnμ1γmaxγsecmax

Trả lời: .Θ(1logn)

Bằng chứng không chính thức. Đây là một giải pháp không chính thức cho vấn đề này (không khó để biến nó thành chính thức). Vì câu trả lời không phụ thuộc vào giá trị trung bình, chúng tôi giả sử rằng . Đặt , trong đó . Chúng tôi có (đối với lớn vừa phải ), μ=0Φ¯(t)=Pr[γ>t]γN(0,1)t

Φ¯(t)12πte12t2.

Lưu ý rằng

  • Φ(γi) được phân phối đồng đều và độc lập trên ,[0,1]

  • Φ(γmax) là nhỏ nhất trong số ,Φ(γi)

  • Φ(γsecmax) là nhỏ thứ hai trong số .Φ(γi)

Do đó gần với và gần với (không có sự tập trung nhưng nếu chúng ta không ' Chúng tôi quan tâm đến các hằng số những ước tính này là đủ tốt, trên thực tế, chúng thậm chí còn khá tốt nếu chúng ta quan tâm đến các hằng số - nhưng điều đó cần một sự biện minh). Sử dụng công thức cho , chúng tôi nhận được Φ(γmax)1/nΦ(γmax)2/nΦ¯(t)

2Φ¯(γsecmax)/Φ¯(γmax)e12(γmax2γsecmax2).

Do đó là whp Lưu ý rằng . Chúng tôi có, γmax2γsecmax2Θ(1)γmaxγsecmax=Θ(logn)

γmaxγsecmaxΘ(1)γmax+γsecmaxΘ(1)logn.

QED

Chúng tôi nhận được rằng

E[XmaxXsecmax]=E[YmaxYsecmax]=Var[Yi]×E[γmaxγsecmax]=Θ(mnlogn).

Lập luận tương tự đi qua khi chúng ta có điểm số tùy ý. Nó cho thấy

E[XmaxXsecmax]=cE[XmaxXmin]/logn.

2
Cảm ơn! Tôi sẽ nhớ thử phép tính xấp xỉ Gaussian đa biến vào lần tới.
Yuval Filmus

5
Yury, bạn đã viết "Chúng ta hãy thêm vectơ Gaussian với phương sai cho tất cả . Chúng ta có một vectơ Gaussian . Bây giờ mỗi có phương sai và tất cả không tương quan ... Lưu ý rằng . " Bạn có thể mở rộng về phần này? Là ? Nếu các phụ thuộc và các độc lập (hoặc đồng nhất như nhau), làm thế nào các có thể độc lập? (Có vẻ như là một mánh khóe gọn gàng nhưng tôi không hiểu.) Cảm ơn. m / n 2 X iZm/n2Xi(Y1,,Yn)Yim/nYiYiYj=XiXjZi=ZjXiZiYi
Neal trẻ

1
@NealYoung, vâng, nếu chúng ta có các biến với tương quan cặp tiêu cực tất cả các hiệp phương sai là tương đương , sau đó chúng ta có thể thêm một single mới biến ngẫu nhiên cho tất cả như vậy các khoản tiền là độc lập. Ngoài ra, nếu các biến có tương quan dương và một lần nữa tất cả hiệp phương sai bằng nhau thì chúng ta có thể trừ một rv duy nhất khỏi tất cả chúng để tất cả các khác biệt là độc lập; nhưng bây giờ không độc lập với mà làC oX1,,XnCov(Xi,Xj)ZXiCov(Xi,Xj)ZZXiZ=α(X1++Xn)đối với một số tham số tỷ lệ . α
Yury

1
Ah tôi thấy. ít nhất là theo đại số, tất cả những gì nó dựa vào là sự độc lập theo cặp của Z và mỗi . rất tuyệt. Xi
Suresh Venkat

1
Đối số này hiện xuất hiện (có ghi công) trong bài viết EC'14 : dl.acm.org/citation.cfm?id=2602829 .
Yuval Filmus

13

Đối với câu hỏi đầu tiên của bạn, tôi nghĩ bạn có thể chỉ ra rằng whp là Lưu ý rằng đây là .XmaxXsec-max

o(mnlog2lognlogn).
o(m/n)

So sánh thử nghiệm ngẫu nhiên của bạn với phương án sau: Đặt là tải tối đa của bất kỳ xô nào trong số thùng đầu tiên . Đặt là tải tối đa của bất kỳ thùng cuối cùng nào .X1n/2X2n/2

Khi xem xét,là giới hạn trên của . Ngoài ra, với xác suất ít nhất một nửa, . Vì vậy, nói đại khái, được phân phối tương tự như.|X1X2|XmaxXsecmax|X1X2|=XmaxXsecmaxXmaxXsecmax|X1X2|

Học, lưu ý rằng với các quả bóng có xác suất cao được ném vào thùng đầu tiên , và tương tự như vậy đối với thùng cuối cùng . Vì vậy, và đều được phân phối về cơ bản giống như tải tối đa khi ném các quả bóng vào thùng.|X1X2|m/2±O(m)n/2n/2X1X2m=m/2±o(m)n=n/2

Phân phối này được nghiên cứu kỹ và may mắn cho lập luận này, tập trung chặt chẽ xung quanh ý nghĩa của nó. Ví dụ: nếu , thì với xác suất cao khác với kỳ vọng của nó nhiều nhất là số lượng được hiển thị ở đầu câu trả lời này [ Thm. 1 ]. (Lưu ý: giới hạn trên này, tôi nghĩ là lỏng lẻo, đưa ra câu trả lời của Yuri.) Vì vậy, với xác suất cao và cũng khác nhau nhiều nhất, và vì vậy và khác nhau nhiều nhấtmnlog3nX1X1X2XmaxXmaxsec

Ngược lại, đối với giới hạn dưới (hơi yếu hơn), nếu, đối với bất kỳ , giả sử, , sau đó ít nhất là mà (bởi liên kết ngây thơ bị ràng buộc) ít nhất là Tôi nghĩ rằng điều này sẽ cung cấp cho bạn (ví dụ) kỳ vọng của trong một yếu tố tiếp theo.Pr [ | X 1 - X 2 | t ] tPr[|X1X2|t]3/4Pr[XmaxXsec-maxt]

Pr[|X1X2|t  XmaxXsec-max=|X1X2|]
1(1/4)(1/2)=1/4.XmaxXsec-max

Nhìn Thm. 1, sự khác biệt so với kỳ vọng là , và không phải những gì bạn đã viết. Điều đó vẫn tốt hơn nhiều so với . O((m/n)loglogn)O((m/n)logn)
Yuval Filmus

Bởi Thm. 1 (trường hợp thứ 3 của nó), với mọi , với xác suất , mức tối đa trong bất kỳ thùng nào (m bóng trong n thùng) là Theo toán học của tôi (sử dụng ), thuật ngữ mở rộng thành một thuật ngữ tuyệt đối phụ gia củaTôi đang làm gì sai? ϵ>01o(1)
mn+2mlognn1(1±ϵ)loglogn2logn.
±εO(ε)1δ=1O(δ)±ϵ
O(ϵ)mlognn loglognlogn = O(ϵ)mn log2lognlogn.
Neal Young

À - tôi đoán là bạn đúng. Tôi đã trừ đi bên trong căn bậc hai và đó là cách tôi có được hình của mình.
Yuval Filmus
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.