Ném quả bóng vào thùng, ước tính xác suất thấp hơn


14

Đây không phải là một bài tập về nhà, mặc dù nó trông như thế. Bất kỳ tài liệu tham khảo đều được chào đón. :-)

Kịch bản: Có quả bóng khác nhau và thùng khác nhau (được dán từ 1 đến , từ trái sang phải). Mỗi quả bóng được ném độc lập và thống nhất vào thùng. Gọi là số lượng bóng trong thùng thứ . Đặt biểu thị sự kiện sau.n n f ( i ) i E in n nf(i)iEi

Với mỗi ,jikjf(k)j1

Đó là, các thùng đầu tiên (các thùng bên trái nhiều nhất ) chứa ít hơn các quả bóng , cho mỗi .jjjji

Câu hỏi: Ước tính i<nPr(Ei) , tính theo n ? Khi n đi vô cùng. Một hạ lưu được ưa thích. Tôi không nghĩ rằng một công thức dễ dàng tính ra.

limnPr(E1)=limn(n1n)n=1ePr(En)=0

Tôi đoán: Tôi đoán i<nPr(Ei)=lnn , khi n đi vô cùng. Tôi coi là người đầu tiên lnn mục trong tổng.


1
Nó trông giống như một cặp từ vấn đề sinh nhật ..
Gopi

@Gopi Tôi không thể thuyết phục bản thân rằng câu hỏi của tôi là vấn đề sinh nhật bị hạn chế. Bạn có thể giải thích rõ ràng về nó? Cảm ơn rât nhiều. Lưu ý: Ràng buộc nằm trên tổng số bóng trong các thùng j đầu tiên j, không phải trên số lượng thùng trên thùng cụ thể.
Bành Trương

Thật vậy, xấu của tôi, sau khi đọc lại bài viết trên wikipedia về vấn đề sinh nhật tôi nhận ra tôi đang xem xét một vấn đề khác được điều chỉnh từ vấn đề Sinh nhật.
Gopi

2
Một số ý tưởng không chính xác ... Vì vậy, hãy suy nghĩ về cách mã hóa trạng thái: Đọc mẫu thùng từ trái sang phải. Nếu thùng thứ nhất có i bi, hãy xuất một chuỗi gồm i, tiếp theo là 0. Thực hiện việc này cho tất cả các thùng từ trái sang phải. Mã hóa của bạn dường như là bạn quan tâm đến i lớn nhất sao cho chuỗi nhị phân này (có n số 0 và n) lần đầu tiên nó chứa nhiều số hơn số không. Bây giờ, hãy tạo ra một bước nhảy của số phận và tạo 0 và 1 với xác suất bằng . (Điều này có thể là hoàn toàn vô nghĩa). Vấn đề này liên quan đến số Catalan và từ Dyck. Và ... ??? 1/2
Sariel Har-Peled

4
Tôi không thấy trong phần nói xấu của bạn tại sao vấn đề là các quả bóng lại khác nhau. Ngoài ra, việc giới thiệu chuỗi sẽ đưa vào thực tế rằng các thùng là khác nhau.
Sariel Har-Peled

Câu trả lời:


11

EDIT: (2014-08-08) Như Douglas Zare đã chỉ ra trong các bình luận, lập luận dưới đây, cụ thể là "cầu nối" giữa hai xác suất, là không chính xác. Tôi không thấy một cách đơn giản để sửa chữa nó. Tôi sẽ để lại câu trả lời ở đây vì tôi tin rằng nó vẫn cung cấp một số trực giác, nhưng biết rằng nói chung là không đúng.

Pr(Em)l=1mPr(Fl)

Đây sẽ không phải là một câu trả lời hoàn chỉnh nhưng hy vọng nó sẽ có đủ nội dung mà bạn hoặc ai đó hiểu biết hơn bản thân tôi có thể hoàn thành nó.

Hãy xem xét xác suất của chính xác quả bóng rơi vào thùng (của ) đầu tiên :kln

(nk)(ln)k(nln)nk

Gọi xác suất mà ít hơn quả bóng rơi vào đầu tiên thùng :l F lllFl

Pr(Fl)=k=0l1(nk)(ln)k(nln)nk

Xác suất mà sự kiện, , ở trên xảy ra ít hơn nếu chúng ta xem xét từng sự kiện của xảy ra độc lập và tất cả cùng một lúc. Điều này cho chúng ta một cầu nối giữa hai:F lElFl

Pr(Em)l=1mPr(Fl)=l=1m(k=1l1(nk)(lnk)(nln)nk)=l=1mF(l1;n,ln)

Trong đó là hàm phân phối tích lũy cho phân phối Binomial với . Chỉ cần đọc một vài dòng trên trang Wikipedia và lưu ý rằng , chúng ta có thể sử dụng bất đẳng thức của Chernoff để có được:p=lF(l1;n,ln) (l-1pn)p=ln(l1pn)

Pr(Em)l=1mexp[12l]=exp[12l=1m1l]=exp[12Hm]exp[12(12m+ln(m)+γ)]

Trong đó là Số hài hòa thứ , là hằng số Euler-Mascheroni và bất đẳng thức cho được lấy từ trang liên kết MathWorld của Wolfram. m γ H mHmmγHm

Không phải lo lắng về yếu tố , điều này cuối cùng cũng mang lại cho chúng ta:e1/4m

Pr(Em)eγ/2m

Dưới đây là một biểu đồ log-log trung bình 100.000 thể hiện cho là hàm của với hàm cũng được vẽ để tham khảo:m e - γ / 2n=2048meγ/2m

enter image description here

Trong khi các hằng số tắt, hình thức của hàm có vẻ đúng.

Dưới đây là một biểu đồ log-log để thay đổi với mỗi điểm là trung bình 100.000 thể hiện dưới dạng hàm của :mnm

enter image description here

Cuối cùng, nhận được câu hỏi ban đầu mà bạn muốn trả lời, vì chúng tôi biết rằng chúng tôi có:Pr(Em)1m

i<nPr(Ei)n

Và như xác minh bằng số, bên dưới là biểu đồ log-log của tổng, , so với kích thước cá thể, . Mỗi điểm đại diện cho mức trung bình của tổng số 100.000 trường hợp. Hàm đã được vẽ để tham khảo:n x 1 / 2Snx1/2

enter image description here

Mặc dù tôi thấy không có mối liên hệ trực tiếp nào giữa hai người, nhưng các thủ thuật và hình thức cuối cùng của vấn đề này có rất nhiều điểm tương đồng với Vấn đề sinh nhật như đã đoán ban đầu trong các bình luận.


4
Làm thế nào để bạn có được ? Ví dụ: với , tôi tính rằngNếu bạn được thông báo rằng thùng thứ nhất trống, điều này có làm cho ít nhiều khả năng hai thùng đầu tiên chứa nhiều nhất quả bóng không? Có nhiều khả năng, vì vậy là một sự đánh giá thấp. n = 100 P r ( E 2 ) = 0.27946 > 0.14761 = P r ( F 1 ) P r ( F 2 ) . 1 P r ( F 1 ) P r ( F 2 )Pr(E2)Pr(F1)×Pr(F2)n=100Pr(E2)=0.267946>0.14761=Pr(F1)Pr(F2).1Pr(F1)Pr(F2)
Douglas Zare

@DoumundZare, tôi đã xác minh tính toán của bạn, bạn đã đúng. Phục vụ tôi ngay vì không khắt khe hơn.
dùng834

15

Câu trả lời là .Θ(n)

Đầu tiên, hãy tính .En1

Giả sử chúng ta ném quả bóng vào thùng và xem xét khả năng một thùng có chính xác quả bóng trong đó. Xác suất này xuất phát từ phân phối Poisson và khi đi đến xác suất có chính xác bóng trong một thùng nhất định là .n k n k 1nnknk1e1k!

Bây giờ, hãy xem xét một cách khác nhau để phân phối bóng vào thùng. Chúng tôi ném một số quả bóng vào mỗi thùng được chọn từ bản phân phối Poisson và với điều kiện có tổng số quả bóng. Tôi khẳng định rằng điều này mang lại sự phân phối chính xác giống như ném quả bóng vào thùng. Tại sao? Dễ dàng thấy rằng xác suất có bóng trong thùng thứ tỷ lệ thuận với Trong cả hai bản phân phối.n n k j j n j = 1 1nnnkjjj=1n1kj!

Vì vậy, hãy xem xét một bước đi ngẫu nhiên trong đó ở mỗi bước, bạn đi từ đến với xác suất . Tôi khẳng định rằng nếu bạn đưa ra điều kiện rằng bước đi ngẫu nhiên này trở về 0 sau bước, thì xác suất ngẫu nhiên này luôn duy trì trên là xác suất mà OP muốn tính toán. Tại sao? Chiều cao này bước đi ngẫu nhiên này sau khi bước là trừ đi số quả bóng trong lần đầu tiên thùng.t + 1 - k 1tt+1kn0sss1e1k!n0sss

Nếu chúng tôi đã chọn đi bộ ngẫu nhiên với xác suất tăng hoặc giảm trên mỗi bước, thì đây sẽ là vấn đề bỏ phiếu cổ điển , trong đó câu trả lời là . Đây là một biến thể của vấn đề lá phiếu đã được nghiên cứu (xem bài viết này ) và câu trả lời vẫn là . Tôi không biết liệu có một cách dễ dàng để tính hằng số cho cho trường hợp này hay không. 11121 Θ(112(n1)Θ(1Θ(1n)Θ(1n)

Bài báo tương tự cho thấy rằng khi đi bộ ngẫu nhiên có điều kiện kết thúc ở độ cao , xác suất luôn luôn dương là miễn là . Thực tế này sẽ cho phép chúng tôi ước tính cho bất kỳ .kΘ(k/n)k=O(n)Ess

Tôi sẽ trở thành một chút sóng gió cho phần còn lại của câu trả lời của mình, nhưng các kỹ thuật xác suất tiêu chuẩn có thể được sử dụng để làm cho điều này trở nên nghiêm ngặt.

Chúng ta biết rằng khi đi đến , bước đi ngẫu nhiên này hội tụ đến một cây cầu Brown, tức là chuyển động Brown được điều hòa để bắt đầu và kết thúc ở . Từ các định lý xác suất chung, đối với , bước đi ngẫu nhiên là khoảng cách xa -axis. Trong trường hợp nó có chiều cao , xác suất nó ở trên trong toàn bộ thời gian trước là . Vì có khả năng là khi , nên chúng tôi cón0ϵn<s<(1ϵ)nΘ(n)xt>00sΘ(t/s)tΘ(n)s=Θ(n)EsΘ(1/n).


4

[Chỉnh sửa 2014-08-13: Nhờ nhận xét của Peter Shor, tôi đã thay đổi ước tính về tốc độ tăng trưởng tiệm cận của loạt bài này.]

Niềm tin của tôi là phát triển như limni<nPr(Ei) . Tôi không có bằng chứng nhưng tôi nghĩ tôi có một lý lẽ thuyết phục.n

Đặt là một biến ngẫu nhiên cho số lượng bóng trong bin i . Hãy B i , j = Σ j k = i B k là một biến ngẫu nhiên cung cấp cho tổng số quả bóng trong thùng i qua j toàn diện.Bi=f(i)iBi,j=k=ijBkij

Bây giờ bạn có thể viết đối với bất kỳ j < i . Cuối cùng, hãy giới thiệu các hàm πg i .Pr(Ei)=b<jPr(EjB1,j=b)Pr(EiEjB1,j=b)j<iπgi

π(j,k,b)=Pr(Bj=kB1,j1=b)=(nbk)(1nj+1)k(njnj+1)nbk

gi(j,k,b)=Pr(EiBj,ikEj1B1,j1=b)={0k<01k>=0j>il=0jb1π(j,l,b)gi(j+1,kl,b+l)otherwise

Chúng ta có thể viết theo g i :Pr(Ei)gi

Pr(Ei)=gi(1,i1,0)

Bây giờ, rõ ràng từ định nghĩa của rằnggi

Pr(Ei)=(ni)ni+1nnhi(n)

Trong đó là một đa thức tính theo n bậc i - 1 . Điều này làm cho một số ý nghĩa trực quan quá; ít nhất n - i + 1 quả bóng sẽ phải được đặt vào một trong các ( i + 1 ) thông qua các thùng thứ n (trong đó có n - i ).hi(n)ni1ni+1(i+1)nni

Kể từ khi chúng tôi chỉ nói về khi n , chỉ có hệ số chính của h i ( n ) là có liên quan; hãy gọi hệ số này i . Sau đóPr(Ei)nhi(n)ai

limnPr(Ei)=aiei

Làm thế nào để chúng ta tính toán ? Chà, đây là nơi tôi sẽ làm một chút rửa tay. Nếu bạn thực hiện một vài E i đầu tiên , bạn sẽ thấy rằng một mô hình xuất hiện trong tính toán của hệ số này. Bạn có thể viết nó như làaiEi

trong đó μ i ( j , k , b ) = { 0 k < 0 1 k > = 0 i > j j - b - 1 l = 0 1

ai=μi(1,i1,0)
μi(j,k,b)={0k<01k>=0i>jl=0jb11l!μi(j+1,kl,b+l)otherwise

Bây giờ, tôi không thể lấy được một dạng tương đương trực tiếp, nhưng tôi đã tính 20 giá trị đầu tiên của :Pr(Ei)

N       a_i/e^i
1       0.367879
2       0.270671
3       0.224042
4       0.195367
5       0.175467
6       0.160623
7       0.149003
8       0.139587
9       0.131756
10      0.12511
11      0.119378
12      0.114368
13      0.10994
14      0.105989
15      0.102436
16      0.0992175
17      0.0962846
18      0.0935973
19      0.0911231
20      0.0888353

Bây giờ, hóa ra

Pr(Ei)=iii!ei=Pois(i;i)

Pois(i;λ)Xiλ

limni=1nPr(Ei)=x=1xxx!ex

Pr(Ei)

limnPr(Ex)=xxx!ex12πx

Để cho

ϕ(x)=12πx

Từ

  • limxϕ(x)ϕ(x+1)=1
  • ϕ(x)
  • 1nϕ(x)dxn

1nϕ(x)dx

i=1nPr(Ei)=Θ(n)

1
xx/(x!ex)1/2πx

@PeterShor Cảm ơn! Tôi đã cập nhật kết luận nhờ vào cái nhìn sâu sắc của bạn, và bây giờ tôi đồng ý với hai câu trả lời khác. Thật thú vị với tôi khi thấy 3 cách tiếp cận khá khác nhau cho vấn đề này.
ruds

4

nnn12π2

n!2nnk=0n2nkk!

Oeis khá tuyệt vời
Thomas Ahle
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.