Vẽ n khoảng cách đều nhau ngẫu nhiên, xác suất có ít nhất một khoảng trùng lặp với tất cả các khoảng khác


17

Rút ngẫu nhiên khoảng từ , trong đó mỗi điểm cuối A, B được chọn từ phân bố đồng đều giữa .[ 0 , 1 ] [ 0 , 1 ]n[0,1][0,1]

Xác suất mà ít nhất một khoảng trùng lặp với tất cả các khoảng khác là gì?


Bạn có thể xem xác suất mà rút ra cuối cùng nhỏ hơn mức tối thiểu của tất cả rút trước đó và xác suất cuối cùng lớn hơn tối đa của tất cả rút trước đó . Điều này sẽ hữu ích. Sau đó, tăng xác suất để tính đến thực tế là chúng ta không cần cái cuối cùng , nhưng bất kỳ cái nào . (Tôi không có thời gian để giải quyết nó, nhưng có vẻ như đó là một vấn đề nhỏ vui vẻ. Chúc may mắn!) A B n BAnABnB
S. Kolassa - Tái lập Monica

Có thể hơi ngạc nhiên khi (1) câu trả lời không phụ thuộc vào phân phối (chỉ có điều đó là liên tục) và (2) cho là không đổi! n>1
whuber

1
Đây có phải là cách n th khoảng là construted: i) vẽ hai con số thống nhất một cách ngẫu nhiên từ [0,1], ii) thẫn thờ nhìn người nhỏ hơn được và lớn hơn một ? B nAnBn
ekvall

Câu trả lời:


5

Bài đăng này trả lời câu hỏi và phác thảo một phần tiến trình để chứng minh nó đúng.


Với , câu trả lời tầm thường là . Đối với tất cả lớn hơn , nó (đáng ngạc nhiên) luôn luôn là .1 n 2 / 3n=11n2/3

Để xem tại sao, trước tiên hãy quan sát rằng câu hỏi có thể được khái quát cho bất kỳ phân phối liên tục (thay cho phân phối thống nhất). Quá trình mà các khoảng được tạo ra để vẽ iid biến thiên từ và tạo thành các khoảngn 2 n X 1 , X 2 , Mạnh , X 2 n FFn2nX1,X2,,X2nF

[min(X1,X2),max(X1,X2)],,[min(X2n1,X2n),max(X2n1,X2n)].

Bởi vì tất cả của là độc lập, chúng có thể trao đổi. Điều này có nghĩa là giải pháp sẽ giống nhau nếu chúng ta ngẫu nhiên hoán vị tất cả chúng. Do đó, chúng ta hãy dựa vào số liệu thống kê đơn hàng thu được bằng cách sắp xếp :X i X i2nXiXi

X(1)<X(2)<<X(2n)

(trong đó, vì là liên tục, không có cơ hội nào có hai số bằng nhau). Khoảng được hình thành bằng cách chọn một hoán vị ngẫu nhiên và kết nối chúng theo cặpn σ S 2 nFnσS2n

[min(Xσ(1),Xσ(2)),max(Xσ(1),Xσ(2))],,[min(Xσ(2n1),Xσ(2n)),max(Xσ(2n1),Xσ(2n))].

Cho dù hai trong số này có trùng nhau hay không không phụ thuộc vào các giá trị của ,X(i) bởi vì sự chồng lấp được bảo toàn bởi bất kỳ phép chuyển đổi đơn điệu nào và có như vậy các phép biến đổi gửi cho . Do đó, không mất bất kỳ tính tổng quát nào, chúng tôi có thể lấy và câu hỏi trở thành:X ( i ) i X ( i ) =if:RRX(i)iX(i)=i

Đặt tập hợp được phân chia thành cặp đôi khác nhau. Bất kỳ hai trong số chúng, và (với ), trùng nhau khi và . Giả sử rằng một phân vùng là "tốt" khi ít nhất một trong các thành phần của nó chồng lấp lên tất cả các yếu tố khác (và mặt khác là "xấu"). Là một hàm của , tỷ lệ của các phân vùng tốt là gì?n { l 1 , r 1 } { l 2 , r 2 } l i < r i r 1 > l 2 r 2 > l 1 n{1,2,,2n1,2n}n{l1,r1}{l2,r2}li<rir1>l2r2>l1n

Để minh họa, hãy xem xét trường hợp . Có ba phân vùng,n=2

{{1,2},{3,4}}, {{1,4},{2,3}}, {{1,3},{2,4}},

trong đó hai cái tốt (thứ hai và thứ ba) đã được tô màu đỏ. Do đó, câu trả lời trong trường hợp là .2 / 3n=22/3

Chúng tôi có thể vẽ biểu đồ các phân vùng như vậy bằng cách vẽ các điểm trên một dòng số và vẽ các đoạn đường giữa mỗi và , bù lại chúng một chút để giải quyết sự chồng chéo trực quan. Dưới đây là các ô của ba phân vùng trước, theo cùng một thứ tự với cùng màu:{ 1 , 2 , Mạnh , 2 n } l i r i{{li,ri},i=1,2,,n}{1,2,,2n}liri

Hình 1

Từ bây giờ, để phù hợp với các lô như vậy dễ dàng trong định dạng này, tôi sẽ chuyển chúng sang một bên. Chẳng hạn, đây là phân vùng cho , một lần nữa với các phân vùng tốt có màu đỏ:n = 315n=3

Hình 2

Mười là tốt, vì vậy câu trả lời cho là .10 / 15 = 2 / 3n=310/15=2/3

Tình huống thú vị đầu tiên xảy ra khi . Bây giờ, lần đầu tiên, có thể kết hợp các khoảng đến mà không có bất kỳ một trong số chúng giao nhau với nhau. Một ví dụ là . Sự kết hợp của các phân đoạn dòng chạy liên tục từ đến nhưng đây không phải là một phân vùng tốt. Tuy nhiên, trong số phân vùng là tốt và tỷ lệ vẫn là .1 2 n { { 1 , 3 } , { 2 , 5 } , { 4 , 7 } , { 6 , 8 } } 1 8 70 105 2 / 3n=412n{{1,3},{2,5},{4,7},{6,8}}18701052/3


Số lượng phân vùng tăng nhanh với : nó bằng . Liệt kê đầy đủ tất cả các khả năng thông qua tiếp tục mang lại như câu trả lời. Mô phỏng Monte-Carlo qua (sử dụng lần lặp trong mỗi lần) cho thấy không có sai lệch đáng kể so với .1 3 5 2 n - 1 = ( 2 n ) ! / ( 2 n n ! ) N = 7 2 / 3 n = 100 10000 2 / 3n1352n1=(2n)!/(2nn!)n=72/3n=100100002/3

Tôi tin rằng có một cách thông minh, đơn giản để chứng minh luôn có tỷ lệ của phân vùng tốt đến xấu, nhưng tôi không tìm thấy. Một bằng chứng có sẵn thông qua tích hợp cẩn thận (sử dụng phân phối thống nhất ban đầu của ), nhưng nó khá liên quan và không làm sáng tỏ.X i2:1Xi


Rất tuyệt. Tôi có một thời gian khó khăn để làm theo nghĩa của "điều kiện thống kê đơn hàng", liệu có thể thêm một dòng trực giác? Có vẻ như một kỹ thuật hữu ích. Tôi hiểu rằng có thể trao đổi, thực sự thậm chí là , rằng điều này cho phép chúng tôi xem xét bất kỳ hoán vị. i i dXiiid
ekvall

1
@Student Để "điều kiện trên" có nghĩa là, hãy tạm thời giữ các giá trị này cố định và xem xét những gì chúng ta có thể học được từ đó. Sau đó, chúng tôi sẽ để những giá trị đó thay đổi (theo phân phối xác suất của chúng). Trong trường hợp này, một khi chúng tôi thấy rằng câu trả lời là bất kể giá trị cố định của thống kê đơn hàng, thì chúng tôi không còn phải thực hiện bước thứ hai là thay đổi thống kê đơn hàng. Về mặt toán học, các số liệu thống kê thứ tự là một biến có giá trị véc tơ và chỉ số tốt là , vì vậy2/3 XY
E(Y)=E(E(Y|X))=E(2/3)=2/3.
whuber
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.