Rút ngẫu nhiên khoảng từ , trong đó mỗi điểm cuối A, B được chọn từ phân bố đồng đều giữa .[ 0 , 1 ] [ 0 , 1 ]
Xác suất mà ít nhất một khoảng trùng lặp với tất cả các khoảng khác là gì?
Rút ngẫu nhiên khoảng từ , trong đó mỗi điểm cuối A, B được chọn từ phân bố đồng đều giữa .[ 0 , 1 ] [ 0 , 1 ]
Xác suất mà ít nhất một khoảng trùng lặp với tất cả các khoảng khác là gì?
Câu trả lời:
Bài đăng này trả lời câu hỏi và phác thảo một phần tiến trình để chứng minh nó đúng.
Với , câu trả lời tầm thường là . Đối với tất cả lớn hơn , nó (đáng ngạc nhiên) luôn luôn là .1 n 2 / 3
Để xem tại sao, trước tiên hãy quan sát rằng câu hỏi có thể được khái quát cho bất kỳ phân phối liên tục (thay cho phân phối thống nhất). Quá trình mà các khoảng được tạo ra để vẽ iid biến thiên từ và tạo thành các khoảngn 2 n X 1 , X 2 , Mạnh , X 2 n F
Bởi vì tất cả của là độc lập, chúng có thể trao đổi. Điều này có nghĩa là giải pháp sẽ giống nhau nếu chúng ta ngẫu nhiên hoán vị tất cả chúng. Do đó, chúng ta hãy dựa vào số liệu thống kê đơn hàng thu được bằng cách sắp xếp :X i X i
(trong đó, vì là liên tục, không có cơ hội nào có hai số bằng nhau). Khoảng được hình thành bằng cách chọn một hoán vị ngẫu nhiên và kết nối chúng theo cặpn σ ∈ S 2 n
Cho dù hai trong số này có trùng nhau hay không không phụ thuộc vào các giá trị của , bởi vì sự chồng lấp được bảo toàn bởi bất kỳ phép chuyển đổi đơn điệu nào và có như vậy các phép biến đổi gửi cho . Do đó, không mất bất kỳ tính tổng quát nào, chúng tôi có thể lấy và câu hỏi trở thành:X ( i ) i X ( i ) =i
Đặt tập hợp được phân chia thành cặp đôi khác nhau. Bất kỳ hai trong số chúng, và (với ), trùng nhau khi và . Giả sử rằng một phân vùng là "tốt" khi ít nhất một trong các thành phần của nó chồng lấp lên tất cả các yếu tố khác (và mặt khác là "xấu"). Là một hàm của , tỷ lệ của các phân vùng tốt là gì?n { l 1 , r 1 } { l 2 , r 2 } l i < r i r 1 > l 2 r 2 > l 1 n
Để minh họa, hãy xem xét trường hợp . Có ba phân vùng,
trong đó hai cái tốt (thứ hai và thứ ba) đã được tô màu đỏ. Do đó, câu trả lời trong trường hợp là .2 / 3
Chúng tôi có thể vẽ biểu đồ các phân vùng như vậy bằng cách vẽ các điểm trên một dòng số và vẽ các đoạn đường giữa mỗi và , bù lại chúng một chút để giải quyết sự chồng chéo trực quan. Dưới đây là các ô của ba phân vùng trước, theo cùng một thứ tự với cùng màu:{ 1 , 2 , Mạnh , 2 n } l i r i
Từ bây giờ, để phù hợp với các lô như vậy dễ dàng trong định dạng này, tôi sẽ chuyển chúng sang một bên. Chẳng hạn, đây là phân vùng cho , một lần nữa với các phân vùng tốt có màu đỏ:n = 3
Mười là tốt, vì vậy câu trả lời cho là .10 / 15 = 2 / 3
Tình huống thú vị đầu tiên xảy ra khi . Bây giờ, lần đầu tiên, có thể kết hợp các khoảng đến mà không có bất kỳ một trong số chúng giao nhau với nhau. Một ví dụ là . Sự kết hợp của các phân đoạn dòng chạy liên tục từ đến nhưng đây không phải là một phân vùng tốt. Tuy nhiên, trong số phân vùng là tốt và tỷ lệ vẫn là .1 2 n { { 1 , 3 } , { 2 , 5 } , { 4 , 7 } , { 6 , 8 } } 1 8 70 105 2 / 3
Số lượng phân vùng tăng nhanh với : nó bằng . Liệt kê đầy đủ tất cả các khả năng thông qua tiếp tục mang lại như câu trả lời. Mô phỏng Monte-Carlo qua (sử dụng lần lặp trong mỗi lần) cho thấy không có sai lệch đáng kể so với .1 ⋅ 3 ⋅ 5 ⋯ ⋅ 2 n - 1 = ( 2 n ) ! / ( 2 n n ! ) N = 7 2 / 3 n = 100 10000 2 / 3
Tôi tin rằng có một cách thông minh, đơn giản để chứng minh luôn có tỷ lệ của phân vùng tốt đến xấu, nhưng tôi không tìm thấy. Một bằng chứng có sẵn thông qua tích hợp cẩn thận (sử dụng phân phối thống nhất ban đầu của ), nhưng nó khá liên quan và không làm sáng tỏ.X i