Hãy giải thích nghịch lý chờ đợi


75

Vài năm trước tôi đã thiết kế một máy dò phóng xạ hoạt động bằng cách đo khoảng thời gian giữa các sự kiện thay vì đếm chúng. Giả định của tôi là, khi đo các mẫu không liền kề, trung bình tôi sẽ đo được một nửa khoảng thời gian thực tế. Tuy nhiên, khi tôi kiểm tra mạch với nguồn được hiệu chỉnh, số đọc là hệ số hai quá cao, điều đó có nghĩa là tôi đã đo được toàn bộ khoảng thời gian.

Trong một cuốn sách cũ về xác suất và thống kê, tôi đã tìm thấy một phần về một thứ gọi là "Nghịch lý chờ đợi". Nó đưa ra một ví dụ trong đó một chiếc xe buýt đến trạm xe buýt cứ sau 15 phút và một hành khách đến ngẫu nhiên, nó nói rằng trung bình hành khách sẽ đợi đủ 15 phút. Tôi chưa bao giờ có thể hiểu toán được trình bày với ví dụ và tiếp tục tìm kiếm một lời giải thích. Nếu ai đó có thể giải thích lý do tại sao hành khách chờ đợi khoảng thời gian đầy đủ, tôi sẽ ngủ ngon hơn.


1
Tiêu đề là gì và ai là tác giả của cuốn sách? Bạn có thể sao chép từ ví dụ cho từ ở đây?
Joel Reyes Noche

Đây không phải là chuyên môn của tôi, nhưng nghịch lý được OP đề cập có giống với nghịch lý kiểm tra không?
Joel Reyes Noche


1
Có vẻ như dự đoán của tôi ở trên có một số hỗ trợ. Một bình luận cho câu trả lời này đề cập đến nghịch lý kiểm tra.
Joel Reyes Noche

2
Tôi nghĩ rằng việc sử dụng xe buýt là sự tương tự là khó hiểu, vì các xe buýt có xu hướng tuân theo lịch trình. Thay vào đó hãy suy nghĩ về việc sẽ mất bao lâu để một chiếc taxi trống sẽ xuất hiện khi trung bình cứ sau 15 phút lại có một chiếc taxi.
Harvey Motulsky

Câu trả lời:


48

Như Glen_b đã chỉ ra, nếu xe buýt đến sau mỗi phút mà không có bất kỳ sự không chắc chắn nào , chúng tôi biết rằng thời gian chờ tối đa có thể là phút. Nếu từ phần của chúng tôi đến "ngẫu nhiên", chúng tôi cảm thấy rằng "trung bình" chúng tôi sẽ đợi một nửa thời gian chờ tối đa có thể . Và thời gian chờ tối đa có thể ở đây bằng với độ dài tối đa có thể giữa hai lần đến liên tiếp. Biểu thị thời gian chờ đợi của chúng tôi và độ dài tối đa giữa hai chuyến xe buýt liên tiếp và chúng tôi lập luận rằng1515WR

(1)E(W)=12R=152=7.5

và chúng tôi đúng.

Nhưng đột nhiên sự chắc chắn bị lấy đi từ chúng tôi và chúng tôi được thông báo rằng phút bây giờ là độ dài trung bình giữa hai chuyến xe buýt. Và chúng tôi rơi vào "bẫy suy nghĩ trực quan" và nghĩ: "chúng tôi chỉ cần thay bằng giá trị mong đợi của nó", và chúng tôi lập luận15R

(2)E(W)=12E(R)=152=7.5WRONG

Một dấu hiệu đầu tiên cho thấy chúng tôi sai, đó là không phải là "chiều dài giữa hai chuyến xe buýt liên tiếp bất kỳ", đó là " chiều dài tối đa, v.v.". Vì vậy, trong mọi trường hợp, chúng ta có .RE(R)15

Làm thế nào chúng ta đến phương trình ? Chúng tôi nghĩ: "thời gian chờ có thể từ đến tối đa . Tôi đến với xác suất bằng nhau trong mọi trường hợp, vì vậy tôi" chọn "ngẫu nhiên và với xác suất bằng nhau tất cả thời gian chờ có thể. Do đó, một nửa chiều dài tối đa giữa hai lần xe buýt liên tiếp là của tôi thời gian chờ đợi trung bình ". Và chúng tôi đúng.(1)015

Nhưng bằng cách chèn nhầm giá trị vào phương trình , nó không còn phản ánh hành vi của chúng ta nữa. Với thay cho , phương trình cho biết "Tôi chọn ngẫu nhiên và với xác suất bằng nhau tất cả thời gian chờ có thể nhỏ hơn hoặc bằng độ dài trung bình giữa hai lần đến của xe buýt liên tiếp " -và đây là nơi trực quan của chúng tôi sai lầm là bởi vì, hành vi của chúng tôi không thay đổi - vì vậy, bằng cách đến một cách ngẫu nhiên, trong thực tế chúng tôi vẫn "chọn ngẫu nhiên và có xác suất bằng nhau" tất cả thời gian chờ có thể - nhưng "tất cả thời gian chờ có thể" không bị bắt bởi15(2)15E(R)(2)15 - chúng tôi đã quên phần đuôi bên phải của sự phân bố độ dài giữa hai chuyến xe buýt liên tiếp.

Vì vậy, có lẽ, chúng ta nên tính giá trị dự kiến ​​của độ dài tối đa giữa hai chuyến xe buýt liên tiếp bất kỳ, đây có phải là giải pháp chính xác?

Đúng vậy, nhưng : "nghịch lý" cụ thể đi đôi với một giả định ngẫu nhiên cụ thể: việc xe buýt đến được mô hình hóa theo quy trình Poisson chuẩn, có nghĩa là do hậu quả mà chúng ta cho rằng thời gian giữa bất kỳ hai chuyến xe buýt liên tiếp nào cũng tuân theo phân phối theo cấp số nhân. Biểu thị chiều dài đó và chúng ta có điều đó

f()=λeλ,λ=1/15,E()=15

Tất nhiên, điều này là gần đúng, vì phân phối mũ có sự hỗ trợ không giới hạn từ bên phải, có nghĩa là nói đúng "tất cả thời gian chờ đợi có thể" bao gồm, theo giả định mô hình này, cường độ lớn hơn và lớn hơn và "bao gồm" vô hạn, nhưng với xác suất biến mất .

Nhưng chờ đã, Exponential là không nhớ : bất kể thời điểm nào chúng ta sẽ đến, chúng ta phải đối mặt với cùng một biến ngẫu nhiên , bất kể những gì đã đi trước đó.

Với giả định ngẫu nhiên / phân phối này, bất kỳ thời điểm nào cũng là một phần của "khoảng thời gian giữa hai chuyến xe buýt liên tiếp" có chiều dài được mô tả bởi cùng phân phối xác suất với giá trị dự kiến ​​(không phải giá trị tối đa) : "Tôi ở đây, tôi ở đây được bao quanh bởi một khoảng giữa hai chuyến xe buýt. Một số chiều dài của nó nằm ở quá khứ và một số trong tương lai nhưng tôi không có cách nào để biết bao nhiêu và bao nhiêu, vì vậy điều tốt nhất tôi có thể làm là hỏi chiều dài dự kiến ​​của nó là bao nhiêu - đó sẽ là thời gian chờ đợi trung bình của tôi? " - Và câu trả lời luôn là " ", than ôi. 1515


+1 Rất đẹp. có lẽ nên đọc ? f()fλ()
amip

Cảm ơn. Đối với ký hiệu, cả hai được sử dụng để chỉ những thứ khác nhau. Những gì tôi đã viết là dọc theo các dòng nhấn mạnh có mật độ biến ngẫu nhiên là bởi vì trong các phép biến đổi khác nhau, chúng ta có thể kết thúc bằng một cái gì đó như . Những gì bạn đề nghị là nhấn mạnh khía cạnh tham số của mật độ. fX(y)
Alecos Papadopoulos

80

Nếu xe buýt đến "cứ sau 15 phút" (tức là theo lịch trình) thì thời gian chờ đợi trung bình của hành khách (đến ngẫu nhiên) thực sự chỉ là 7,5 phút, bởi vì nó sẽ được phân phối đồng đều trong khoảng cách 15 phút đó.

-

Mặt khác, nếu xe buýt đến ngẫu nhiên với tốc độ trung bình 4 mỗi giờ (tức là theo quy trình Poisson), thì thời gian chờ đợi trung bình lâu hơn nhiều; thực sự bạn có thể giải quyết nó thông qua việc thiếu thuộc tính bộ nhớ. Hãy đến nơi của hành khách làm điểm bắt đầu và thời gian cho sự kiện tiếp theo là theo cấp số nhân với thời gian trung bình là 15 phút.

Hãy để tôi có một tương tự thời gian rời rạc. Hãy tưởng tượng tôi đang lăn một cái chết với 15 khuôn mặt, một trong số đó được dán nhãn "B" (cho xe buýt) và 14 được dán nhãn "X" cho sự vắng mặt của xe buýt trong phút đó ( tồn tại súc sắc 30 mặt , vì vậy tôi có thể dán nhãn 2 khuôn mặt của một cái chết 30 mặt "B"). Vì vậy, một lần mỗi phút tôi lăn và xem nếu xe buýt đến. Cái chết không có ký ức; nó không biết có bao nhiêu cuộn kể từ "B" cuối cùng. Bây giờ hãy tưởng tượng một số sự kiện không liên quan xảy ra - một con chó sủa, một hành khách đến, tôi nghe thấy tiếng sấm sét. Từ giờ, tôi đợi bao lâu (bao nhiêu cuộn) cho đến khi "B" tiếp theo?

Do thiếu bộ nhớ, trung bình, tôi chờ cùng một lúc cho "B" tiếp theo là thời gian giữa hai chữ "B" liên tiếp.

[Tiếp theo hãy tưởng tượng tôi có một cái chết 60 mặt, tôi lăn cứ sau mười lăm giây (một lần nữa, với một mặt "B"); bây giờ hãy tưởng tượng tôi có một cái chết 1000 mặt, tôi cứ sau 0,9 giây (với một mặt "B" hoặc thực tế hơn, ba con xúc xắc 10 mặt mỗi cái và tôi gọi kết quả là "B" nếu cả 3 xuất hiện "10" cùng một lúc) ... vân vân. Trong giới hạn, chúng tôi nhận được quá trình Poisson thời gian liên tục.]

Một cách khác để xem xét nó là: Tôi có nhiều khả năng quan sát sự kiện 'bắt đầu đếm cuộn' của mình (tức là 'hành khách đến trạm xe buýt') trong một khoảng cách dài hơn một khoảng cách ngắn, theo đúng cách để thực hiện thời gian chờ trung bình giống như thời gian trung bình giữa các xe buýt (tôi chủ yếu chờ trong những khoảng trống dài và hầu như bỏ lỡ những khoảng thời gian ngắn nhất; vì tôi đến vào thời gian phân bố đồng đều, cơ hội tôi đến trong một khoảng cách dài là tỷ lệ thuận với )ttt

Là một người bắt xe buýt kỳ cựu, trong thực tế, thực tế dường như nằm ở đâu đó giữa 'xe buýt đến theo lịch trình' và 'xe buýt đến ngẫu nhiên'. Và đôi khi (trong lưu lượng truy cập xấu), bạn đợi một giờ rồi 3 người đến cùng một lúc (Zach xác định lý do cho điều đó trong các bình luận bên dưới).


6
Tôi nghĩ với các xe buýt cụ thể có một quy trình bổ sung trong đó một chiếc xe buýt muộn trở thành muộn hơn khi hành khách chen chúc vào nó, và chiếc xe buýt trống phía sau cuối cùng cũng bắt kịp (nhưng vẫn trống rỗng). = D
Zach

4
@Zach thực sự, đó là lý do tại sao họ có xu hướng co cụm trong thời gian dài, đặc biệt là trong lưu lượng truy cập lớn. Nơi tôi sống khi xe buýt chạy quá muộn, sắp hết giờ, đôi khi họ sẽ chèn thêm một chiếc xe buýt gần đúng giờ hơn dọc theo tuyến đường (tức là nó sẽ không có hành khách đến nơi mà xe buýt sẽ không ở rất xa lịch trình, thường đến đó thông qua một tuyến đường nhanh hơn) và bắt đầu đón khách mà bây giờ xe buýt chỉ trễ một chút. Trong khi đó, xe buýt rất muộn giờ trở thành xe buýt tiếp theo trong lịch trình một cách hiệu quả , một khi nó đến nơi xe buýt khác đến.
Glen_b

@Glen_b Đó là một ý tưởng thực sự tốt, hah!
Zach

Đó là một chiến lược chống vón cục hữu ích (ít nhất, nó giảm nhẹ những trường hợp xấu nhất); Tôi sẽ không đưa nó lên, ngoại trừ việc nó liên quan đến các vấn đề phụ thuộc mà các mô hình thời gian chờ xe buýt chính xác hơn có thể cần phải giải quyết.
Glen_b

10

Thêm về xe buýt ... Xin lỗi vì đã tham gia vào cuộc trò chuyện quá muộn trong cuộc thảo luận, nhưng tôi đã xem xét các quy trình Poisson gần đây ... Vì vậy, trước khi nó tuột khỏi tâm trí tôi, đây là một hình ảnh đại diện cho nghịch lý kiểm tra :

Sai lầm bắt nguồn từ giả định rằng vì xe buýt đi theo một kiểu đến nhất định với thời gian trung bình giữa các lần đến nhất định (nghịch đảo của tham số tỷ lệ Poisson , hãy gọi nó là phút. ), bằng cách hiển thị tại trạm xe buýt bất cứ lúc nào, bạn có hiệu lực để đón xe buýt. Vì vậy, nếu bạn xuất hiện tại trạm xe buýt vào những thời điểm ngẫu nhiên, theo dõi nhật ký thời gian chờ đợi, giả sử, một tháng, sẽ thực sự cung cấp cho bạn thời gian chuyển tiếp trung bình giữa các xe buýt. Nhưng đây không phải là những gì bạn đang làm.θ = 1 / λ = 15λθ=1/λ=15

Nếu chúng tôi ở một trung tâm điều phối và có thể nhìn thấy tất cả các xe buýt trên màn hình, thì việc chọn ngẫu nhiên nhiều xe buýt và tính trung bình khoảng cách đến xe buýt theo sau sẽ tạo ra thời gian trung bình đến sau:

nhập mô tả hình ảnh ở đây

Nhưng, nếu những gì chúng ta thay vào đó chỉ xuất hiện ở trạm xe buýt (thay vì chọn xe buýt), thì chúng ta đang thực hiện một mặt cắt ngang thời gian ngẫu nhiên, theo dòng thời gian của lịch trình xe buýt vào một buổi sáng điển hình. Thời gian chúng tôi quyết định xuất hiện tại trạm xe buýt rất có thể được phân phối đồng đều dọc theo "mũi tên" thời gian. Tuy nhiên, do có những khoảng cách thời gian dài hơn giữa các xe buýt nằm cách xa nhau hơn, nên chúng ta có nhiều khả năng kết thúc việc vượt quá các "stragglers" này:

nhập mô tả hình ảnh ở đây

... và do đó, sổ nhật ký thời gian chờ đợi của chúng tôi sẽ không phản ánh thời gian đến. Đây là nghịch lý kiểm tra.

Đối với câu hỏi thực tế trên OP liên quan đến thời gian chờ đợi dự kiến ​​là , vài phút, lời giải thích khó hiểu tồn tại trong trạng thái không nhớ của quá trình Poisson khiến khoảng cách thời gian trôi qua kể từ khi chiếc xe buýt cuối cùng chúng tôi bỏ lỡ trạm đến thời điểm chúng tôi xuất hiện không liên quan và thời gian dự kiến ​​đến của xe buýt tiếp theo sẽ tiếp tục, một cách bướng bỉnh, phút. Điều này được thấy rõ nhất trong thời gian rời rạc (phân phối hình học) với ví dụ súc sắc trong câu trả lời của Glen_b. θ = 1515θ=15

Trên thực tế, nếu chúng ta có thể biết xe buýt trước đó rời đi bao lâu, phút! Như explaine trong video MIT này của John Tsitsiklis , chúng ta sẽ phải xem những gì xảy ra trước thời điểm đến như một quá trình Poisson ngược thời gian:E[time waiting (future) + time to last bus departure (past)]=30


nhập mô tả hình ảnh ở đây


Vẫn chưa rõ? - hãy thử nó với Legos .


Sơ đồ tuyệt vời.
Glen_b

2

Có một lời giải thích đơn giản giúp giải quyết các câu trả lời khác nhau mà người ta nhận được từ việc tính toán thời gian chờ đợi dự kiến ​​cho xe buýt đến trong Quá trình Poisson với thời gian trung bình nhất định (trong trường hợp này là 15 phút), do đó thời gian giữa các đối thủ là theo cấp số nhân với thời gian là 15 phút .

Phương pháp 1 ) Vì Quá trình Poisson (hàm mũ) không có bộ nhớ, thời gian chờ đợi dự kiến ​​là 15 phút.

Phương pháp 2 ) Bạn có khả năng đến bất kỳ lúc nào trong khoảng thời gian giữa các đối thủ mà bạn đến. Do đó, thời gian chờ đợi dự kiến ​​là 1/2 thời lượng dự kiến ​​của giai đoạn giữa các đối thủ này. ĐÂY LÀ ĐÚNG, và không xung đột với phương pháp (1).

Làm thế nào (1) và (2) cả hai đều đúng? Câu trả lời là thời lượng dự kiến ​​của khoảng thời gian giữa các đối thủ trong khoảng thời gian bạn đến không phải là 15 phút. Nó thực sự là 30 phút; và 1/2 của 30 phút là 15 phút, vì vậy (1) và (2) đồng ý.

Tại sao khoảng thời gian giữa các thời gian mà bạn đến không bằng 15 phút? Đó là bởi vì lần đầu tiên "sửa chữa" thời gian đến, khoảng thời gian giữa các đối thủ có nhiều khả năng là trung bình là một khoảng thời gian giữa các đối thủ dài. Trong trường hợp của thời kỳ giữa các cấp số mũ, toán học hoạt động bên ngoài, vì vậy thời gian giữa các đối thủ có thời gian mà bạn đến là một số mũ với thời gian gấp đôi trung bình cho Quá trình Poisson.

Không rõ ràng rằng phân phối chính xác cho thời gian giữa các đối thủ có chứa thời gian bạn đến sẽ là một số mũ với giá trị trung bình gấp đôi, nhưng rõ ràng, sau khi giải thích, tại sao nó lại tăng lên. Một ví dụ dễ hiểu, giả sử rằng thời gian giữa các đối thủ là 10 phút với xác suất 1/2 hoặc 20 phút với xác suất 1/2. Trong trường hợp này, các khoảng thời gian giữa các đối thủ dài 20 phút có khả năng xảy ra như nhau trong các khoảng thời gian giữa các đối thủ dài 10 phút, nhưng khi chúng xảy ra, chúng kéo dài gấp đôi. Vì vậy, 2/3 số điểm thời gian trong ngày sẽ là những khoảng thời gian mà thời gian giữa các đối thủ là 20 phút. Nói cách khác, nếu trước tiên chúng ta chọn một thời gian và sau đó muốn biết thời gian giữa các đối thủ có chứa thời gian đó là gì, thì (bỏ qua các hiệu ứng thoáng qua vào đầu "ngày" ) độ dài dự kiến ​​của thời gian giữa các đối thủ đó là 16 1/3. Nhưng nếu chúng ta lần đầu tiên chọn thời gian giữa các đối thủ và muốn biết độ dài dự kiến ​​của nó là bao nhiêu thì đó là 15 phút.

Có các biến thể khác của nghịch lý đổi mới, lấy mẫu sai lệch độ dài, v.v., tương đương với điều tương tự.

Ví dụ 1) Bạn có một loạt bóng đèn, với tuổi thọ ngẫu nhiên, nhưng trung bình là 1000 giờ. Khi một bóng đèn bị hỏng, nó ngay lập tức được thay thế bằng một bóng đèn khác. Nếu bạn chọn một thời gian để đi trong một căn phòng có bóng đèn, thì bóng đèn hoạt động sau đó sẽ có tuổi thọ trung bình dài hơn 1000 giờ.

Ví dụ 2) Nếu chúng tôi đến một công trường xây dựng tại một thời điểm nhất định, thì thời gian trung bình cho đến khi một công nhân xây dựng đang làm việc tại đó rơi khỏi tòa nhà (từ khi họ mới bắt đầu làm việc) lớn hơn thời gian trung bình cho đến khi công nhân rơi ra (từ khi họ mới bắt đầu làm việc) trong số tất cả những người lao động bắt đầu làm việc. Tại sao, bởi vì các công nhân có thời gian trung bình ngắn cho đến khi rơi xuống có nhiều khả năng đã giảm xuống (và không tiếp tục làm việc), do đó, các công nhân đang làm việc sau đó có thời gian dài hơn trung bình cho đến khi rơi xuống.

Ví dụ 3) Chọn một số người khiêm tốn ngẫu nhiên trong một thành phố và nếu họ đã tham dự các trận đấu tại nhà (không phải tất cả bán hết) của đội bóng chày Major League của thành phố, hãy tìm hiểu xem có bao nhiêu người tham dự các trò chơi mà họ tham gia. Sau đó (theo một số giả định hơi lý tưởng nhưng không quá vô lý), tỷ lệ tham gia trung bình cho các trò chơi đó sẽ cao hơn so với tham dự trung bình cho tất cả các trận đấu trên sân nhà của đội. Tại sao? Bởi vì có nhiều người đã tham dự các trò chơi có số người tham dự cao hơn các trò chơi có ít người tham dự, vì vậy bạn có nhiều khả năng chọn những người đã tham dự các trò chơi có nhiều người tham dự hơn là các trò chơi có ít người tham dự.


0

Câu hỏi như được đặt ra là "... một chiếc xe buýt đến trạm xe buýt cứ sau 15 phút và một hành khách đến một cách ngẫu nhiên." Nếu xe buýt đến cứ sau 15 phút thì không ngẫu nhiên; nó đến sau mỗi 15 phút nên câu trả lời đúng là 7,5 phút. Nguồn được trích dẫn không chính xác hoặc người viết nguồn bị cẩu thả.

Mặt khác, máy dò bức xạ có vẻ như là một vấn đề khác vì các sự kiện bức xạ đến ngẫu nhiên theo một số phân phối, có lẽ là thứ gì đó giống như Poisson với thời gian chờ trung bình.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.