Giá trị dự kiến ​​của thời gian chờ cho đầu tiên của hai xe buýt chạy cứ sau 10 và 15 phút


19

Tôi bắt gặp một câu hỏi phỏng vấn:

Có một chuyến tàu màu đỏ cứ sau 10 phút. Có một chuyến tàu màu xanh cứ sau 15 phút. Cả hai đều bắt đầu từ một thời gian ngẫu nhiên để bạn không có bất kỳ lịch trình nào. Nếu bạn đến ga vào một thời điểm ngẫu nhiên và đi trên bất kỳ chuyến tàu nào đến trước, thời gian chờ đợi dự kiến ​​là bao nhiêu?


3
Do các chuyến tàu đến đúng giờ nhưng với các giai đoạn phân bố đều nhau không xác định, hoặc chúng có tuân theo quy trình poisson với phương tiện 10 phút và 15 phút.
Ngói Poele

1
Các cựu, không poisson.
Shengjie Zhang

7
@Tilefish đưa ra một nhận xét quan trọng mà mọi người nên chú ý. Không có câu trả lời chắc chắn. Bạn phải cho rằng "bắt đầu từ một thời gian ngẫu nhiên" có thể có nghĩa là gì. (Điều đó có nghĩa là chúng bắt đầu đồng thời hay chúng bắt đầu vào những thời điểm không xác định khác nhau? Điều gì sẽ biện minh cho việc coi "không xác định" là một biến ngẫu nhiên với phân phối đã biết xác định?) Là một hàm của độ lệch pha của chúng (chỉ quan trọng với modulo 5 phút), câu trả lời có thể khác nhau từ 15/4 để 25/6 . Một phân bố đồng đều của độ lệch pha sẽ mang lại 35/9 .
whuber

@whuber mọi người dường như diễn giải bình luận của OP như thể hai chiếc xe buýt bắt đầu ở hai thời điểm ngẫu nhiên khác nhau. Rằng họ sẽ bắt đầu vào cùng một thời điểm ngẫu nhiên có vẻ như là một sự bất thường
Aksakal

1
@Aksakal. Không phải tất cả mọi người: Tôi không và ít nhất một câu trả lời trong chủ đề này không - đó là lý do tại sao chúng ta thấy các câu trả lời bằng số khác nhau. Hơn nữa, hầu như không ai thừa nhận thực tế rằng họ phải đưa ra một số giải thích như vậy cho câu hỏi để có được câu trả lời.
whuber

Câu trả lời:


15

Một cách để tiếp cận vấn đề là bắt đầu với chức năng sinh tồn. Để phải chờ ít nhất t phút, bạn phải đợi ít nhất phút cho cả tàu đỏ xanh. Do đó, chức năng sinh tồn tổng thể chỉ là sản phẩm của các chức năng sinh tồn riêng lẻ:t

S(t)=(1t10)(1t15)

đó, cho , là xác suất mà bạn sẽ phải chờ ít nhất t phút cho chuyến tàu tiếp theo. Điều này tính đến việc làm rõ OP trong một nhận xét rằng các giả định chính xác cần đưa ra là mỗi chuyến tàu đều có thời gian biểu cố định độc lập với thời gian đến của người đi lại và các giai đoạn của hai chuyến tàu được phân bổ đồng đều ,0t10t

Sau đó, pdf được lấy là

p(t)=(1S(t))=110(1t15)+115(1t10)

Và giá trị mong đợi thu được theo cách thông thường:

,E[t]=010tp(t)dt=010t10(1t15)+t15(1t10)dt=010(t6t275)dt

mà làm việc đến phút.359


Dave, can you explain how p(t) = (1- s(t))' ?
Chef1075

I can explain that for you S(t)=1-F(t), p(t) is just the f(t)=F(t)'.
Deep North

4
The survival function idea is great. But why derive the PDF when you can directly integrate the survival function to obtain the expectation? In effect, two-thirds of this answer merely demonstrates the fundamental theorem of calculus with a particular example. And what justifies using the product to obtain S? There's a hidden assumption behind that.
whuber

2
@whuber I prefer this approach, deriving the PDF from the survival function, because it correctly handles cases where the domain of the random variable does not start at 0.
Dave

2
(1) Your domain is positive. (2) The formula is readily generalized..
whuber

9

The answer is

E[t]=xymin(x,y)110115dxdy=x(y<xydy+y>xxdy)110115dx
y<xydy=y2/2|0x=x2/2
y>xxdy=xy|x15=15xx2
So, the part is:
(.)=(y<xydy+y>xxdy)=15xx2/2
Finally,
E[t]=x(15xx2/2)110115dx=(15x2/2x3/6)|010110115=(1500/21000/6)110115=510/93.89

Here's the MATLAB code to simulate:

nsim = 10000000;
red= rand(nsim,1)*10;
blue= rand(nsim,1)*15;
nextbus = min([red,blue],[],2);
mean(nextbus)

1
You're making incorrect assumptions about the initial starting point of trains. i.e. Using your logic, how many red and blue trains come every 2 hours? How many trains in total over the 2 hours? etc.
Tilefish Poele

1
Can trains not arrive at minute 0 and at minute 60?
Tilefish Poele

1
what about if they start at the same time is what I'm trying to say. What if they both start at minute 0. How many instances of trains arriving do you have?
Tilefish Poele

1
The simulation does not exactly emulate the problem statement. In particular, it doesn't model the "random time" at which you appear at the bus station. As such it embodies several unstated assumptions about the problem.
whuber

2
@whuber it emulates the phase of buses relative to my arrival at the station
Aksakal

4

Assuming each train is on a fixed timetable independent of the other and of the traveller's arrival time, the probability neither train arrives in the first x minutes is 10x10×15x15 for 0x10, which when integrated gives 3593.889 minutes

Alternatively, assuming each train is part of a Poisson process, the joint rate is 115+110=16 trains a minute, making the expected waiting time 6 minutes


3
@Dave it's fine if the support is nonnegative real numbers.
Neil G

3
@dave He's missing some justifications, but it's the right solution as long as you assume that the trains arrive is uniformly distributed (i.e., a fixed schedule with known constant inter-train times, but unknown offset). It works with any number of trains. This is the because the expected value of a nonnegative random variable is the integral of its survival function.
Neil G

1
@Dave with one train on a fixed 10 minute timetable independent of the traveller's arrival, you integrate 10x10 over 0x10 to get an expected wait of 5 minutes, while with a Poisson process with rate λ=110 you integrate eλx over 0x< to get an expected wait of 1λ=10 minutes
Henry

1
@NeilG TIL that "the expected value of a non-negative random variable is the integral of the survival function", sort of -- there is some trickiness in that the domain of the random variable needs to start at 0, and if it doesn't intrinsically start at zero(e.g. for a different problem where the inter-arrival times were, say, uniformly distributed between 5 and 10 minutes) you actually have to use a lower bound of 0 when integrating the survival function. (starting at 0 is required in order to get the boundary term to cancel after doing integration by parts)
Dave

3
+1 At this moment, this is the unique answer that is explicit about its assumptions. All the others make some critical assumptions without acknowledging them.
whuber

2

I am probably wrong but assuming that each train's starting-time follows a uniform distribution, I would say that when arriving at the station at a random time the expected waiting time for:

  1. the Red train is E[R]=5 mins
  2. the Blue train is E[B]=7.5 mins
  3. the train that comes the first is E[min(R,B)]=1510(E[B]E[R])=154=3.75 mins


As pointed out in comments, I understood "Both of them start from a random time" as "the two trains start at the same random time". Which is a very limiting assumption.


1
Thanks! Your got the correct answer. But 3. is still not obvious for me. Could you explain a bit more?
Shengjie Zhang

1
This is not the right answer
Aksakal

1
I think the approach is fine, but your third step doesn't make sense.
Neil G

2
This answer assumes that at some point, the red and blue trains arrive simultaneously: that is, they are in phase. Other answers make a different assumption about the phase.
whuber

2

Suppose that red and blue trains arrive on time according to schedule, with the red schedule beginning Δ minutes after the blue schedule, for some 0Δ<10. For definiteness suppose the first blue train arrives at time t=0.

Assume for now that Δ lies between 0 and 5 minutes. Between t=0 and t=30 minutes we'll see the following trains and interarrival times: blue train, Δ, red train, 10, red train, 5Δ, blue train, Δ+5, red train, 10Δ, blue train. Then the schedule repeats, starting with that last blue train.

If WΔ(t) denotes the waiting time for a passenger arriving at the station at time t, then the plot of WΔ(t) versus t is piecewise linear, with each line segment decaying to zero with slope 1. So the average wait time is the area from 0 to 30 of an array of triangles, divided by 30. This gives

W¯Δ:=130(12[Δ2+102+(5Δ)2+(Δ+5)2+(10Δ)2])=130(2Δ210Δ+125).
Notice that in the above development there is a red train arriving Δ+5 minutes after a blue train. Since the schedule repeats every 30 minutes, conclude W¯Δ=W¯Δ+5, and it suffices to consider 0Δ<5.

If Δ is not constant, but instead a uniformly distributed random variable, we obtain an average average waiting time of

15Δ=05130(2Δ210Δ+125)dΔ=359.

2

This is a Poisson process. The red train arrives according to a Poisson distribution wIth rate parameter 6/hour.
The blue train also arrives according to a Poisson distribution with rate 4/hour. Red train arrivals and blue train arrivals are independent. Total number of train arrivals Is also Poisson with rate 10/hour. Since the sum of The time between train arrivals is exponential with mean 6 minutes. Since the exponential mean is the reciprocal of the Poisson rate parameter. Since the exponential distribution is memoryless, your expected wait time is 6 minutes.


The Poisson is an assumption that was not specified by the OP. But some assumption like this is necessary. The logic is impeccable. +1 I like this solution.
Michael R. Chernick

1
OP said specifically in comments that the process is not Poisson
Aksakal
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.