Mặc dù xác suất chính xác không thể được tính toán (ngoại trừ trong trường hợp đặc biệt với ), nó có thể được tính toán nhanh chóng với độ chính xác cao. Mặc dù hạn chế này, có thể được chứng minh một cách nghiêm ngặt rằng người chạy với độ lệch chuẩn lớn nhất có cơ hội chiến thắng lớn nhất. Hình vẽ mô tả tình huống và cho thấy tại sao kết quả này rõ ràng bằng trực giác:n≤2
Mật độ xác suất cho thời gian của năm vận động viên được hiển thị. Tất cả đều liên tục và đối xứng về trung bình chung . (Mật độ Beta được chia tỷ lệ đã được sử dụng để đảm bảo mọi thời điểm đều dương.) Một mật độ, được vẽ bằng màu xanh đậm hơn, có độ lây lan lớn hơn nhiều. Phần có thể nhìn thấy ở đuôi bên trái của nó đại diện cho thời gian mà không người chạy nào khác thường có thể khớp. Bởi vì cái đuôi bên trái, với diện tích tương đối lớn, thể hiện xác suất đáng kể, người chạy với mật độ này có cơ hội chiến thắng lớn nhất trong cuộc đua. (Họ cũng có cơ hội lớn nhất đến cuối cùng!)μ
Những kết quả này được chứng minh không chỉ cho các bản phân phối Bình thường: các phương pháp được trình bày ở đây áp dụng tốt như nhau cho các bản phân phối đối xứng và liên tục. (Điều này sẽ được quan tâm đối với bất kỳ ai phản đối việc sử dụng phân phối Bình thường cho thời gian chạy mô hình.) Khi các giả định này bị vi phạm, có thể người chạy với độ lệch chuẩn lớn nhất có thể không có cơ hội chiến thắng lớn nhất (Tôi rời khỏi việc xây dựng các mẫu phản độc giả quan tâm), nhưng chúng tôi vẫn có thể chứng minh theo các giả định nhẹ hơn rằng người chạy có SD lớn nhất sẽ có cơ hội chiến thắng cao nhất với điều kiện SD đủ lớn.
Hình này cũng cho thấy các kết quả tương tự có thể thu được bằng cách xem xét các độ tương tự một phía của độ lệch chuẩn (cái gọi là "bán định lượng"), chỉ đo độ phân tán của phân phối sang một phía. Một người chạy với sự phân tán lớn ở bên trái (hướng tới thời điểm tốt hơn) nên có cơ hội chiến thắng cao hơn, bất kể điều gì xảy ra trong phần còn lại của phân phối. Những cân nhắc này giúp chúng tôi đánh giá cao tính chất của việc trở thành tốt nhất (trong một nhóm) khác với các thuộc tính khác như trung bình.
Hãy để là các biến ngẫu nhiên đại diện cho lần vận động viên. Câu hỏi đặt ra giả định họ là độc lập và thường phân phối với trung bình chung μ . (Mặc dù đây là nghĩa đen một mô hình không thể, bởi vì nó thừa nhận xác suất dương tính với thời gian tiêu cực, nó vẫn có thể là một xấp xỉ hợp lý với thực tế cung cấp độ lệch chuẩn nhỏ hơn đáng kể so với μ .)X1,…,Xnμμ
Để thực hiện lập luận sau đây, hãy duy trì giả định độc lập nhưng nếu không thì giả sử các phân phối của được đưa ra bởi F i và các luật phân phối này có thể là bất cứ điều gì. Để thuận tiện, cũng giả sử phân phối F n liên tục với mật độ f n . Sau đó, khi cần, chúng tôi có thể áp dụng các giả định bổ sung miễn là chúng bao gồm cả trường hợp phân phối Bình thường.XiFiFnfn
Đối với bất kỳ và vô hạn d y , cơ hội người chạy cuối cùng có một khoảng thời gian trong khoảng thời gian ( y - d y , y ] và là người chạy nhanh nhất có được bằng cách nhân tất cả các xác suất có liên quan (vì tất cả các lần đều độc lập):ydy(y−dy,y]
Pr(Xn∈(y−dy,y],X1>y,…,Xn−1>y)=fn(y)dy(1−F1(y))⋯(1−Fn−1(y)).
Tích hợp trên tất cả các năng suất loại trừ lẫn nhau
Pr(Xn≤min(X1,X2,…,Xn−1))=∫Rfn(y)(1−F1(y))⋯(1−Fn−1(y))dy.
n>2
Hình này vẽ sơ đồ tích phân cho mỗi năm vận động viên có độ lệch chuẩn theo tỷ lệ 1: 2: 3: 4: 5. SD càng lớn, chức năng càng bị dịch chuyển sang trái - và diện tích của nó càng lớn. Các khu vực là khoảng 8: 14: 21: 26: 31%. Đặc biệt, người chạy có SD lớn nhất có 31% cơ hội chiến thắng.
FnXnσ>0σfn(y)dyfn(y/σ)dy/σ. Làm thay đổi biến y=xσ in the integral gives an expression for the chance of runner n winning, as a function of σ:
ϕ(σ)=∫Rfn(y)(1−F1(yσ))⋯(1−Fn−1(yσ))dy.
Suppose now that the medians of all n distributions are equal and that all the distributions are symmetric and continuous, with densities fi. (This certainly is the case under the conditions of the question, because a Normal median is its mean.) By a simple (locational) change of variable we may assume this common median is 0; the symmetry means fn(y)=fn(−y) and 1−Fj(−y)=Fj(y) for all y. These relationships enable us to combine the integral over (−∞,0] with the integral over (0,∞) to give
ϕ(σ)=∫∞0fn(y)(∏j=1n−1(1−Fj(yσ))+∏j=1n−1Fj(yσ))dy.
The function ϕ is differentiable. Its derivative, obtained by differentiating the integrand, is a sum of integrals where each term is of the form
yfn(y)fi(yσ)(∏j≠in−1Fj(yσ)−∏j≠in−1(1−Fj(yσ)))
for i=1,2,…,n−1.
The assumptions we made about the distributions were designed to assure that Fj(x)≥1−Fj(x) for x≥0. Thus, since x=yσ≥0, each term in the left product exceeds its corresponding term in the right product, implying the difference of products is nonnegative. The other factors yfn(y)fi(yσ) are clearly nonnegative because densities cannot be negative and y≥0. We may conclude that ϕ′(σ)≥0 for σ≥0, proving that the chance that player n wins increases with the standard deviation of Xn.
This is enough to prove that runner n will win provided the standard deviation of Xn is sufficiently large. This is not quite satisfactory, because a large SD could result in a physically unrealistic model (where negative winning times have appreciable chances). But suppose all the distributions have identical shapes apart from their standard deviations. In this case, when they all have the same SD, the Xi are independent and identically distributed: nobody can have a greater or lesser chance of winning than anyone else, so all chances are equal (to 1/n). Start by setting all distributions to that of runner n. Now gradually decrease the SDs of all other runners, one at a time. As this occurs, the chance that n wins cannot decrease, while the chances of all the other runners have decreased. Consequently, n has the greatest chances of winning, QED.