Cùng nghĩa, phương sai khác nhau


14

Giả sử bạn có tám vận động viên chạy một cuộc đua; phân phối thời gian chạy riêng lẻ của họ là Bình thường và mỗi lần có nghĩa là 11 giây. Độ lệch chuẩn của người chạy thứ nhất là nhỏ nhất, hai nhỏ nhất thứ hai, nhỏ nhất thứ ba, v.v. và tám lớn nhất. Hai câu hỏi làm tôi bối rối: (1) Xác suất đầu tiên đánh bại người cuối cùng là gì và (2) ai có khả năng chiến thắng cuộc đua nhất?

Câu trả lời của tôi là 8 , tương ứng. Kể từ khi họ chia sẻ cùng giá trị trung bình, xác suất mà ˉ x 1 - ˉ x 8 < 0 chỉ là 1 / 2 , không có? Làm thế nào tôi có thể chứng minh phần thứ hai một cách chặt chẽ, và xác suất chiến thắng chính xác có thể được tính toán không? Cảm ơn trước.1/28x¯1x¯8<01/2


1
@Silverfish Trong so sánh đầu tiên (mô hình hóa như các biến ngẫu nhiên ) để cuối cùng ( X n , giả định độc lập của X 1 ), chúng ta chỉ cần xem xét Z = X 1 - X n . Điều này có một phân phối liên tục đối xứng với trung bình bằng không. Các cơ hội mà nhịp đập đầu tiên cuối cùng là cơ hội mà Z < 0 , trong đó (bằng đối xứng và tính liên tục) bằng 1 / 2 như tuyên bố. Mặc dù lần cuối có cơ hội chiến thắng cuộc đua lớn hơn, nhưng không có nghịch lý: hầu hết thời gian khi nhịp đầu tiên kéo dài, người khác sẽ thực sự chiến thắng cuộc đua.X1XnX1Z=X1XnZ<01/2
đánh bóng

1
@whuber Cảm ơn bạn, tôi đã quản lý để cắt xén những gì tôi muốn nói - sẽ xóa để tránh nhầm lẫn. Con số 1/2 là chính xác, nhưng câu trả lời để so sánh thời gian trung bình của chúng là không chính xác và dường như mời gọi sự nhầm lẫn với các phương tiện dân số. Khi bạn viết, nó sẽ là sự khác biệt trong X i . xi¯Xi
Cá bạc

@Silver Điều này nhấn mạnh sự nguy hiểm khi cho rằng chúng ta luôn biết ký hiệu của ai đó có nghĩa là gì, chỉ vì nó trông quen thuộc. Tôi nhấn mạnh vấn đề đó (với các đường viền xuất hiện trên " " và " x 8 ") vì ý nghĩa dự định đã đủ rõ ràng và ngụ ý rằng không ai trong số chúng có thể đại diện cho ý nghĩa của bất cứ điều gì: trong bối cảnh này, chúng phải đại diện cho chính các biến ngẫu nhiên (mà tôi đã viết X 1X n ). x1x8X1Xn
whuber

Câu trả lời:


15

Mặc dù xác suất chính xác không thể được tính toán (ngoại trừ trong trường hợp đặc biệt với ), nó có thể được tính toán nhanh chóng với độ chính xác cao. Mặc dù hạn chế này, có thể được chứng minh một cách nghiêm ngặt rằng người chạy với độ lệch chuẩn lớn nhất có cơ hội chiến thắng lớn nhất. Hình vẽ mô tả tình huống và cho thấy tại sao kết quả này rõ ràng bằng trực giác:n2

Figure

Mật độ xác suất cho thời gian của năm vận động viên được hiển thị. Tất cả đều liên tục và đối xứng về trung bình chung . (Mật độ Beta được chia tỷ lệ đã được sử dụng để đảm bảo mọi thời điểm đều dương.) Một mật độ, được vẽ bằng màu xanh đậm hơn, có độ lây lan lớn hơn nhiều. Phần có thể nhìn thấy ở đuôi bên trái của nó đại diện cho thời gian mà không người chạy nào khác thường có thể khớp. Bởi vì cái đuôi bên trái, với diện tích tương đối lớn, thể hiện xác suất đáng kể, người chạy với mật độ này có cơ hội chiến thắng lớn nhất trong cuộc đua. (Họ cũng có cơ hội lớn nhất đến cuối cùng!)μ

Những kết quả này được chứng minh không chỉ cho các bản phân phối Bình thường: các phương pháp được trình bày ở đây áp dụng tốt như nhau cho các bản phân phối đối xứngliên tục. (Điều này sẽ được quan tâm đối với bất kỳ ai phản đối việc sử dụng phân phối Bình thường cho thời gian chạy mô hình.) Khi các giả định này bị vi phạm, có thể người chạy với độ lệch chuẩn lớn nhất có thể không có cơ hội chiến thắng lớn nhất (Tôi rời khỏi việc xây dựng các mẫu phản độc giả quan tâm), nhưng chúng tôi vẫn có thể chứng minh theo các giả định nhẹ hơn rằng người chạy có SD lớn nhất sẽ có cơ hội chiến thắng cao nhất với điều kiện SD đủ lớn.

Hình này cũng cho thấy các kết quả tương tự có thể thu được bằng cách xem xét các độ tương tự một phía của độ lệch chuẩn (cái gọi là "bán định lượng"), chỉ đo độ phân tán của phân phối sang một phía. Một người chạy với sự phân tán lớn ở bên trái (hướng tới thời điểm tốt hơn) nên có cơ hội chiến thắng cao hơn, bất kể điều gì xảy ra trong phần còn lại của phân phối. Những cân nhắc này giúp chúng tôi đánh giá cao tính chất của việc trở thành tốt nhất (trong một nhóm) khác với các thuộc tính khác như trung bình.


Hãy để là các biến ngẫu nhiên đại diện cho lần vận động viên. Câu hỏi đặt ra giả định họ là độc lập và thường phân phối với trung bình chung μ . (Mặc dù đây là nghĩa đen một mô hình không thể, bởi vì nó thừa nhận xác suất dương tính với thời gian tiêu cực, nó vẫn có thể là một xấp xỉ hợp lý với thực tế cung cấp độ lệch chuẩn nhỏ hơn đáng kể so với μ .)X1,,Xnμμ

Để thực hiện lập luận sau đây, hãy duy trì giả định độc lập nhưng nếu không thì giả sử các phân phối của được đưa ra bởi F i và các luật phân phối này có thể là bất cứ điều gì. Để thuận tiện, cũng giả sử phân phối F n liên tục với mật độ f n . Sau đó, khi cần, chúng tôi có thể áp dụng các giả định bổ sung miễn là chúng bao gồm cả trường hợp phân phối Bình thường.XiFiFnfn

Đối với bất kỳ và vô hạn d y , cơ hội người chạy cuối cùng có một khoảng thời gian trong khoảng thời gian ( y - d y , y ] và là người chạy nhanh nhất có được bằng cách nhân tất cả các xác suất có liên quan (vì tất cả các lần đều độc lập):ydy(ydy,y]

Pr(Xn(ydy,y],X1>y,,Xn1>y)=fn(y)dy(1F1(y))(1Fn1(y)).

Tích hợp trên tất cả các năng suất loại trừ lẫn nhau

Pr(Xnmin(X1,X2,,Xn1))=Rfn(y)(1F1(y))(1Fn1(y))dy.

n>2

Figure

Hình này vẽ sơ đồ tích phân cho mỗi năm vận động viên có độ lệch chuẩn theo tỷ lệ 1: 2: 3: 4: 5. SD càng lớn, chức năng càng bị dịch chuyển sang trái - và diện tích của nó càng lớn. Các khu vực là khoảng 8: 14: 21: 26: 31%. Đặc biệt, người chạy có SD lớn nhất có 31% cơ hội chiến thắng.


FnXnσ>0σfn(y)dyfn(y/σ)dy/σ. Làm thay đổi biến y=xσ in the integral gives an expression for the chance of runner n winning, as a function of σ:

ϕ(σ)=Rfn(y)(1F1(yσ))(1Fn1(yσ))dy.

Suppose now that the medians of all n distributions are equal and that all the distributions are symmetric and continuous, with densities fi. (This certainly is the case under the conditions of the question, because a Normal median is its mean.) By a simple (locational) change of variable we may assume this common median is 0; the symmetry means fn(y)=fn(y) and 1Fj(y)=Fj(y) for all y. These relationships enable us to combine the integral over (,0] with the integral over (0,) to give

ϕ(σ)=0fn(y)(j=1n1(1Fj(yσ))+j=1n1Fj(yσ))dy.

The function ϕ is differentiable. Its derivative, obtained by differentiating the integrand, is a sum of integrals where each term is of the form

yfn(y)fi(yσ)(jin1Fj(yσ)jin1(1Fj(yσ)))

for i=1,2,,n1.

The assumptions we made about the distributions were designed to assure that Fj(x)1Fj(x) for x0. Thus, since x=yσ0, each term in the left product exceeds its corresponding term in the right product, implying the difference of products is nonnegative. The other factors yfn(y)fi(yσ) are clearly nonnegative because densities cannot be negative and y0. We may conclude that ϕ(σ)0 for σ0, proving that the chance that player n wins increases with the standard deviation of Xn.

This is enough to prove that runner n will win provided the standard deviation of Xn is sufficiently large. This is not quite satisfactory, because a large SD could result in a physically unrealistic model (where negative winning times have appreciable chances). But suppose all the distributions have identical shapes apart from their standard deviations. In this case, when they all have the same SD, the Xi are independent and identically distributed: nobody can have a greater or lesser chance of winning than anyone else, so all chances are equal (to 1/n). Start by setting all distributions to that of runner n. Now gradually decrease the SDs of all other runners, one at a time. As this occurs, the chance that n wins cannot decrease, while the chances of all the other runners have decreased. Consequently, n has the greatest chances of winning, QED.


@Phonon That's correct. (But please do not confuse the distributions with estimates derived from samples. The distribution is a mathematical model, not a set of data.) Increasing the SD by a factor of λ, say, uniformly stretches the horizontal axis. Because (by the Law of Total Probability) the density function will cover a unit area, that stretch must be compensated by a stretch of the vertical axis by 1/λ, thereby preserving all areas. Thus, smaller SDs correspond to taller peaks and larger SDs to shorter peaks.
whuber

Many thanks for your reply, makes perfect sense. So knowledge of peak values alone in this sense is rather important.
Phonon
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.