Hãy xây dựng tất cả các ví dụ có thể có của các biến ngẫu nhiên XX mà E [ X ] E [ 1 / X ] = 1E[X]E[1/X]=1 . Sau đó, trong số họ, chúng tôi có thể theo một số phương pháp phỏng đoán để có được ví dụ đơn giản nhất có thể. Các heuristic này bao gồm việc đưa ra các giá trị đơn giản nhất có thể cho tất cả các biểu thức bỏ qua phân tích sơ bộ. Điều này hóa ra là ví dụ trong sách giáo khoa.
Phân tích sơ bộ
Điều này chỉ đòi hỏi một chút phân tích dựa trên các định nghĩa. Giải pháp chỉ là mối quan tâm thứ yếu: mục tiêu chính là phát triển những hiểu biết để giúp chúng ta hiểu được kết quả bằng trực giác.
Đầu tiên nhận xét rằng Jensen của bất bình đẳng (hoặc Cauchy-Schwarz bất bình đẳng) ngụ ý rằng đối với một biến ngẫu nhiên dương XX , E [ X ] E [ 1 / X ] ≥ 1E[X]E[1/X]≥1 , với sự bình đẳng nắm giữ khi và chỉ khi XX là "thoái hóa": đó là , XX gần như chắc chắn là hằng số. Khi XX là biến ngẫu nhiên âm, - X−X dương và kết quả trước giữ với dấu bất đẳng thức đảo ngược. Do đó, bất kỳ ví dụ nào trong đó E [ 1 / X ] = 1 / E[ X ]E[1/X]=1/E[X] phải có xác suất dương là dương và xác suất dương là dương.
Cái nhìn sâu sắc ở đây là bất kỳ X nào Xcó E [ X ] E [ 1 / X ] = 1E[X]E[1/X]=1 bằng cách nào đó phải "cân bằng" sự bất bình đẳng từ phần tích cực của nó so với bất bình đẳng theo hướng khác từ phần tiêu cực của nó. Điều này sẽ trở nên rõ ràng hơn khi chúng ta đi cùng.
Hãy xem xét bất kỳ biến ngẫu nhiên X khácX . Bước đầu tiên trong việc hình thành một định nghĩa về kỳ vọng (ít nhất là khi điều này được thực hiện một cách tổng quát bằng lý thuyết đo lường) là phân tách XX thành các phần dương và âm, cả hai đều là các biến ngẫu nhiên dương:
Y = Phần dương ( X ) = max ( 0 , X ) ; Z = Phần âm ( X ) = - min ( 0 , X ) .
YZ=Positive part(X)=max(0,X);=Negative part(X)=−min(0,X).
Chúng ta hãy nghĩ XX là hỗn hợp của YY với trọng số pp và - Z−Z với trọng số 1 - p1−p trong đó p = Pr ( X > 0 ) , 1 - p = Pr ( X < 0 ) .
p=Pr(X>0), 1−p=Pr(X<0).
Rõ ràng
0 < p < 1.0<p<1.
Điều này sẽ cho phép chúng tôi viết kỳ vọng về XX và 1 / X1/Xvề sự mong đợi của các biến tích cực YY và ZZ .
Để đơn giản hóa đại số sắp tới một chút, lưu ý rằng thống nhất rescaling XX bởi một số σσ không thay đổi E [ X ] E [ 1 / X ]E[X]E[1/X] --but nó nhân E [ Y ]E[Y] và E [ Z ]E[Z] mỗi bởi σσ . Đối với dương σσ , điều này đơn giản để chọn đơn vị đo lường của XX . Một âm σσ chuyển vai trò của YY và ZZ . Chọn dấu hiệu của σσmột cách thích hợp, chúng tôi do đó có thể giả sử E [ Z ] = 1 và E [ Y ] ≥ E [ Z ] .
E[Z]=1 and E[Y]≥E[Z].(1)
Ký hiệu
Đó là để đơn giản hóa sơ bộ. Để tạo một ký hiệu đẹp, do đó chúng ta hãy viết
μ = E [ Y ] ; ν = E [ 1 / Y ] ; λ = E [ 1 / Z ]
μ=E[Y]; ν=E[1/Y]; λ=E[1/Z]
cho ba kỳ vọng chúng ta không thể kiểm soát. Cả ba đại lượng đều dương. Khẳng định bất bình đẳng của Jensen
L v ≥ 1 và bước sóng ≥ 1.
μν≥1 and λ≥1.(2)
Định luật xác suất tổng thể thể hiện kỳ vọng của XX và 1 / X1/X về số lượng chúng tôi đã đặt tên:
E [ X ] = E [ X ∣ X > 0 ] Pr ( X > 0 ) + E [ X ∣ X < 0 ] Pr ( X < 0 ) = μ p - ( 1 - p ) = ( μ + 1 ) p - 1
E[X]=E[X∣X>0]Pr(X>0)+E[X∣X<0]Pr(X<0)=μp−(1−p)=(μ+1)p−1
và, vì 1 / X1/X có cùng dấu với XX ,
E [ 1X ]=E[1X ∣X>0]Pr(X>0)+E[1X |X<0]Pr(X<0)=νp-λ(1-p)=(ν+λ)p-λ.
E[1X]=E[1X∣X>0]Pr(X>0)+E[1X∣X<0]Pr(X<0)=νp−λ(1−p)=(ν+λ)p−λ.
Việc so sánh tích của hai biểu thức này với 1 cung cấp một mối quan hệ thiết yếu giữa các biến:1
1=E[X]E[1X]=((μ+1)p−1)((ν+λ)p−λ).
1=E[X]E[1X]=((μ+1)p−1)((ν+λ)p−λ).(*)
Reformulation of the Problem
Suppose the parts of XX--YY and ZZ--are any positive random variables (degenerate or not). That determines μ,ν,μ,ν, and λλ. When can we find pp, with 0<p<10<p<1, for which (∗)(∗) holds?
This clearly articulates the "balancing" insight previously stated only vaguely: we are going to hold YY and ZZ fixed and hope to find a value of pp that appropriately balances their relative contributions to XX. Although it's not immediately evident that such a pp need exist, what is clear is that it depends only on the moments E[Y]E[Y], E[1/Y]E[1/Y], E[Z]E[Z], and E[1/Z]E[1/Z]. The problem thereby is reduced to relatively simple algebra--all the analysis of random variables has been completed.
Solution
This algebraic problem isn't too hard to solve, because (∗)(∗) is at worst a quadratic equation for pp and the governing inequalities (1)(1) and (2)(2) are relatively simple. Indeed, (∗)(∗) tells us the product of its roots p1p1 and p2p2 is
p1p2=(λ−1)1(μ+1)(ν+λ)≥0
and the sum is
p1+p2=(2λ+λμ+ν)1(μ+1)(ν+λ)>0.
Therefore both roots must be positive. Furthermore, their average is less than 1, because
1−(p1+p2)2=λμ+ν+2μν2(μ+1)(ν+λ)>0.
(By doing a bit of algebra, it's not hard to show the larger of the two roots does not exceed 1, either.)
A Theorem
Here is what we have found:
Given any two positive random variables Y and Z (at least one of which is nondegenerate) for which E[Y], E[1/Y], E[Z], and E[1/Z] exist and are finite. Then there exist either one or two values p, with 0<p<1, that determine a mixture variable X with weight p for Y and weight 1−p for −Z and for which E[X]E[1/X]=1. Every such instance of a random variable X with E[X]E[1/X]=1 is of this form.
That gives us a rich set of examples indeed!
Constructing the Simplest Possible Example
Having characterized all examples, let's proceed to construct one that is as simple as possible.
For the negative part Z, let's choose a degenerate variable--the very simplest kind of random variable. It will be scaled to make its value 1, whence λ=1. The solution of (∗) includes p1=0, reducing it to an easily solved linear equation: the only positive root is
p=11+μ+11+ν.
For the positive part Y, we obtain nothing useful if Y is degenerate, so let's give it some probability at just two distinct positive values a<b, say Pr(X=b)=q. In this case the definition of expectation gives
μ=E[Y]=(1−q)a+qb; ν=E[1/Y]=(1−q)/a+q/b.
To make this even simpler, let's make Y and 1/Y identical: this forces q=1−q=1/2 and a=1/b. Now
μ=ν=b+1/b2.
The solution (3) simplifies to
p=21+μ=42+b+1/b.
How can we make this involve simple numbers? Since a<b and ab=1, necessarily b>1. Let's choose the simplest number greater than 1 for b; namely, b=2. The foregoing formula yields p=4/(2+2+1/2)=8/9 and our candidate for the simplest possible example therefore is
Pr(X=2)=Pr(X=b)=Pr(Y=b)p=qp=1289=49;Pr(X=1/2)=Pr(X=a)=Pr(Y=a)p=qp=⋯=49;Pr(X=−1)=Pr(Z=1)(1−p)=1−p=19.
This is the very example offered in the textbook.