Giá trị kỳ vọng của trung bình mẫu cho trung bình mẫu


16

Đặt biểu thị trung vị và để biểu thị giá trị trung bình của một mẫu ngẫu nhiên có kích thước từ một phân phối là . Làm cách nào tôi có thể tính ?YYˉXX¯n=2k+1n=2k+1N(μ,σ2)N(μ,σ2)E(Y|ˉX=ˉx)E(Y|X¯=x¯)

Theo trực giác, vì giả định quy tắc, sẽ hợp lý khi cho rằng và thực sự đó là câu trả lời đúng. Điều đó có thể được hiển thị nghiêm ngặt mặc dù?E(Y|ˉX=ˉx)=ˉxE(Y|X¯=x¯)=x¯

Suy nghĩ ban đầu của tôi là tiếp cận vấn đề này bằng cách sử dụng phân phối chuẩn có điều kiện thường là kết quả đã biết. Vấn đề ở đây là vì tôi không biết giá trị mong đợi và do đó phương sai của trung vị, tôi sẽ phải tính toán những người sử dụng thống kê thứ tự . Nhưng điều đó rất phức tạp và tôi thà không đến đó trừ khi tôi hoàn toàn phải đến. k+1k+1


2
Tôi tin rằng đây là hậu quả ngay lập tức của việc khái quát hóa mà tôi vừa đăng tại stats.stackexchange.com/a/83887 . Phân phối của phần dư rõ ràng là đối xứng khoảng , vì trung vị của chúng có phân phối đối xứng, do đó giá trị trung bình của nó bằng không. Do đó, kỳ vọng của chính trung vị (không chỉ của phần dư) bằng , QED. xiˉxxix¯000+E(ˉX | ˉX=ˉx)=ˉx0+E(X¯ | X¯=x¯)=x¯
whuber

@whuber Xin lỗi, dư?
JohnK

Tôi đã định nghĩa chúng trong nhận xét của mình: chúng là sự khác biệt giữa mỗi và ý nghĩa của chúng. xixi
whuber

@whuber Không tôi hiểu nhưng tôi vẫn đang nghiên cứu cách hiểu câu trả lời khác của bạn liên quan đến câu hỏi của tôi và chính xác kỳ vọng bạn đã sử dụng như thế nào.
JohnK

2
@whuber Được rồi, xin vui lòng sửa cho tôi Nếu tôi sai, Và bây giờ thuật ngữ thứ hai bằng 0 vì trung vị đối xứng quanh . Do đó, kỳ vọng giảm xuốngE(Y|ˉX)=E(ˉX|ˉX)+E(YˉX|ˉX)E(Y|X¯)=E(X¯|X¯)+E(YX¯|X¯)ˉxx¯ˉxx¯
JohnK

Câu trả lời:


7

Hãy X biểu thị mẫu gốc và Z vector ngẫu nhiên với mục Z k = X k - ˉ X . Sau đó, Z là trung tâm bình thường (nhưng các mục nhập của nó không độc lập, như có thể thấy từ thực tế là tổng của chúng bằng 0 với xác suất đầy đủ). Là một tuyến tính chức năng của X , vector ( Z , ˉ X ) là bình thường do đó việc tính toán cũng đủ ma trận hiệp phương sai của nó để chứng minh rằng Z không phụ thuộc vào ˉ X .XZZk=XkX¯ZX(Z,X¯)ZX¯

Quay trở về Y , người ta thấy rằng Y = ˉ X + TT là trung bình của Z . Cụ thể, T chỉ phụ thuộc vào Z do đó T độc lập với ˉ X và phân phối Z là đối xứng do đó T là trung tâm.YY=X¯+TTZTZTX¯ZT

Cuối cùng, E ( Y | ˉ X ) = ˉ X + E ( T | ˉ X ) = ˉ X + E ( T ) = ˉ X .

E(YX¯)=X¯+E(TX¯)=X¯+E(T)=X¯.

Cảm ơn bạn, điều này đã được hỏi gần một năm trước và tôi rất vui vì cuối cùng đã có người xóa nó.
JohnK

7

Giá trị trung bình mẫu là một thống kê đơn hàng và có phân phối không bình thường, do đó phân phối mẫu hữu hạn chung của trung bình mẫu và trung bình mẫu (có phân phối chuẩn) sẽ không được chia đôi bình thường. Sử dụng các giá trị gần đúng, không có triệu chứng sau đây (xem câu trả lời của tôi ở đây ):

n [ ( ˉ X n Y n ) - ( μ v ) ] LN [ ( 0 0 ) , Σ ]

n[(X¯nYn)(μv)]LN[(00),Σ]

với

Σ = ( σ 2 E ( | X - v | ) [ 2 f ( v ) ] - 1 E ( | X - v | ) [ 2 f ( v ) ] - 1 [ 2 f ( v ) ] - 2 )

Σ=(σ2E(|Xv|)[2f(v)]1E(|Xv|)[2f(v)]1[2f(v)]2)

nơi ˉ X n là mẫu trung bình và L giá trị trung bình dân số, Y n là trung bình mẫu và v trung bình dân số, f ( ) là mật độ xác suất của các biến ngẫu nhiên liên quan và σ 2 là phương sai. X¯nμYnvf()σ2

Vì vậy, xấp xỉ cho các mẫu lớn, phân phối chung của chúng là bivariate bình thường, vì vậy chúng tôi có điều đó

E ( Y nˉ X n = ˉ x ) = v + ρ σ vσ ˉ X ( ˉ x -μ)

E(YnX¯n=x¯)=v+ρσvσX¯(x¯μ)

Trong đó ρ là hệ số tương quan.ρ

Thao tác phân phối tiệm cận để trở thành phân phối khớp mẫu lớn gần đúng của trung bình mẫu và trung bình mẫu (và không phải là số lượng chuẩn), chúng ta có ρ = 1n E(|X-v|)[2f(v)]-11n σ[2f(v)]-1=E(|X-v|)σ

ρ=1nE(|Xv|)[2f(v)]11nσ[2f(v)]1=E(|Xv|)σ

Vậy E ( Y nˉ X n = ˉ x ) = v + E ( | X - v | )σ [ 2 f ( v ) ] - 1σ ( ˉ x -μ)

E(YnX¯n=x¯)=v+E(|Xv|)σ[2f(v)]1σ(x¯μ)

Chúng tôi có mà 2 f ( v ) = 2 / σ 2 π do tính đối xứng của mật độ bình thường nên chúng tôi đến2f(v)=2/σ2π

E(YnˉXn=ˉx)=v+π2E(|Xμσ|)(ˉxμ)

E(YnX¯n=x¯)=v+π2E(Xμσ)(x¯μ)

where we have used v=μv=μ. Now the standardized variable is a standard normal, so its absolute value is a half-normal distribution with expected value equal to 2/π2/π (since the underlying variance is unity). So

E(YnˉXn=ˉx)=v+π22π(ˉxμ)=v+ˉxμ=ˉx

E(YnX¯n=x¯)=v+π22π(x¯μ)=v+x¯μ=x¯

2
As always, nice answer +1. However, since we have no information about the sample size, the asymptotic distribution might not hold. If there is no way to obtain the exact distribution though, I suppose I'll have to make do. Thank you very much.
JohnK

6

The answer is ˉxx¯.

Let x=(x1,x2,,xn)x=(x1,x2,,xn) have a multivariate distribution FF for which all the marginals are symmetric about a common value μμ. (It does not matter whether they are independent or even are identically distributed.) Define ˉxx¯ to be the arithmetic mean of the xi,xi, ˉx=(x1+x2++xn)/nx¯=(x1+x2++xn)/n and write xˉx=(x1ˉx,x2ˉx,,xnˉx)xx¯=(x1x¯,x2x¯,,xnx¯) for the vector of residuals. The symmetry assumption on FF implies the distribution of xˉxxx¯ is symmetric about 00; that is, when ERnERn is any event,

PrF(xˉxE)=PrF(xˉxE).

PrF(xx¯E)=PrF(xx¯E).

Applying the generalized result at /stats//a/83887 shows that the median of xˉxxx¯ has a symmetric distribution about 00. Assuming its expectation exists (which is certainly the case when the marginal distributions of the xixi are Normal), that expectation has to be 00 (because the symmetry implies it equals its own negative).

Now since subtracting the same value ˉxx¯ from each of a set of values does not change their order, YY (the median of the xixi) equals ˉxx¯ plus the median of xˉxxx¯. Consequently its expectation conditional on ˉxx¯ equals the expectation of xˉxxx¯ conditional on ˉxx¯, plus E(ˉx | ˉx)E(x¯ | x¯). The latter obviously is ˉxx¯ whereas the former is 00 because the unconditional expectation is 00. Their sum is ˉx,x¯, QED.


Thank you for posting it as a full answer. I now understand the essence of your argument but I might ping you if something is still unclear.
JohnK

5
JohnK, I need to alert you to be cautious. A counterexample to this argument has been brought to my attention. I have encouraged its originator to post it here for further discussion, but briefly it concerns a discrete bivariate distribution with symmetric marginals but asymmetric conditional marginals. Its existence points to a flawed deduction early in my argument. I currently hope that the argument might be rescued by imposing stronger conditions on the xixi, but my attention is presently focused elsewhere and I might not get to think about this for awhile.
whuber

4
In the meantime I would encourage you to unaccept this answer. I would ordinarily delete any answer of mine known to be incorrect, but (as you might be able to tell) I like solutions based on first principles rather than detailed calculations, so I hope this argument can be rescued. I therefore intend to leave it open for criticism and improvement (and therefore made it CW); let the votes fall as they may.
whuber

Of course, thanks for letting me know. We will discuss it further when you have time. In the meantime I will settle for the asymptotic argument proposed by @Alecos Papadopoulos.
JohnK

6

This is simpler than the above answers make it. The sample mean is a complete and sufficient statistic (when the variance is known, but our results do not depend on the variance, hence will be valid also in the situation when the variance is unknown). Then the Rao-Blackwell together with the Lehmann-Scheffe theorems (see wikipedia ...) will imply that the conditional expectation of the median, given the arithmetic mean, is the unique minimum variance unbiased estimator of the expectation μμ. But we know that is the arithmetic mean, hence the result follows.

We did also use that the median is an unbiased estimator, which follows from symmetry.


1
By symmetry E[Y]=μE[Y]=μ, indeed. Then from these two theorems we know that E[Y|ˉX]E[Y|X¯] is the Unique Minimum Variance Unbiased Estimator for μμ which we already know to be equal to ˉXX¯. This is a brilliant answer, thank you very much. I would have marked it as the correct one, had I not done that already for another answer.
JohnK
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.