Giới hạn trên theo cấp số nhân


12

Giả sử chúng ta có IID biến ngẫu nhiên X1,,Xn với phân phối Ber(θ) . Chúng tôi sẽ quan sát một mẫu của Xi là theo cách sau: để cho Y1,,Yn được độc lập Ber(1/2) biến ngẫu nhiên, giả sử rằng tất cả các Xi 's và Yi là độc lập và xác định kích thước mẫu N=i=1nYi. CácYi's chỉ ra củaXi' s là trong mẫu, và chúng tôi muốn học phần của thành công trong mẫu được xác định bởi

Z={1Ni=1nXiYiifN>0,0ifN=0.
Đối vớiϵ>0, chúng tôi muốn tìm một trên ràng buộc choPr(Zθ+ϵ) phân rã theo hàm mũ vớin . Bất đẳng thức của Hoeffding không áp dụng ngay lập tức vì sự phụ thuộc giữa các biến.

1
Đặt Zi=1NXiYi. (i) Không phảiZiđộc lập vớiZjisao? (ii) không phải làZ=Zi? ... Kết quả là, tôi không rõ ràng rằngZkhông phải là 'tổng của các biến ngẫu nhiên độc lập'
Glen_b -Reinstate Monica

Ah, điểm tốt. Tôi đã suy nghĩ về n , chứ không phải là N . Nhưng thay vào đó, bạn không thể viết Zi=1nXiYivà đểZ=i=1nZi? Đó là, tổng hợp trên tất cả các trường hợp, cho dùYlà 1 hay 0. ... không, điều đó không hoạt động. Tử số giống nhau nhưng mẫu số thì khác.
Glen_b -Reinstate Monica

Điều đó mang lại ít hơn phần của thành công trong mẫu, mà là số lượng quan tâm trong vấn đề này, bởi vì (1/n)i=1nXiYi(1/N)i=1nXiYi , vì Nn .
Zen

1
Vâng, đó là lý do tại sao tôi kết thúc với "không, nó không hoạt động". Có những bất đẳng thức áp dụng cho trường hợp không độc lập, chẳng hạn như một số bất đẳng thức của Bernstein (xem mục thứ tư), và có một số bất đẳng thức áp dụng cho martingales (mặc dù tôi không biết rằng những điều đó sẽ áp dụng ở đây).
Glen_b -Reinstate Monica

1
Tôi sẽ xem xét, và cũng cố gắng tìm mối liên hệ với kết quả martingales. Các ràng buộc đối với U=(1/n)i=1nXiYi là dễ dàng như vậy ( Pr(Uθ/2+ϵ)exp(2nϵ2) ) mà nó hấp dẫn để kết nối này với Z sử dụng một số loại điều hòa.
Zen

Câu trả lời:


15

Chúng ta có thể rút ra mối liên hệ với sự bất bình đẳng của Hoeffding theo cách khá trực tiếp .

Lưu ý rằng chúng tôi có

{Z>θ+ϵ}={iXiYi>(θ+ϵ)iYi}={i(Xiθϵ)Yi>0}.

Set do đó Z i đang IID, E Z i = 0P ( Z > θ + ε ) = P ( Σ i Z i > n ε / 2 )e - n ε 2 / 2Zi=(Xiθϵ)Yi+ϵ/2ZiEZi=0 Bởi một ứng dụng đơn giản củabất đẳng thức hoeffding(kể từ Z i[ - θ - ε / 2 , 1 - θ - ε / 2 ] và do đó có giá trị trong một khoảng thời gian của kích thước một).

P(Z>θ+ϵ)=P(iZi>nϵ/2)enϵ2/2,
Zi[θϵ/2,1θϵ/2]

Có một tài liệu liên quan phong phú và hấp dẫn đã được xây dựng trong nhiều năm qua, đặc biệt, về các chủ đề liên quan đến lý thuyết ma trận ngẫu nhiên với các ứng dụng thực tế khác nhau. Nếu bạn quan tâm đến loại điều này, tôi khuyên bạn nên:

R. Vershynin, Giới thiệu về phân tích không tiệm cận của ma trận ngẫu nhiên , Chương 5 của Cảm biến nén, Lý thuyết và Ứng dụng. Do Y. Eldar và G. Kutyniok biên soạn. Nhà xuất bản Đại học Cambridge, 2012.

Tôi nghĩ rằng giải trình là rõ ràng và cung cấp một cách rất hay để nhanh chóng thích nghi với văn học.


1
Kể từ khi bao gồm ε / 2 trong định nghĩa của họ, tôi có ấn tượng rằng Z i[ - θ - ε / 2 , 1 - θ - ε / 2 ] (các ràng buộc không thay đổi). Ziϵ/2Zi[θϵ/2,1θϵ/2]
Alecos Papadopoulos

1
Kính gửi @Zen: Lưu ý rằng việc hạch toán cẩn thận trường hợp sẽ cho phép bạn thay thế bất đẳng thức nghiêm ngặt > bằng ở mọi nơi mà không thay đổi ràng buộc cuối cùng. N=0>
Đức hồng y

Thưa @cardinal: Tôi đã reworded câu hỏi vì thực sự là một (hơi) thiên vị ước lượng của θ , vì E [ Z ] = E [ Tôi { N = 0 } Z ] + E [ Tôi { N > 0 } Z ] = ( 1 - 1 / 2 n )Zθ . E[Z]=E[I{N=0}Z]+E[I{N>0}Z]=(11/2n)θ
Zen

6

Details to take care of the N=0 case.

{Zθ+ϵ}=({Zθ+ϵ}{N=0})({Zθ+ϵ}{N>0})=({0θ+ϵ}{N=0})({Zθ+ϵ}{N>0})=({N=0})({Zθ+ϵ}{N>0})={i=1nXiYi(θ+ϵ)i=1nYi}{N>0}{i=1nXiYi(θ+ϵ)i=1nYi}={i=1n(Xiθϵ)Yi0}={i=1n((Xiθϵ)Yi+ϵ/2)nϵ/2}.

For Alecos.

E[i=1nWi]=E[I{i=1nYi=0}i=1nWi]+E[I{i=1nYi>0}i=1nWi]=E[I{i=1nYi>0}i=1nYii=1nYi]=E[I{i=1nYi>0}]=11/2n.

5

This answer keeps mutating. The current version does not relate to the discussion I had with @cardinal in the comments (although it was through this discussion that I thankfully realized that the conditioning approach did not appear to lead anywhere).

For this attempt, I will use another part of Hoeffding's original 1963 paper, namely section 5 "Sums of Dependent Random Variables".

Set

WiYii=1nYi,i=1nYi0,i=1nWi=1,n2

while we set Wi=0 if i=1nYi=0.

Then we have the variable

Zn=i=1nWiXi,E(Zn)μn

We are interested in the probability

Pr(Znμn+ϵ),ϵ<1μn

As for many other inequalities, Hoeffding starts his reasoning by noting that

Pr(Znμn+ϵ)=E[1{Znμnϵ0}]
and that

1{Znμnϵ0}exp{h(Znμnϵ)},h>0

For the dependent-variables case, as Hoeffding we use the fact that i=1nWi=1 and invoke Jensen's inequality for the (convex) exponential function, to write

ehZn=exp{h(i=1nWiXi)}i=1nWiehXi

and linking results to arrive at

Pr(Znμn+ϵ)eh(μn+ϵ)E[i=1nWiehXi]

Focusing on our case, since Wi and Xi are independent, expected values can be separated,

Pr(Znμn+ϵ)eh(μn+ϵ)i=1nE(Wi)E(ehXi)

In our case, the Xi are i.i.d Bernoullis with parameter θ, and E[ehXi] is their common moment generating function in h, E[ehXi]=1θ+θeh. So

Pr(Znμn+ϵ)eh(μn+ϵ)(1θ+θeh)i=1nE(Wi)

Minimizing the RHS with respect to h, we get

eh=(1θ)(μn+ϵ)θ(1μnϵ)

Plugging it into the inequality and manipulating we obtain

Pr(Znμn+ϵ)(θμn+ϵ)μn+ϵ(1θ1μnϵ)1μnϵi=1nE(Wi)

while

Pr(Znθ+ϵ)(θθ+ϵ)θ+ϵ(1θ1θϵ)1θϵi=1nE(Wi)

Hoeffding shows that

(θθ+ϵ)θ+ϵ(1θ1θϵ)1θϵe2ϵ2

Courtesy of the OP (thanks, I was getting a bit exhausted...)

i=1nE(Wi)=11/2n

So, finally, the "dependent variables approach" gives us

Pr(Znθ+ϵ)(112n)e2ϵ2BD

Let's compare this to Cardinal's bound, that is based on an "independence" transformation, BI. For our bound to be tighter, we need

BD=(112n)e2ϵ2enϵ2/2=BI

2n12nexp{(4n2)ϵ2}

So for n4 we have BDBI. For n5, pretty quickly BI becomes tighter than BD but for very small ϵ, while even this small "window" quickly converges to zero. For example, for n=12, if ϵ0.008, then BI is tighter. So in all, Cardinal's bound is more useful.

COMMENT
To avoid misleading impressions regarding Hoeffding's original paper, I have to mention that Hoeffding examines the case of a deterministic convex combination of dependent random variables. Specificaly, his Wi's are numbers, not random variables, while each Xi is a sum of independent random variables, while the dependency may exist between the Xi's. He then considers various "U-statistics" that can be represented in this way.


Alecos: E[W1]=(11/2n)/n (take a look at the derivation at the end of my answer). Your bound doesn't decay exponentially with n as cardinal's does.
Zen

@Zen Indeed (in fact it increases with sample size, although boundedly), that's why Cardinal's bound is more useful for most sample sizes.
Alecos Papadopoulos
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.