Hiểu bằng chứng về một bổ đề được sử dụng trong bất đẳng thức Hoeffding


11

Tôi đang nghiên cứu các bài giảng của Larry Wasserman về Thống kê sử dụng Casella và Berger làm văn bản chính. Tôi đang làm việc thông qua các ghi chú bài giảng của mình tập 2 và bị mắc kẹt trong việc tạo ra bổ đề được sử dụng trong bất đẳng thức của Hoeffding (tr.2-3). Tôi đang sao chép bằng chứng trong các ghi chú bên dưới và sau bằng chứng tôi sẽ chỉ ra nơi tôi bị mắc kẹt.


Bổ đề

Giả sử rằng và rằng . Sau đó .E(X)=0aXbE(etX)et2(ba)2/8

Bằng chứng

Vì , chúng ta có thể viết dưới dạng kết hợp lồi của và , cụ thể là trong đó . Bằng cách lồi của hàm chúng ta cóaXbXabX=αb+(1α)aα=Xabayety

etXαetb+(1α)eta=Xabaetb+bXbaeta

Hãy kỳ vọng của cả hai bên và sử dụng thực tế để có đượcE(X)=0

E(etX)abaetb+bbaeta=eg(u)

trong đó , và . Lưu ý rằng . Ngoài ra cho tất cả .g ( u ) = - γ u + log ( 1 - γ + γ e u ) γ = - một / ( b - một ) g ( 0 ) = gu=t(ba)g(u)=γu+log(1γ+γeu)γ=a/(ba)g(0)=g(0)=0u>0g(u)1/4u>0

Theo định lý của Taylor, có một sao cho g ( u ) = g ( 0 ) + u gε(0,u)g(u)=g(0)+ug(0)+u22g(ε)=u22g(ε)u28=t2(ba)28

Do đó .E(etX)eg(u)et2(ba)28


Tôi có thể làm theo bằng chứng cho đến

u,g(u),γE(etX)abaetb+bbaeta=eg(u) nhưng tôi không thể tìm ra cách lấy .u,g(u),γ


3
Điều thú vị là giá trị tối đa của là và do đó, kết quả là trông có vẻ quá quen thuộc để phát sinh từ sự trùng hợp tuyệt đối. Tôi nghi ngờ có thể có một cách khác, có thể dễ dàng hơn để rút ra kết quả thông qua lập luận xác suất. var(X)E [ e t X ] e σ 2 max t 2 / 2σmax2=(ba)2/4
E[etX]eσmax2t2/2
Dilip Sarwate

@DilipSarwate Hiểu biết của tôi là phương sai tối đa xảy ra đối với một biến ngẫu nhiên thống nhất . Phương sai của là . Bạn có thể giải thích làm thế nào bạn có không? X V a r ( X ) = ( b - a ) 2XU(a,b)X (b-a)2Var(X)=(ba)212(ba)24
Anand

Bằng cách tập trung khối lượng vào các điểm cuối ...
Elvis

@DilipSarwate Tôi đã thêm một vài nhận xét trong bằng chứng, điều đó có thể làm rõ một chút tiêu đề tại sao trường hợp xấu nhất là phương sai tối đa.
Elvis

1
@DilipSarwate - Xem bổ đề 1 và bài tập 1 tại đây: terrytao.wordpress.com/2010/01/03/ . Dường như có một dẫn xuất đơn giản hơn dựa vào sự bất bình đẳng của Jensen và sự mở rộng của taylor. Tuy nhiên, các chi tiết về điều này là không rõ ràng với tôi. Có lẽ ai đó có thể có ý nghĩa của nó. (dẫn xuất từ ​​(9) đến (10) và bài tập 1)
Leo

Câu trả lời:


17

Tôi không chắc là tôi hiểu chính xác câu hỏi của bạn. Tôi sẽ cố gắng trả lời: cố gắng viết là một hàm của : này là tự nhiên khi bạn muốn một ràng buộc trong .u=t(b-a)e u 2

abaetb+bbaeta
u=t(ba)eu28

Được giúp đỡ bởi kinh nghiệm, bạn sẽ biết rằng tốt hơn là chọn viết nó dưới dạng . Sau đó, dẫn đến với . e g ( u ) = - aeg(u) g ( u )

eg(u)=abaetb+bbaeta
γ=- a
g(u)=log(abaetb+bbaeta)=log(eta(abaet(ba)+bba))=ta+log(γeu+(1γ))=γu+log(γeu+(1γ)),
γ=aba

Đó có phải là điều bạn đang yêu cầu?

Chỉnh sửa: một vài bình luận về bằng chứng

  1. Thủ thuật đầu tiên đáng được xem xét cẩn thận: if là hàm lồi và là biến ngẫu nhiên có tâm, sau đó trong đó là biến rời rạc được xác định bởi Do đó, bạn nhận được rằng là biến trung tâm có hỗ trợ trong có phương sai cao nhất: Lưu ý rằng nếu chúng tôi sửa chiều rộng hỗ trợmột X b E ( φ ( X ) ) - mộtϕaXbX0P(X0=a)
    E(ϕ(X))abaϕ(b)+bbaϕ(a)=E(ϕ(X0)),
    X0X0[a,b]Var(X)=E(X2)E(X20)=ba2-ab2
    P(X0=a)=bbaP(X0=b)=aba.
    X0[a,b](b-a)(b-a)2
    Var(X)=E(X2)E(X02)=ba2ab2ba=ab.
    (ba), đây là ít hơn như Dilip nói trong các nhận xét, điều này là do ; giới hạn đạt được cho .(ba)24(ba)2+4ab0a=b
  2. Bây giờ chuyển sang vấn đề của chúng tôi. Tại sao có thể có được một ràng buộc chỉ phụ thuộc vào ? Theo trực giác, đó chỉ là vấn đề thay đổi kích thước của : nếu bạn có ràng buộc cho trường hợp , thì giới hạn chung có thể thu được bằng cách lấy . Bây giờ hãy nghĩ đến tập hợp các biến trung tâm với sự hỗ trợ của chiều rộng 1: không có quá nhiều tự do, vì vậy nên tồn tại một ràng buộc như . Một cách tiếp cận khác là nói đơn giản là bằng bổ đề trên trên , sau đó nói chung là , chỉ phụ thuộc vào vàu=t(ba)XE(etX)s(t)ba=1s(t(ba))s(t)

    E(ϕ(X))E(ϕ(tX))E(ϕ(tX0))uγ : nếu bạn sửa và và để khác nhau, chỉ có một mức độ tự do, và , , . Chúng tôi nhận được Bạn chỉ cần tìm một ràng buộc chỉ liên quan đến .u=u0=t0(b0a0)γ=γ0=a0b0a0t,a,bt=t0αa=αa0b=αa0

    abaϕ(tb)+bbaϕ(ta)=a0b0a0ϕ(tb0)+b0b0a0ϕ(a0).
    u
  3. Bây giờ chúng tôi tin rằng nó có thể được thực hiện, nó phải dễ dàng hơn nhiều! Bạn không nhất thiết phải nghĩ đến để bắt đầu. Vấn đề là bạn phải viết mọi thứ như một hàm của và . Lưu ý đầu tiên rằng , , và . Sau đó Bây giờ chúng ta đang ở trong trường hợp cụ thể ... Tôi nghĩ rằng bạn có thể hoàn thành.guγ

    γ=aba1γ=bbaat=γubt=(1γ)u

    E(ϕ(tX))abaϕ(tb)+bbaϕ(ta)=γϕ((1γ)u)+(1γ)ϕ(γu)


    ϕ=exp

Tôi hy vọng tôi đã làm rõ nó một chút.


đó chính xác là những gì tôi đang tìm kiếm. Cảm ơn rất nhiều.
Anand

1
@Anand Tôi biết thật khó để làm theo lời khuyên, tuy nhiên tôi nghĩ bạn không nên bắt đầu bằng cách tập trung vào các chi tiết kỹ thuật mà nên cố gắng hiểu tại sao một ràng buộc như vậy có thể tồn tại ... thì bằng chứng sẽ xuất hiện dễ dàng hơn. Tôi đã cố gắng chỉ cho bạn lý do tại sao trong phần thứ hai, được thêm vào sáng nay (bạn cần ngủ với một câu hỏi như thế này - ít nhất là tôi cần phải làm như vậy). Tôi nghĩ thật kinh khủng khi loại trực giác này không xuất hiện trong hầu hết các sách giáo khoa ... ngay cả khi bạn có phần kỹ thuật, miễn là bạn không có ý tưởng thì mọi thứ đều có vẻ kỳ diệu. Cảm ơn bạn và CrossV đã cho tôi cơ hội để suy nghĩ chi tiết về điều này!
Elvis

1
Ồ +1 cho chỉnh sửa. Cảm ơn. Nhưng sẽ không tốt nếu có thể có được thứ gì đó như
E[etX]eE[t2X2/2]=e(t2/2)E[X2]=e(t2/2)var(X)et2σmax2/2?
Dilip Sarwate

@Elvis Cảm ơn lời khuyên và đã dành thời gian để viết ra phần trực quan. Tôi cần dành một chút thời gian để hiểu điều này!
Anand

1
@Elvis Lấy về trực giác, tôi muốn làm rõ sự hiểu biết của tôi. Để có được giới hạn sắc nét hơn, người ta cần những khoảnh khắc cao hơn. Markov sử dụng khoảnh khắc đầu tiên, Ch Quashev khoảnh khắc thứ hai và Hoeffding sử dụng mgf. Điều này có đúng không? Nếu ai đó có thể mở rộng và làm rõ phần này thì sẽ rất tuyệt.
Anand
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.