Giới hạn trên


21

Nếu f là hàm lồi thì bất đẳng thức của Jensen nói rằng f(E[x])E[f(x)]mutatis mutandis khi f lõm. Rõ ràng trong trường hợp xấu nhất, bạn không thể giới hạn trên E[f(x)] về mặt f(E[x]) cho một lồi f , nhưng có một ràng buộc đi theo hướng này nếu flà lồi nhưng "không quá lồi"? Có một số tiêu chuẩn ràng buộc cung cấp cho điều kiện về một hàm lồi f (và có thể phân phối là tốt, nếu cần thiết) mà sẽ cho phép bạn để kết luận rằng E[f(x)]φ(f)f(E[x]) , trong φ(f) là một số hàm của độ cong / mức độ lồi của f ? Một cái gì đó giống với tình trạng của Lipschitz, có lẽ?


Bỏ phiếu để đóng như lạc đề. math.stackexchange.com có thể?
Aryabhata

7
Tôi nghĩ rằng câu hỏi này nên được mở; đây là loại bất bình đẳng mà nhiều nhà lý thuyết làm việc sẽ thấy hữu ích một cách thường xuyên.
Aaron Roth

10
Tôi biết rằng điều này gần với toán học thuần túy hơn hầu hết các câu hỏi được đăng từ trước đến nay, nhưng tôi sẽ cho rằng đây là chủ đề vì loại điều này xuất hiện thường xuyên trong phân tích các thuật toán ngẫu nhiên (là ứng dụng tôi có trong lí trí). Tôi nghĩ rằng toán học được sử dụng nhiều trong khoa học máy tính nên được coi là trò chơi công bằng cho các câu hỏi.
Ian

6
bỏ phiếu để giữ cho mở. chắc chắn về chủ đề
Suresh Venkat

1
Tôi cũng bỏ phiếu để tiếp tục mở.
Jeffε

Câu trả lời:


21

EDIT: phiên bản gốc đã bỏ lỡ một giá trị tuyệt đối. lấy làm tiếc!!

Xin chào Ian. Tôi sẽ phác thảo ngắn gọn hai bất đẳng thức mẫu, một bằng cách sử dụng ràng buộc của Môi trường, một bằng cách sử dụng một ràng buộc trên đạo hàm thứ hai, và sau đó thảo luận về một số khó khăn trong vấn đề này. Mặc dù tôi đang dư thừa, vì cách tiếp cận sử dụng một công cụ phái sinh giải thích những gì xảy ra với nhiều công cụ phái sinh hơn (thông qua Taylor), hóa ra phiên bản phái sinh thứ hai khá hay.

Đầu tiên, với một ràng buộc của Lipschitz: chỉ cần làm lại bất đẳng thức Jensen tiêu chuẩn. Thủ thuật tương tự được áp dụng: tính toán mở rộng Taylor theo giá trị mong đợi.

Cụ thể, Hãy đã tương ứng đo μ , và bộ m : = E ( x ) . Nếu f có Lipschitz hằng L , thì theo định lý TaylorXμm:=E(x)fL

f(x)=f(m)+f(z)(xm)f(m)+L|xm|,

trong đó (lưu ý rằng x mx > m là có thể). Sử dụng điều này và làm việc lại bằng chứng Jensen (Tôi bị hoang tưởng và kiểm tra xem tiêu chuẩn thực sự có trên wikipedia),z[m,x]xmx>m

E(f(X))=f(x)dμ(x)f(m)dμ(x)+L|xm|dμ(x)=f(E(X))+LE(|XE(X)|).

Bây giờ, giả sử . Trong trường hợp này,|f(x)|λ

f(x)=f(m)+f(m)(xm)+f(z)(xm)22f(m)+f(m)(xm)+λ(xm)22,

và như vậy

E(f(X))f(m)+f(m)(E(X)m)+λE((Xm)2)2=f(E(X))+λVar(X)2.

Tôi muốn đề cập ngắn gọn một vài điều. Xin lỗi nếu chúng là rõ ràng.

Một là, bạn không thể chỉ nói "wlog " bằng cách thay đổi phân phối, bởi vì bạn đang thay đổi mối quan hệ giữa và .f μE(X)=0fμ

Tiếp theo là ràng buộc phải phụ thuộc vào phân phối theo một cách nào đó. Để thấy điều này, hãy tưởng tượng rằng và . Dù giá trị của , bạn vẫn nhận được . Mặt khác, . Do đó, bằng cách thay đổi , bạn có thể tạo khoảng cách giữa hai số lượng tùy ý! Theo trực giác, khối lượng lớn hơn được đẩy ra khỏi giá trị trung bình và do đó, đối với bất kỳ hàm lồi nghiêm ngặt nào, sẽ tăng lên.f ( x ) = x 2 σ f ( E ( X ) ) = f ( 0 ) = 0 E ( f ( X ) ) = E ( X 2 ) = σ 2 σ E ( f ( X ) )XGaussian(0,σ2)f(x)=x2σf(E(X))=f(0)=0E(f(X))=E(X2)=σ2σE(f(X))

Cuối cùng, tôi không thấy làm thế nào để có được một số nhân bị ràng buộc như bạn đề xuất. Tất cả mọi thứ tôi đã sử dụng trong bài đăng này đều là tiêu chuẩn: Định lý và giới hạn phái sinh của Taylor là bánh mì & bơ trong giới hạn thống kê và chúng tự động đưa ra phụ gia, không phải là lỗi nhân.

Tôi sẽ suy nghĩ về nó mặc dù, và đăng một cái gì đó. Trực giác mơ hồ là nó sẽ cần các điều kiện rất nặng nề về cả chức năng và phân phối, và ràng buộc phụ gia thực sự là trung tâm của nó.


Mỗi lần tôi chỉnh sửa, câu trả lời bị xáo trộn. Vì vậy, tôi sẽ chỉ ra: ràng buộc phái sinh thứ hai là chặt chẽ cho ví dụ tôi đã đưa ra.
matus

Tôi nghĩ rằng bạn đúng trong giới hạn phụ gia là tốt nhất có thể mà không cần nhiều điều kiện mạnh hơn về chức năng.
Ian

Ian thân mến, tôi đã nghĩ về vấn đề này nhiều hơn một chút, nhưng khó khăn chính trong tâm trí tôi được gợi ý bởi ví dụ tôi đã đưa ra, trong đó , nhưng . Bạn có thể giới hạn cả họ chức năng (giới hạn, dẫn xuất giới hạn, có thể tích hợp) và phân phối (các kết nối mịn, giới hạn, giới hạn) và bạn vẫn có các ví dụ này. Nó đủ để có một hàm đối xứng, không âm bằng 0 tại giá trị trung bình của phân phối. Điều đó nói rằng, mọi thứ phụ thuộc vào các ràng buộc trong vấn đề chính xác của bạn. Trong trường hợp chung, tôi nghĩ rằng bản chất phụ gia là cơ bản. E ( f ( X ) ) > 0f(E(X))=0E(f(X))>0
matus

@Ian: Bằng chứng về sự bất bình đẳng của Chernoff và Azuma-Hoeffding sử dụng các lập luận gợi nhớ về điều này, vì vậy bạn có thể muốn đọc những điều đó để lấy cảm hứng. Xem ví dụ cuốn sách của Mitzenmacher và Upfal về tính ngẫu nhiên trong điện toán.
Warren Schudy

3

Để hiểu rõ, hãy xem xét một phân phối tập trung vào hai giá trị; giả sử, với xác suất bằng 1/2 bằng 1 hoặc 3, khi đó . Lấy và . Hãy xem xét các hàm mà và . Bằng cách làm cho đủ nhỏ và kết nối liên tục giữa ba điểm này, chúng ta có thể làm cho độ cong của nhỏ như mong muốn. Sau đóN > > 0 ε > 0 f f ( 1 ) = f ( 3 ) = N ε f ( E [ x ] ) = f ( 2 ) = ε ε f fE[x]=2N>>0ϵ>0ff(1)=f(3)=Nϵf(E[x])=f(2)=ϵϵff

E[f(x)]=Nϵ , chưa

N=Nϵ/ϵ=E[f(x)]/f(E[x])φ(f) .

Điều này cho thấy phải lớn tùy ý.φ(f)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.