Phân phối xác suất đặc biệt


12

Nếu là phân phối xác suất có giá trị khác không trên , thì loại nào tồn tại hằng số sao cho với mọi ?p ( x ) p(x)[ 0 , + ) [0,+)p ( x ) p(x)c > 0 c>0 0 p ( x ) log p ( x )( 1 + ϵ ) p ( x ( 1 + ϵ ) ) dxcϵ20p(x)logp(x)(1+ϵ)p(x(1+ϵ))dxcϵ20<ϵ<10<ϵ<1

Sự bất bình đẳng ở trên thực sự là sự phân kỳ Kullback-Leibler giữa phân phối và phiên bản nén của nó . Tôi đã phát hiện ra rằng sự bất bình đẳng này phù hợp với các phân phối Exponential, Gamma và Weibull và tôi muốn biết liệu điều đó có hiệu quả đối với một lớp phân phối xác suất lớn hơn không.p ( x ) p(x)( 1 + ε ) p ( x ( 1 + ε ) )(1+ϵ)p(x(1+ϵ))

Bất kỳ ý tưởng bất bình đẳng có nghĩa là gì?


3
Vì là dương sẽ được nén (theo hướng x) thay vì kéo dài. εϵ
Glen_b -Reinstate Monica

2
Câu hỏi này không rõ ràng: định lượng của bạn là gì? Bạn có muốn bất bình đẳng này giữ cho tất cả , ít nhất một hoặc cái gì khác không? Là được đưa ra một tiên nghiệm hay bạn có nghĩa là nên tồn tại ít nhất một giá trị như vậy của ? Và vì bạn đề cập đến các lớp phân phối xác suất, bởi " " bạn có nghĩa là một phân phối cụ thể hay bạn có thể có nghĩa là một họ tham số của chúng? ϵ ϵ c c p ( x )ϵ ϵccp(x)
whuber

2
@whuber Cảm ơn ý kiến ​​của bạn. Tôi đã sửa chữa cho tuyên bố vấn đề của tôi để làm rõ các vấn đề được đề cập. Ý tôi là, vì những gì bất đẳng thức trên giữ? Câu trả lời có thể là giới thiệu một họ phân phối tham số hoặc đề xuất một phương trình vi phân cho đủ và đưa ra bất đẳng thức mong muốn. p ( x ) p(x)p ( x )p(x)
Sus20200

2
Bất đẳng thức này sẽ không hoạt động đối với bất kỳ p (x) liên tục và với sự hỗ trợ vô hạn? Bạn đang tính toán phân kỳ KL trong một họ tham số ( ϵ p ( x ( 1 + ϵ ) )ϵp(x(1+ϵ)) . Nếu KL có độ phân tán bằng 0, thì đạo hàm của nó là 0. Lấy CC là cực đại của độ cong của KL (cho ϵ [ 0 , 1 ]ϵ[0,1] ), chúng tôi có ràng buộc. Với công việc bổ sung, có thể ràng buộc C từ các thuộc tính của p
Guillaume Dehaene

1
L = lim x 0 p ( x ) x = 0 L=limx0p(x)x=0L ϵ + O ( ϵ 2 )Lϵ+O(ϵ2)

Câu trả lời:


4

Sơ bộ

Viết

Tôi p (ε)=0 p(x)log ( p ( x )( 1 + ϵ ) p ( x ( 1 + ϵ ) ) )d x .

Ip(ϵ)=0p(x)log(p(x)(1+ϵ)p(x(1+ϵ)))dx.

Các logarit và mối quan hệ giữa và đề nghị biểu thị cả và đối số của nó là số mũ. Cuối cùng, xác địnhp ( x ) p ( x ( 1 + ε ) ) pp(x)p(x(1+ϵ))p

q ( y ) = log ( p ( e y ) )

q(y)=log(p(ey))

với tất cả thực mà bên phải được xác định và bằng ở bất cứ đâu . Lưu ý rằng sự thay đổi của các biến đòi hỏi và (lấy là mật độ phân phối) mà Luật xác suất tổng thể có thể được biểu thị bằngyyp(ey)=0p(ey)=0x=eyx=eydx=eydydx=eydypp

1=0p(x)dx=Req(y)+ydy.

1=0p(x)dx=Req(y)+ydy.(1)

Giả sử khi . eq(y)+y0eq(y)+y0y±y± Điều này loại trừ phân phối xác suất với vô số gai có mật độ gần hoặc . Cụ thể, nếu đuôi của cuối cùng là đơn điệu, ngụ ý giả định này, cho thấy nó không phải là một vấn đề nghiêm trọng.pp00pp(1)(1)

Để làm việc với logarit dễ dàng hơn, cũng quan sát rằng

1 + ε = e ε + O ( ε 2 ) .

1+ϵ=eϵ+O(ϵ2).

Bởi vì các tính toán sau sẽ được thực hiện lên tới bội số của , hãy xác địnhε 2ϵ2

δ = log ( 1 + ε ) .

δ=log(1+ϵ).

Chúng tôi cũng có thể thay thế bằng , với tương ứng với và positive tương ứng với positive .1 + ε e delta delta = 0 ε = 0 delta ε1+ϵeδδ=0ϵ=0δϵ

Phân tích

Một cách rõ ràng trong đó bất đẳng thức có thể thất bại là tích phân để phân kỳ cho một số . Ví dụ, điều này sẽ xảy ra nếu bất kỳ khoảng thích hợp nào của các số dương, dù nhỏ đến đâu, trong đó đều bằng 0 nhưng không bằng 0 trên khoảng . Điều đó sẽ khiến tích phân trở thành vô hạn với xác suất dương.Tôi p (ϵ)ϵ(0,1]Ip(ϵ)ϵ(0,1][ u , v ] p p [ u - ϵ , v - ϵ ][u,v]pp[uϵ,vϵ]

Vì câu hỏi không đặc biệt liên quan đến bản chất của , chúng tôi có thể bị sa lầy vào các vấn đề kỹ thuật liên quan đến việc có thể trơn tru như thế nào . Chúng ta hãy tránh những vấn đề như vậy, vẫn hy vọng đạt được một số hiểu biết, bằng cách giả sử rằng ở mọi nơi có nhiều dẫn xuất như chúng ta có thể quan tâm để sử dụng. (Hai sẽ đủ nếu là liên tục.) Bởi vì đó đảm bảo cốt giáp trên bất kỳ thiết bị chặn, nó ngụ ý rằng là không bao giờ bằng không khi .ppppqqqqqqp(x)p(x)x>0x>0

Lưu ý rằng câu hỏi thực sự liên quan đến hành vi của khi tiếp cận 0 từ trên xuống. Vì tích phân này là hàm liên tục của trong khoảng , nên nó đạt được một số tối đa khi bị giới hạn ở bất kỳ khoảng dương nào , cho phép chúng tôi chọn , vì rõ ràngIp(ϵ)Ip(ϵ)ϵϵϵϵ(0,1](0,1]Mp(a)Mp(a)ϵϵ[a,1][a,1]c=Mp(a)/a2c=Mp(a)/a2cϵ2=Mp(a)(ϵa)2Mp(a)Ip(ϵ)

cϵ2=Mp(a)(ϵa)2Mp(a)Ip(ϵ)

làm cho bất bình đẳng làm việc Đây là lý do tại sao chúng ta chỉ cần quan tâm đến modulo .ϵ2ϵ2

Giải pháp

Sử dụng các thay đổi của biến từ thành , từ thành và thành , hãy tính thông qua thứ tự thứ hai trong (hoặc ) với hy vọng đạt được một sự đơn giản hóa. Để kết thúc đó xác địnhxxyyppqqϵϵδδIp(ϵ)Ip(ϵ)ϵϵδδ

R(y,δ)δ2=q(y+δ)q(y)δq(y)

R(y,δ)δ2=q(y+δ)q(y)δq(y)

là phần còn lại - phần còn lại trong bản mở rộng Taylor của quanh .22qqyy

Ip(ϵ)=Req(y)+y(q(y)q(y+δ)δ)dy=Req(y)+y(δ+δq(y)+R(y,δ)δ2)dy=δReq(y)+y(1+q(y))dyδ2Req(y)+yR(y,δ)dy.

Ip(ϵ)=Req(y)+y(q(y)q(y+δ)δ)dy=Req(y)+y(δ+δq(y)+R(y,δ)δ2)dy=δReq(y)+y(1+q(y))dyδ2Req(y)+yR(y,δ)dy.

Thay đổi các biến thành trong tích phân bên trái cho thấy nó phải biến mất, như được nhận xét trong giả định sau . Thay đổi các biến trở lại trong tích phân bên tay phảiq(y)+yq(y)+y(1)(1)x=eyx=ey

Ip(ϵ)=δ2Rp(x)R(log(x),δ)dy=δ2Ep(R(log(x),δ)).

Ip(ϵ)=δ2Rp(x)R(log(x),δ)dy=δ2Ep(R(log(x),δ)).

Bất bình đẳng giữ (theo các giả định kỹ thuật khác nhau của chúng tôi) khi và chỉ khi hệ số ở phía bên tay phải là hữu hạn.δ2δ2

Diễn dịch

Đây là một điểm tốt để dừng lại, bởi vì nó dường như phát hiện ra vấn đề thiết yếu: bị ràng buộc bởi một hàm bậc hai của khi lỗi bậc hai trong bản mở rộng Taylor của không phát nổ (liên quan đến phân phối) khi tiếp cận .Ip(ϵ)Ip(ϵ)ϵϵqqy±

Hãy kiểm tra một số trường hợp được đề cập trong câu hỏi: phân phối theo cấp số nhân và Gamma. (Số mũ là trường hợp đặc biệt của Gamma.) Chúng tôi không bao giờ phải lo lắng về các tham số tỷ lệ, vì chúng chỉ thay đổi các đơn vị đo lường. Chỉ các thông số không quy mô quan trọng.

Ở đây, vì cho , Bản mở rộng Taylor xung quanh một tùy ý làĐịnh lý Taylor với phần còn lại ngụ ý bị chi phối bởi cho đủ nhỏ . Vì kỳ vọng của là hữu hạn, nên bất bình đẳng giữ cho các phân phối Gamma.p(x)=xkexk>1q(y)=ey+kylogΓ(k+1).

yConstant+(key)δey2δ2+.
R(log(x),δ)ey+δ/2<xδx

Tính toán tương tự bao hàm sự bất bình đẳng đối với các bản phân phối Weibull, phân phối bán chuẩn, phân phối lognormal, vv Trong thực tế, để có được counterexamples chúng tôi sẽ cần phải vi phạm ít nhất một giả định, buộc chúng ta phải nhìn vào các bản phân phối nơi biến mất trên một số khoảng thời gian, hoặc là không liên tục hai lần khác nhau, hoặc có vô số chế độ. Đây là những thử nghiệm dễ dàng để áp dụng cho bất kỳ họ phân phối nào thường được sử dụng trong mô hình thống kê.p

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.