Có phải một biến ngẫu nhiên đơn biến có nghĩa luôn luôn bằng tích phân của hàm lượng tử của nó không?


17

Tôi chỉ nhận thấy rằng việc tích hợp hàm lượng tử của biến ngẫu nhiên đơn biến (nghịch đảo cdf) từ p = 0 đến p = 1 tạo ra giá trị trung bình của biến. Tôi chưa nghe nói về mối quan hệ này trước đây, vì vậy tôi tự hỏi: Có phải luôn luôn như vậy không? Nếu vậy, mối quan hệ này được biết đến rộng rãi?

Đây là một ví dụ trong python:

from math import sqrt
from scipy.integrate import quad
from scipy.special import erfinv

def normalPdf(x, mu, sigma):
    return 1.0 / sqrt(2.0 * pi * sigma**2.0) * exp(-(x - mu)**2.0 / (2.0 * sigma**2.0))

def normalQf(p, mu, sigma):
    return mu + sigma * sqrt(2.0) * erfinv(2.0 * p - 1.0)

mu = 2.5
sigma = 1.3
quantileIntegral = quad(lambda p: quantile(p,mu,sigma), 0.0, 1.0)[0]
print quantileIntegral # Prints 2.5.

Câu trả lời:


26

Đặt là CDF của biến ngẫu nhiên X , do đó CDF nghịch đảo có thể được viết F - 1 . Trong tích phân của bạn thực hiện thay thế p = F ( x ) , d p = F ( x ) d x = f ( x )FXF1p=F(x) để thu đượcdp=F(x)dx=f(x)dx

01F1(p)dp=xf(x)dx=EF[X].

Điều này là hợp lệ cho các phân phối liên tục. Phải cẩn thận cho các bản phân phối khác vì CDF nghịch đảo không có định nghĩa duy nhất.

Biên tập

Khi biến không liên tục, nó không có phân phối hoàn toàn liên tục đối với thước đo Lebesgue, đòi hỏi phải cẩn thận trong định nghĩa của CDF nghịch đảo và quan tâm đến các tích phân tính toán. Ví dụ, xem xét trường hợp phân phối rời rạc. Theo định nghĩa, đây là một trong đó CDF là một hàm bước với các bước có kích thước Pr F ( x ) tại mỗi giá trị có thể x .FPrF(x)x

Hình 1

Con số này chương trình CDF của một Bernoulli phân phối theo tỷ lệ 2 . Đó là, các biến ngẫu nhiên có một xác suất 1 / 3 của bằng 0 và một xác suất của bằng . Độ cao của các bước nhảy ở và(2/3)21/302 0 2 0 × ( 1 / 3 ) + 2 × ( 2 / 3 ) = 4 / 32/3202 đưa ra xác suất của chúng. Kỳ vọng của biến này rõ ràng bằng .0×(1/3)+2×(2/3)=4/3

Chúng ta có thể định nghĩa "CDF nghịch đảo" F1 bằng cách yêu cầu

F1(p)=x if F(x)p and F(x)<p.

Điều này có nghĩa là cũng là một hàm bước. Đối với mọi giá trị có thể của biến ngẫu nhiên,F1xF1 sẽ đạt được giá trị trong một khoảng thời gian dài . Do đó, tích phân của nó có được bằng cách tính tổng các giá trị , đây chỉ là kỳ vọng.xPrF(x)xPrF(x)

Hình 2

Đây là biểu đồ của CDF nghịch đảo của ví dụ trước. Các bước nhảy của và trong CDF trở thành các đường nằm ngang có độ dài này ở độ cao bằng và , các giá trị có xác suất mà chúng tương ứng. (CDF nghịch đảo không được xác định ngoài khoảng .) Tích phân của nó là tổng của hai hình chữ nhật, một chiều cao và cơ sở , cái còn lại của chiều cao và cơ sở , tổng cộng , như trước đây.1/32/302[0,1]01/322/34/3

Nói chung, đối với hỗn hợp phân phối liên tục và rời rạc, chúng ta cần xác định CDF nghịch đảo để song song với cấu trúc này: tại mỗi bước nhảy riêng lẻ của chiều cao chúng ta phải tạo thành một đường ngang có chiều dàip như được đưa ra bởi công thức trước.pp


bạn đã phạm sai lầm trong việc thay đổi biến. x đến từ đâu?
Mascarpone

3
@Mrebpone Vui lòng đọc văn bản trước phương trình. Tôi không nghĩ có một lỗi trong việc thay đổi biến :-), nhưng nếu bạn nghĩ nó sẽ làm rõ sự giải thích, tôi sẽ vui lòng chỉ ra rằng khi , thì x = F - 1 ( p ) . Tôi chỉ không nghĩ rằng đó là cần thiết. p=F(x)x=F1(p)
whuber

bây giờ tôi đã nhận được nó;),
Mascarpone

+1 Whuber: Cảm ơn! Bạn có thể giải thích để sử dụng công thức bạn đã đưa ra, làm thế nào để chăm sóc cho các bản phân phối khác mà CDF nghịch đảo không có định nghĩa duy nhất?
Tim

1
Để bỏ qua những cân nhắc khó chịu như vậy về nghịch đảo, giả nghịch đảo và tương tự, đồng thời cho một khái quát cho mọi khoảnh khắc, xem tại đây .
Đã làm

9

Một kết quả tương đương được biết đến nhiều trong phân tích sinh tồn : tuổi thọ dự kiến ​​là trong đó hàm sinh tồn là S ( t ) = Pr ( T > t ) được đo từ khi sinh ra tại t = 0 . (Nó có thể dễ dàng được mở rộng để bao gồm các giá trị âm của t .)

t=0S(t)dt
S(t)=Pr(T>t)t=0t

nhập mô tả hình ảnh ở đây

Vì vậy, chúng ta có thể viết lại điều này dưới dạng nhưng đây là1 q = 0 F - 1 ( q )

t=0(1F(t))dt
như thể hiện trong các phản ánh khác nhau của khu vực trong câu hỏi
q=01F1(q)dq

nhập mô tả hình ảnh ở đây


1
Tôi thích hình ảnh, và theo bản năng cảm thấy có một ý tưởng tuyệt vời ẩn giấu ở đây - tôi thích ý tưởng này-- nhưng tôi không hiểu những ý tưởng đặc biệt này. Giải thích sẽ hữu ích. Một điều khiến tôi dừng lại trong các bài hát của mình là ý nghĩ cố gắng mở rộng tích phân của thành - diver : nó phải phân kỳ. (1F(t))dt
whuber

@whuber: Nếu bạn muốn mở rộng sang âm , bạn nhận được t = 0 ( 1 - F ( t ) )t . Lưu ý rằng nếu điều này hội tụ cho một đối xứng phân phối khoảng 0 , tức là F ( t ) = 1 - F ( - t ) thì dễ dàng thấy rằng kỳ vọng bằng không. Tham gia một số tiền hơn là một sự khác biệtt = 0 ( 1 - F ( t ) )t=0(1F(t))dtt=0F(t)dt0F(t)=1F(t) cho độ lệch tuyệt đối trung bình khoảng 0 . t=0(1F(t))dt+t=0F(t)dt0
Henry

Nếu bạn thích sơ đồ, bạn có thể quan tâm đến bài báo năm 1988 này của Lee: Toán học về sự dư thừa của tổn thất và xếp hạng hồi cứu - Phương pháp tiếp cận đồ họa .
Avraham

4

Chúng tôi đang đánh giá:

enter image description here

Hãy thử với một thay đổi đơn giản của biến:

enter image description here

Và chúng tôi nhận thấy rằng, theo định nghĩa của PDF và CDF:

enter image description here

hầu như ở khắp mọi nơi. Do đó, theo định nghĩa của giá trị dự kiến:

enter image description here


Trong dòng cuối cùng tôi giải thích rõ hơn về định nghĩa của giá trị mong đợi. Hầu như mọi nơi đều đề cập đến phương trình trên cái cuối cùng. vi.wikipedia.org/wiki/Al
Maximum_everywhere

1
đã chỉnh sửa, thanx :)
Mascarpone

3

XF F1(U)XU(0,1)XF1(U)

E(X)=E(F1(U))=01F1(u)du.
XF1(U)FF1FF

1

F(x)P(Xx)F1

F-1(p)= =tối thiểu(x|F(x)p).
tối thiểuBạn[0,1]F-1(Bạn)XFXE(X)= =E(F-1(Bạn))= =01F-1(p)dp. Tích phân là tích phân Riemann tầm Stieltjes . Giả định duy nhất chúng ta cần là giá trị trung bình củaX tồn tại (E|X|<).

Đó là câu trả lời giống như của tôi.
Stéphane Laurent
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.