Làm cách nào để tính giá trị một phần của phân phối beta (giá trị trung bình của beta bị cắt ngắn)?


7

Phân phối Beta với a = 2, b = 3, phân vị x = 0,4

Đưa ra phân phối Beta với a = 2, b = 3, chúng ta có thể tìm thấy giá trị mong đợi (trung bình) cho khoảng [0, 1] = a / (a ​​+ b) = 2/5 = 0,4 và trung vị = (a - 1/3) / (a ​​+ b-2/3) = 0,39, gần đúng.

Tôi đang tìm kiếm một giải pháp trong python. Tôi có thể sử dụng scipy.stats.beta để tính trung bình cho khoảng [0, 0,4] với hàm phần trăm điểm (nghịch đảo của cdf - Perciles):

beta.ppf(0.4/2,a,b) = 0.2504

Vì phân phối beta này, giá trị trung bình và trung bình tổng thể gần nhau (tương ứng 0,4 và 0,39), tôi sử dụng trung bình cho khoảng [0, 0,4] để ước tính các giá trị dự kiến ​​(trung bình) cho khoảng [0, 0,4].

Có cách nào để tính giá trị dự kiến ​​(trung bình) cho khoảng [0, 0,4] không?


1
Theo nguyên tắc chung, bạn không nên sửa lỗi tính toán trong câu hỏi của mình được giải thích trong câu trả lời, vì bạn "phá vỡ" câu trả lời - việc sửa trong câu trả lời không còn ý nghĩa nữa. (Mặt khác, việc chỉnh sửa được đưa ra trong các bình luận là một vấn đề khác.) --- Tôi cố gắng điều chỉnh câu trả lời của mình để bù lại nhưng những lỗi như vậy thường là tốt nhất để lại.
Glen_b -Reinstate Monica

1
Xin lỗi vì điều đó. Tôi không biết quy tắc như vậy.
Arbi Haza Thông báo

Câu trả lời:


8

Lưu ý rằng công thức bạn có gần đầu ở đó cho trung bình beta (α13α+β23) là gần đúng. Bạn sẽ có thể tính toán trung bình số "chính xác" một cách hiệu quả với cdf nghịch đảo (hàm lượng tử) của phân phối beta trong Python (cho mộtbeta(2,3) Tôi có một trung bình xung quanh 0.3857 trong khi công thức gần đúng đó mang lại 0.3846).

Điều này có nghĩa là một bản phân phối rút gọn khá đơn giản với bản beta. Đối với một biến ngẫu nhiên tích cực, chúng tôi có

E(X|X<k)= =0kxf(x)dx/0kf(x)dx

trong trường hợp này f là mật độ của beta với các tham số αβ (mà bây giờ tôi sẽ viết là f(x;α,β)):

f(x;α,β)= =1B(α,β)xα-1(1-x)β-1,0<x<1,α,β>0

Vì thế xf(x)= =B(α+1,β)B(α,β)f(x;α+1,β)= =αα+βf(x;α+1,β)

Vì thế E(X|X<k)= =αα+β0kf(x;α+1,β)dx/0kf(x;α,β)dx

Bây giờ hai tích hợp chỉ là các CDF beta mà bạn đã có sẵn trong Python.

Với α= =2,β= =3,k= =0,4 chúng tôi nhận được E(X|X<0,4)0,24195. Điều này phù hợp với mô phỏng (106 mô phỏng đã cho 0,24194).

Đối với trung bình, tôi nhận được F-1(12F(0,4;2,3);2,3)0,25040, một lần nữa phù hợp với mô phỏng (106 mô phỏng đã cho 0,25038).

Cả hai khá thân thiết trong trường hợp này nhưng đó không phải là kết quả chung; đôi khi chúng có thể khác nhau nhiều hơn


1
Cảm ơn bạn đã giải thích chi tiết. Tôi nên hỏi ở đây vài tuần trước!
Arbi Haza Thông báo
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.