Lấy mẫu phân phối giá trị trung bình của Beta


8

Giả sử chúng tôi có . Phân phối mẫu của mẫu có nghĩa là gì?XBeta(α,β)

Nói cách khác, mẫu phân phối có nghĩa là gì của bản Beta theo sau?X¯


1
Wow - câu hỏi khó. Có thể khó mô tả tất cả các giá trị của alpha và beta với các hình dạng lạ xảy ra đối với một số lựa chọn tham số, nhưng khi cả hai đều lớn hơn 1, có vẻ như nó sẽ có xu hướng bất thường đối với Gaussian trên CLT, nhưng tôi không thể nói chắc chắn
T3am5hark

4
Phân phối tiệm cận của trung bình mẫu của một mẫu ngẫu nhiên sẽ được điều chỉnh bởi CLT bất cứ khi nào phương sai tồn tại, không yêu cầu . α,β>1
Christoph Hanck

Câu trả lời:


2

Lưu ý: xem thêm cho cùng một câu hỏi /math/85535/sum-of-niid-beta-distribution-variabled

Đối với trường hợp phân phối đồng đều, , phân phối tổng của một số biến độc lập (và giá trị trung bình có liên quan) đã được mô tả là phân phối Irwin-Hall .Beta(1,1)

Nếu

Xn=i=1nYi with UiBeta(1,1)

sau đó bạn có một spline độn1

fX(x;n)=1(n1)!j=0n1aj(k,n)xj for kxk+1

trong đó có thể được mô tả bằng quan hệ lặp lại:aj(k,n)

aj(k,n)={1k=0,j=n10k=0,j<n1aj(k1,n)+(1)n+kj1(nk)(n1j)knj1k>1


Bạn có thể thấy công thức trên được xây dựng bằng phép tích phân lặp lại của với trong đó tích phân được giải từng phần. Chúng ta có thể khái quát điều này cho các biến phân phối Beta với bất kỳ và nào không?Xn1Ynαβ

Đặt

Xn(α,β)=i=1nYi with UiBeta(α,β)

Chúng tôi hy vọng hàm sẽ được chia thành phần (mặc dù có thể không phải là một spline nữa). Phép chập để tính phân phối sẽ giống như:fX(x;n,α,β)nXn(α,β)=Xn1(α,β)+Un

fX(x;n,α,β)=1min(1,nx)min(1,x)fX(xy;n1,α,β)yα1(1y)β1dy

  • Với :n=2

    fX(x;n,α,β)={0xx((xy)y)α1((1x+y)(1y))β1dyif 0x1x11((xy)y)α1((1x+y)(1y))β1dyif 1x2

    • Đối với số nguyên và :αβ các thuật ngữ như và có thể được mở rộng cho các giá trị nguyên của và , sao cho tích phân đơn giản để giải quyết.((xy)y)α1((1x+y)(1y))β1αβ

      Ví dụ:

      fX(x;2,2,2)={130x3(x25x+5)if x1130(2x)3(x2+x1)if x1fX(x;2,3,3)={1630x5(x49x3+30x242x+21)if x11630(2x)5(x4+x32x+1)if x1

Giải pháp cho các giá trị nguyên của và cũng sẽ là một spline. Có thể điều này có thể được sử dụng trong một số công thức tốt (hoặc nhiều khả năng không tốt) cho các tình huống chung hơn (không chỉ và hoặc ). Nhưng tại thời điểm này, người ta cần khá nhiều tách cà phê, hoặc tốt hơn là truyền, để giải quyết vấn đề này.αβn=2α=β=2α=β=3


1

Tôi nghĩ rằng đây là một câu hỏi thú vị vì vậy đây là một khám phá trực quan nhanh. Đối với , trước tiên tôi đã chọn 4 bản phân phối Beta riêng biệt (các tệp PDF được hiển thị bên dưới).XBeta(α1,α2)

Beta_PDF

Sau đó, tôi đã thu thập các phương tiện mẫu, và vẽ biểu đồ tương ứng như được hiển thị bên dưới. Các kết quả có vẻ bình thường và tôi có xu hướng tin rằng khẳng định của @ ChristophHanck rằng Định lý giới hạn trung tâm (CLT) đang hoạt động ở đây. X¯=1ni=1nxi

Beta_means


Mã MATLAB

% Parameters
n = 5000;
K = 5000;
% Define Beta distributions
pd1 = makedist('Beta',0.25,0.45);
pd2 = makedist('Beta',0.25,2.5);
pd3 = makedist('Beta',4,0.15);
pd4 = makedist('Beta',3.5,5);
% Collect Sample Means
X1bar = zeros(K,1);
X2bar = zeros(K,1);
X3bar = zeros(K,1);
X4bar = zeros(K,1);
for k = 1:K                           % get K sample means 
    X1bar(k) = mean(random(pd1,n,1)); % take mean of n samples
    X2bar(k) = mean(random(pd2,n,1));
    X3bar(k) = mean(random(pd3,n,1));
    X4bar(k) = mean(random(pd4,n,1));
end
% Plot Beta distribution PDFs
Xsupport = 0:.01:1;

figure, hold on, box on
title('Beta(\alpha_1,\alpha_2) PDFs')
plot(Xsupport,pdf(pd1,Xsupport),'r-','LineWidth',2.2)
plot(Xsupport,pdf(pd2,Xsupport),'b-','LineWidth',2.2)
plot(Xsupport,pdf(pd3,Xsupport),'k-','LineWidth',2.2)
plot(Xsupport,pdf(pd4,Xsupport),'g-','LineWidth',2.2)
legend('(0.25,0.45)','(0.25,2.5)','(4,0.15)','(3.5,5)')

figure
s(1) = subplot(2,2,1), hold on, box on
    histogram(X1bar,'FaceColor','r')
s(2) = subplot(2,2,2), hold on, box on
    histogram(X2bar,'FaceColor','b')
s(3) = subplot(2,2,3), hold on, box on
    histogram(X3bar,'FaceColor','k')
s(4) = subplot(2,2,4), hold on, box on
    histogram(X4bar,'FaceColor','g')
title(s(1),'(0.25,0.45)')
title(s(2),'(0.25,2.5)')
title(s(3),'(4,0.15)')
title(s(4),'(3.5,5)')

Chỉnh sửa: Bài đăng này là một nỗ lực nhanh chóng để cung cấp cho OP một cái gì đó. Như đã chỉ ra, chúng ta biết Định lý giới hạn trung tâm (CLT) ngụ ý những kết quả này sẽ giữ cho bất kỳ phân phối nào có phương sai hữu hạn.


2
Bạn đã chạy một loạt các ví dụ chứng minh CLT. Như đã lưu ý trong các nhận xét, không có gì đặc biệt về các bản phân phối Beta trong các ví dụ này: bạn có thể bắt đầu với bất kỳ phân phối phương sai hữu hạn nào và có được kết quả giống hệt nhau.
whuber

Bạn nói đúng. Tôi nêu lên nhận xét đó nhưng cung cấp câu trả lời vì không có. Tất nhiên CLT giữ cho phân phối phương sai hữu hạn. Tôi thậm chí đã đề cập đến các bình luận trong câu trả lời. Tôi có nên xóa câu trả lời này? Hoặc làm cho nó cộng đồng?
SecretAgentMan
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.