Tóm tắc
Bạn đã khám phá lại một phần của công trình được mô tả tại Định lý giới hạn trung tâm cho các mẫu trung bình mẫu , minh họa một phân tích về trung vị của mẫu. (Phân tích rõ ràng được áp dụng, với những sửa đổi thích hợp , cho bất kỳ định lượng nào, không chỉ trung vị). Do đó, không có gì ngạc nhiên khi đối với các tham số Beta lớn (tương ứng với các mẫu lớn), phân phối chuẩn phát sinh theo phép biến đổi được mô tả trong câu hỏi. Điều đáng quan tâm là mức độ gần với phân phối Bình thường ngay cả đối với các tham số Beta nhỏ . Điều đó xứng đáng được giải thích.
Tôi sẽ phác thảo một phân tích dưới đây. Để giữ bài đăng này ở một độ dài hợp lý, nó bao gồm rất nhiều cách vẫy tay gợi ý: Tôi chỉ nhằm mục đích chỉ ra những ý tưởng chính. Do đó, hãy để tôi tóm tắt kết quả ở đây:
Khi gần với , mọi thứ đều đối xứng. Điều này gây ra phân phối đã chuyển đổi để trông bình thường.betaαβ
Các chức năng của biểu mẫu trông khá bình thường ở vị trí đầu tiên, ngay cả đối với các giá trị nhỏ của và (miễn là cả hai vượt quá và tỷ lệ của chúng không quá gần hoặc ). α β 1 0 1Φα - 1( X ) ( 1 - Φ ( x ) )β- 1αβ101
Định mức rõ ràng của phân phối biến đổi là do thực tế là mật độ của nó bao gồm mật độ Bình thường nhân với một hàm trong (2).
Khi và tăng, độ rời khỏi Normality có thể được đo bằng các số hạng còn lại trong chuỗi Taylor cho mật độ nhật ký. Thời hạn của đơn hàng giảm tỷ lệ thuận với quyền hạn của vàbeta n ( n - 2 ) / 2 alpha beta . Điều này ngụ ý rằng cuối cùng, cho đủ lớn α và β , tất cả về quyền lực n = 3 hoặc cao hơn đã trở nên tương đối nhỏ, chỉ để lại một bậc hai: đó chính là mật độ nhật ký của một phân phối bình thường.αβn(n−2)/2αβαβn=3
Nói chung, những hành vi độc đáo giải thích tại sao ngay cả đối với nhỏ và beta các quantiles không cực đoan của một cái nhìn mẫu Bình thường iid xấp xỉ bình thường.αβ
Phân tích
Bởi vì nó có thể hữu ích để khái quát, chúng ta hãy được bất kỳ chức năng phân phối, mặc dù chúng tôi có trong tâm trí F = Φ .FF=Φ
Hàm mật độ của một Beta ( α , β ) biến là, theo định nghĩa, tỷ lệ vớig(y)(α,β)
yα−1(1−y)β−1dy.
Đặt là biến đổi tích phân xác suất của x và viết f cho đạo hàm của F , ngay lập tức x có mật độ tỷ lệ vớiy=F(x)xfFx
G(x;α,β)=F(x)α−1(1−F(x))β−1f(x)dx.
Bởi vì đây là một phép biến đổi đơn điệu của phân phối không theo phương thức mạnh (Beta), trừ khi khá lạ, phân phối được chuyển đổi cũng sẽ không đơn phương. Để nghiên cứu mức độ gần với Bình thường, hãy kiểm tra logarit mật độ của nó,F
logG(x;α,β)=(α−1)logF(x)+(β−1)log(1−F(x))+logf(x)+C(1)
Trong đó là hằng số chuẩn hóa không liên quan.C
Mở rộng các thành phần của trong chuỗi Taylor để đặt hàng ba xung quanh một giá trị x 0 (mà sẽ được gần gũi với một chế độ). Chẳng hạn, chúng ta có thể viết phần mở rộng của log F làlogG(x;α,β)x0logF
logF(x)=cF0+cF1(x−x0)+cF2(x−x0)2+cF3h3
cho một số với | h | ≤ | x - x 0 | . Sử dụng một ký hiệu tương tự cho nhật ký ( 1 - F ) và nhật ký f . h|h|≤|x−x0|log(1−F)logf
Thuật ngữ tuyến tính
Thuật ngữ tuyến tính trong do đó trở thành(1)
g1(α,β)=(α−1)cF1+(β−1)c1−F1+cf1.
Khi là chế độ của G (x0 , biểu hiện này là bằng không. Lưu ý rằng bởi vì các hệ số là các hàm liên tục của x 0 , như α và β rất đa dạng, chế độ x 0 sẽ thay đổi liên tục quá. Hơn nữa, một khi α và β là đủ lớn, các c f 1 hạn trở nên tương đối không quan trọng. Nếu chúng tôi hướng đến nghiên cứu giới hạn như α → ∞ và β → ∞ mà α : β ở lại theo tỷ lệ không đổi γG(;α,β)x0αβx0αβcf1α→∞β→∞ α:βγ, Chúng tôi có thể do đó một lần và cho tất cả chọn một điểm cơ sở màx0
γcF1+c1−F1=0.
Một trường hợp tốt đẹp là nơi , nơi α = β suốt, và F là đối xứng về 0 . Trong trường hợp đó rõ ràng x 0 = F ( 0 ) = 1 / 2 .γ=1α=βF0x0=F(0)=1/2
Chúng tôi đã đạt được một phương pháp theo đó (a) trong giới hạn, số hạng thứ nhất trong chuỗi Taylor biến mất và (b) trong trường hợp đặc biệt vừa mô tả, số hạng thứ nhất luôn luôn bằng không.
Điều khoản bậc hai
Đây là tổng
g2(α,β)=(α−1)cF2+(β−1)c1−F2+cf2.
So với một phân phối bình thường, mà thuật ngữ bậc hai là , chúng ta có thể ước tính rằng - 1 / ( 2 g 2 ( α , β ) ) là xấp xỉ sai của G . Hãy để chúng tôi chuẩn hóa G bằng cách thay đổi kích thước x theo căn bậc hai của nó. chúng tôi không thực sự cần các chi tiết; đủ để hiểu rằng sự thay đổi kích thước này sẽ nhân hệ số của ( x−(1/2)(x−x0)2/σ2−1/(2g2(α,β))GGx trong bản mở rộng Taylor theo ( - 1 / ( 2 g 2 ( α , β ) ) ) n / 2 .(x−x0)n(−1/(2g2(α,β)))n/2.
Thời hạn còn lại
Đây là điểm cuối: thuật ngữ của đơn hàng trong bản mở rộng Taylor là, theo ký hiệu của chúng tôi,n
gn(α,β)=(α−1)cFn+(β−1)c1−Fn+cfn.
After standardization, it becomes
g′n(α,β)=gn(α,β)(−2g2(α,β))n/2).
Both of the gi are affine combination of α and β. By raising the denominator to the n/2 power, the net behavior is of order −(n−2)/2 in each of α and β. As these parameters grow large, then, each term in the Taylor expansion after the second decreases to zero asymptotically. In particular, the third-order remainder term becomes arbitrarily small.
The case when F is normal
The vanishing of the remainder term is particularly fast when F is standard Normal, because in this case f(x) is purely quadratic: it contributes nothing to the remainder terms. Consequently, the deviation of G from normality depends solely on the deviation between Fα−1(1−F)β−1 and normality.
This deviation is fairly small even for small α and β. To illustrate, consider the case α=β. G is symmetric, whence the order-3 term vanishes altogether. The remainder is of order 4 in x−x0=x.
Here is a plot showing how the standardized fourth order term changes with small values of α>1:
The value starts out at 0 for α=β=1, because then the distribution obviously is Normal (Φ−1 applied to a uniform distribution, which is what Beta(1,1) is, gives a standard Normal distribution). Although it increases rapidly, it tops off at less than 0.008--which is practically indistinguishable from zero. After that the asymptotic reciprocal decay kicks in, making the distribution ever closer to Normal as α increases beyond 2.