Phân phối nào mà CDF bình thường nghịch đảo của biến ngẫu nhiên beta tuân theo?


14

Giả sử bạn xác định:

XBeta(α,β)

YΦ1(X)

trong đó là nghịch đảo của CDF của phân phối chuẩn thông thường .Φ1

Câu hỏi của tôi là: Có một phân phối đơn giản mà tuân theo, hoặc có thể xấp xỉ không? YYYTôi đang hỏi bởi vì tôi có một sự nghi ngờ mạnh mẽ dựa trên kết quả mô phỏng (hiển thị bên dưới) rằng hội tụ đến một phân phối bình thường khi và cao, nhưng tôi không biết tại sao nó lại có tính toán học. (Tất nhiên khi , sẽ đồng nhất và sẽ là tiêu chuẩn bình thường, nhưng tại sao điều đó lại đúng với các giá trị cao hơn?).αYαβα=1;β=1XY

Nếu điều này hội tụ về mức bình thường, thì các tham số của mức bình thường đó sẽ là gì, về mặt và ? (Tôi hy vọng giá trị trung bình sẽ là \ Phi ^ {- 1} (\ frac {\ alpha} {\ alpha + \ beta}) vì đó là sự biến đổi của chế độ, nhưng tôi không biết độ lệch chuẩn).αβΦ1(αα+β)

(Nói cách khác, điều này có thể hỏi "không Φ(Norm(μ,σ)) hội tụ đến một bản phân phối beta, đối với một số hướng của μσ "? dễ trả lời hơn).

Kết quả mô phỏng

Ở đây tôi chỉ ra lý do tại sao tôi có sự nghi ngờ rằng kết quả là bình thường (vì tôi không thể sao lưu nó bằng toán học). Mô phỏng Y có thể được thực hiện trong R với qnormrnorm. Ví dụ: chọn tham số cao α=3000β=7000 :

hist(qnorm(rbeta(5000, 3000, 7000)))

Điều này không giống bình thường, và qqnormthử nghiệm Shapiro-Wilk (trong đó bình thường là giả thuyết null) gợi ý như vậy là tốt:

qqnorm(qnorm(rbeta(5000, 3000, 7000)))

shapiro.test(qnorm(rbeta(5000, 3000, 7000)))
#> 
#>  Shapiro-Wilk normality test
#> 
#> data:  qnorm(rbeta(5000, 3000, 7000))
#> W = 0.99954, p-value = 0.2838

Để khám phá tính quy phạm sâu hơn một chút, tôi thực hiện 2.000 mô phỏng, mỗi lần mô phỏng 5.000 giá trị từ Y , sau đó thực hiện thử nghiệm để so sánh nó với bình thường. (Tôi đã chọn các giá trị 5K vì đó là mức tối đa shapiro.testcó thể xử lý và tối đa hóa khả năng phát hiện các sai lệch so với định mức).

Nếu phân phối thực sự bình thường, chúng tôi sẽ mong giá trị p sẽ đồng nhất (vì null là đúng). Chúng thực sự gần với đồng phục, cho thấy rằng phân phối rất gần với bình thường:

hist(replicate(2000, shapiro.test(qnorm(rbeta(5000, 3000, 7000)))$p.value))

Một số thử nghiệm cho thấy và cao hơn , phân phối gần trở lại bình thường (ví dụ khá xa so với bình thường, nhưng hãy thử và nó dường như ở đâu đó ở giữa).betaαβrbeta(5000, 3, 7)hist(replicate(2000, shapiro.test(qnorm(rbeta(5000, 30, 70)))$p.value))


2
Không có gì thú vị xảy ra ở đây. Khi và phát triển lớn, hãy giả sử rằng chúng vẫn giữ nguyên tỷ lệ hoặc ít nhất là vẫn cách xa và . Sau đó phân phối Beta trở thành Bình thường và tập trung trong phạm vi hẹp tùy ý. , có thể khác biệt, về cơ bản trở thành tuyến tính, khi bạn chỉ nhìn vào một phép biến đổi tuyến tính của một biến gần như bình thường. Kết quả này không có gì khác hơn là liên quan đến chính và không thêm thông tin nào về các bản phân phối Beta. β α / ( α + β ) 0 1 ( α , β ) Φ - 1 Φ - 1αβα/(α+β)01(α,β)Φ1Φ1
whuber

1
@whuber Điều đó có ý nghĩa đối với và (Tôi đã có một số mô phỏng khiến tôi nghĩ rằng nó gần với bình thường hơn so với bình thường tương đương với beta, nhưng khi chạy lại tôi nghĩ rằng tôi đã nhầm lẫn vào thời điểm đó). Mọi suy nghĩ về ; ? Dist rất xa so với bình thường, nhưng qnorm của nó khá gần. β alpha = 2 β = 2αβα=2β=2
David Robinson

1
@whuber Ví dụ thử hist(replicate(1000, shapiro.test(rbeta(5000, 2, 2))$p.value)), sau đó hist(replicate(1000, shapiro.test(qnorm(rbeta(5000, 2, 2)))$p.value)). Nói cách khác, khi thì bình thường vì beta là đồng nhất, khi và cao thì vì beta gần như bình thường - nhưng tại sao nó lại hoạt động khi chúng bằng nhau và ở giữa , nơi nó không bình thường cũng không đồng đều? α βα=β=1αβ
David Robinson

5
Điều đó chắc chắn thú vị hơn! Bạn đúng là Beta không gần với Bình thường nhưng sự biến đổi là xấp xỉ Bình thường, ngay cả đối với các tham số nhỏ của Beta. Các sai lệch so với Normality trở nên rõ ràng ở các đuôi, khoảng hoặc cao hơn, nhưng nhỏ đáng kể trong toàn bộ phân phối. Cuối cùng, điều này có thể truy nguyên theo hành vi quyền lực của đuôi Beta. Z=±3
whuber

Câu trả lời:


7

Tóm tắc

Bạn đã khám phá lại một phần của công trình được mô tả tại Định lý giới hạn trung tâm cho các mẫu trung bình mẫu , minh họa một phân tích về trung vị của mẫu. (Phân tích rõ ràng được áp dụng, với những sửa đổi thích hợp , cho bất kỳ định lượng nào, không chỉ trung vị). Do đó, không có gì ngạc nhiên khi đối với các tham số Beta lớn (tương ứng với các mẫu lớn), phân phối chuẩn phát sinh theo phép biến đổi được mô tả trong câu hỏi. Điều đáng quan tâm là mức độ gần với phân phối Bình thường ngay cả đối với các tham số Beta nhỏ . Điều đó xứng đáng được giải thích.

Tôi sẽ phác thảo một phân tích dưới đây. Để giữ bài đăng này ở một độ dài hợp lý, nó bao gồm rất nhiều cách vẫy tay gợi ý: Tôi chỉ nhằm mục đích chỉ ra những ý tưởng chính. Do đó, hãy để tôi tóm tắt kết quả ở đây:

  1. Khi gần với , mọi thứ đều đối xứng. Điều này gây ra phân phối đã chuyển đổi để trông bình thường.betaαβ

  2. Các chức năng của biểu mẫu trông khá bình thường ở vị trí đầu tiên, ngay cả đối với các giá trị nhỏ của và (miễn là cả hai vượt quá và tỷ lệ của chúng không quá gần hoặc ). α β 1 0 1Φα-1(x)(1-Φ(x))β-1αβ101

  3. Định mức rõ ràng của phân phối biến đổi là do thực tế là mật độ của nó bao gồm mật độ Bình thường nhân với một hàm trong (2).

  4. Khi và tăng, độ rời khỏi Normality có thể được đo bằng các số hạng còn lại trong chuỗi Taylor cho mật độ nhật ký. Thời hạn của đơn hàng giảm tỷ lệ thuận với quyền hạn của vàbeta n ( n - 2 ) / 2 alpha beta . Điều này ngụ ý rằng cuối cùng, cho đủ lớn α β , tất cả về quyền lực n = 3 hoặc cao hơn đã trở nên tương đối nhỏ, chỉ để lại một bậc hai: đó chính là mật độ nhật ký của một phân phối bình thường.αβn(n2)/2αβαβn=3

Nói chung, những hành vi độc đáo giải thích tại sao ngay cả đối với nhỏ beta các quantiles không cực đoan của một cái nhìn mẫu Bình thường iid xấp xỉ bình thường.αβ


Phân tích

Bởi vì nó có thể hữu ích để khái quát, chúng ta hãy được bất kỳ chức năng phân phối, mặc dù chúng tôi có trong tâm trí F = Φ .FF=Φ

Hàm mật độ của một Beta ( α , β ) biến là, theo định nghĩa, tỷ lệ vớig(y)(α,β)

yα1(1y)β1dy.

Đặt là biến đổi tích phân xác suất của x và viết f cho đạo hàm của F , ngay lập tức x có mật độ tỷ lệ vớiy=F(x)xfFx

G(x;α,β)=F(x)α1(1F(x))β1f(x)dx.

Bởi vì đây là một phép biến đổi đơn điệu của phân phối không theo phương thức mạnh (Beta), trừ khi khá lạ, phân phối được chuyển đổi cũng sẽ không đơn phương. Để nghiên cứu mức độ gần với Bình thường, hãy kiểm tra logarit mật độ của nó,F

(1)logG(x;α,β)=(α1)logF(x)+(β1)log(1F(x))+logf(x)+C

Trong đó là hằng số chuẩn hóa không liên quan.C

Mở rộng các thành phần của trong chuỗi Taylor để đặt hàng ba xung quanh một giá trị x 0 (mà sẽ được gần gũi với một chế độ). Chẳng hạn, chúng ta có thể viết phần mở rộng của log FlogG(x;α,β)x0logF

logF(x)=c0F+c1F(xx0)+c2F(xx0)2+c3Fh3

cho một số với | h | | x - x 0 | . Sử dụng một ký hiệu tương tự cho nhật ký ( 1 - F )nhật ký f . h|h||xx0|log(1F)logf

Thuật ngữ tuyến tính

Thuật ngữ tuyến tính trong do đó trở thành(1)

g1(α,β)=(α1)c1F+(β1)c11F+c1f.

Khi là chế độ của G (x0 , biểu hiện này là bằng không. Lưu ý rằng bởi vì các hệ số là các hàm liên tục của x 0 , như α β rất đa dạng, chế độ x 0 sẽ thay đổi liên tục quá. Hơn nữa, một khi α β là đủ lớn, các c f 1 hạn trở nên tương đối không quan trọng. Nếu chúng tôi hướng đến nghiên cứu giới hạn như α β α : β ở lại theo tỷ lệ không đổi γG(;α,β)x0αβx0αβc1fαβ α:βγ, Chúng tôi có thể do đó một lần và cho tất cả chọn một điểm cơ sở x0

γc1F+c11F=0.

Một trường hợp tốt đẹp là nơi , nơi α = β suốt, và F là đối xứng về 0 . Trong trường hợp đó rõ ràng x 0 = F ( 0 ) = 1 / 2 .γ=1α=βF0x0=F(0)=1/2

Chúng tôi đã đạt được một phương pháp theo đó (a) trong giới hạn, số hạng thứ nhất trong chuỗi Taylor biến mất và (b) trong trường hợp đặc biệt vừa mô tả, số hạng thứ nhất luôn luôn bằng không.

Điều khoản bậc hai

Đây là tổng

g2(α,β)=(α1)c2F+(β1)c21F+c2f.

So với một phân phối bình thường, mà thuật ngữ bậc hai là , chúng ta có thể ước tính rằng - 1 / ( 2 g 2 ( α , β ) ) là xấp xỉ sai của G . Hãy để chúng tôi chuẩn hóa G bằng cách thay đổi kích thước x theo căn bậc hai của nó. chúng tôi không thực sự cần các chi tiết; đủ để hiểu rằng sự thay đổi kích thước này sẽ nhân hệ số của ( x(1/2)(xx0)2/σ21/(2g2(α,β))GGx trong bản mở rộng Taylor theo ( - 1 / ( 2 g 2 ( α , β ) ) ) n / 2 .(xx0)n(1/(2g2(α,β)))n/2.

Thời hạn còn lại

Đây là điểm cuối: thuật ngữ của đơn hàng trong bản mở rộng Taylor là, theo ký hiệu của chúng tôi,n

gn(α,β)=(α1)cnF+(β1)cn1F+cnf.

After standardization, it becomes

gn(α,β)=gn(α,β)(2g2(α,β))n/2).

Both of the gi are affine combination of α and β. By raising the denominator to the n/2 power, the net behavior is of order (n2)/2 in each of α and β. As these parameters grow large, then, each term in the Taylor expansion after the second decreases to zero asymptotically. In particular, the third-order remainder term becomes arbitrarily small.

The case when F is normal

The vanishing of the remainder term is particularly fast when F is standard Normal, because in this case f(x) is purely quadratic: it contributes nothing to the remainder terms. Consequently, the deviation of G from normality depends solely on the deviation between Fα1(1F)β1 and normality.

This deviation is fairly small even for small α and β. To illustrate, consider the case α=β. G is symmetric, whence the order-3 term vanishes altogether. The remainder is of order 4 in xx0=x.

Here is a plot showing how the standardized fourth order term changes with small values of α>1:

Nhân vật

The value starts out at 0 for α=β=1, because then the distribution obviously is Normal (Φ1 applied to a uniform distribution, which is what Beta(1,1) is, gives a standard Normal distribution). Although it increases rapidly, it tops off at less than 0.008--which is practically indistinguishable from zero. After that the asymptotic reciprocal decay kicks in, making the distribution ever closer to Normal as α increases beyond 2.


2

Convergence

Suppose that α=β and let α and take any small ε>0. Then var(X)0. By Chebyshev's inequality we have P[|X0.5|>ε]0 and P[|Y|>ε]0. This means that Y converges in probability (not in distribution actually it converges in distribution - to singleton).

Exact distribution

Denote by fX the density of beta distribution. Then your variable Y has density

fY(y)=fX(Φ(y))ϕ(y).
Since Φ does not have a closed form I believe that this is the furthest you can get (analytically). You can try to put it into FullSimplify function in Wolfram Mathematica to see if it finds some better form.

Here is the density in R so you can plot it instead of histogram.

f_y <- function(x, alpha, beta) {
  dbeta(pnorm(x), alpha, beta) * dnorm(x)
}

Modification

However, you are maybe interested in distribution of

Z=Φ1(αX)
. (still assuming α=β) This may be useful because var(αX)1/8 (useful because it is not zero).

1

Here I present a heuristic explanation (which can be made rigorous at least asymptotically). For simplicity, take kN, k2. Let XBeta(k,k). I want to argue that Y=Φ1(X) is approximately normal.

Now let n=2k1. We start by drawing n i.i.d. uniformly distributed random variables U1,,Un. Next, form the order statistics U(1)U(n).

It is well known that U(k)Beta(k,n+1k), thus:

U(k)Beta(k,k)

In other words: The sample median of n i.i.d. uniformly distributed random variables is Beta(k,k) distributed.

Now let's transform by Zi=Φ1(Ui). Then by the probability integral transform, the Zi are i.i.d. normally distributed. Also form the order statistics of the Zi (Z(1)Z(n)). Since Φ1 is strictly increasing, it follows that:

Φ1(U(k))=Z(k)

Therefore, to show that Y is approximately normal, we just have to argue that the sample median of n i.i.d. normal random variables is approximately normal.

For k large, this can be made precise by a central limit theorem for sample medians. For k small, say k=2, I will let everyone's gut feeling do the speaking.

For ab (but not too different) one can argue similarly by using corresponding quantiles.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.