Skewness của logarit của một biến ngẫu nhiên gamma


16

Xem xét biến ngẫu nhiên gamma . Có các công thức gọn gàng cho giá trị trung bình, phương sai và độ lệch:XΓ(α,θ)

E[X]=αθVar[X]=αθ2=1/αE[X]2Skewness[X]=2/α

Bây giờ hãy xem xét một biến ngẫu nhiên được chuyển đổi log . Wikipedia đưa ra các công thức cho giá trị trung bình và phương sai:Y=log(X)

E[Y]=ψ(α)+log(θ)Var[Y]=ψ1(α)

thông qua các hàm digamma và trigamma được định nghĩa là các đạo hàm thứ nhất và thứ hai của logarit của hàm gamma.

Công thức cho sự sai lệch là gì?

Chức năng tetragamma sẽ xuất hiện?

(Điều gì làm tôi băn khoăn về việc này là một sự lựa chọn giữa lognormal và gamma phân phối, xem Gamma phân phối lognormal vs . Trong số những thứ khác, họ khác nhau về tính độ lệch của họ. Đặc biệt, độ lệch của các bản ghi của lognormal là trivially bằng không. Trong khi đó, độ lệch của nhật ký gamma là âm. Nhưng làm thế nào tiêu cực? ..)


1
Điều này có giúp gì không? Hay cái này ?
S. Kolassa - Tái lập Monica

Tôi không chắc chắn phân phối log-gamma là gì. Nếu nó liên quan đến gamma vì lognatural có liên quan đến bình thường, thì tôi đang hỏi về một thứ khác (vì "lognatural", thật khó hiểu, là phân phối exp (bình thường) không phải của log (bình thường)).
amip nói rằng Phục hồi Monica

1
@Glen_b: Thành thật mà nói, tôi muốn nói rằng việc gọi hàm mũ của "bình thường" là không nhất quán và khó hiểu hơn nhiều. Mặc dù, không may, thành lập nhiều hơn.
S. Kolassa - Tái lập Monica

2
@Stephan cũng xem log-logistic, log-Cauchy, log-Laplace, v.v ... Đó là một quy ước được thiết lập rõ ràng hơn so với ngược lại
Glen_b -Reinstate Monica

1
Vâng; Tôi đã cẩn thận không nói "log-gamma" ở bất cứ đâu liên quan đến phân phối này vì lý do này. (Tôi đã sử dụng nó trong quá khứ một cách nhất quán với log-normal)
Glen_b -Reinstate Monica

Câu trả lời:


12

Hàm tạo thời điểm của rất hữu ích trong trường hợp này, vì nó có dạng đại số đơn giản. Theo định nghĩa của mgf, chúng ta cóY = ln X M ( t )M(t)Y=lnX

M(t)=E[etlnX]=E[Xt]=1Γ(α)θα0xα+t1ex/θdx=θtΓ(α)0yα+t1eydy=θtΓ(α+t)Γ(α).

Hãy xác minh kỳ vọng và phương sai bạn đã đưa ra. Lấy dẫn xuất, chúng ta có vàDo đó,Sau đó,M"(t)=Γ"(α+t)

M'(t)= =Γ'(α+t)Γ(α)θt+Γ(α+t)Γ(α)θtln(θ)
E[Y]=ψ(0)(α)+ln(θ),
M(t)=Γ(α+t)Γ(α)θt+2Γ(α+t)Γ(α)θtln(θ)+Γ(α+t)Γ(α)θtln2(θ).
Biến(Y)=E[Y2]-E[Y]2=Γ(α)
E[Y]=ψ(0)(α)+ln(θ),E[Y2]=Γ(α)Γ(α)+2ψ(0)(α)ln(θ)+ln2(θ).
Var(Y)=E[Y2]E[Y]2=Γ(α)Γ(α)(Γ(α)Γ(α))2=ψ(1)(α).

Để tìm độ lệch, lưu ý hàm tạo tích lũy (cảm ơn @probabilityislogic cho mẹo) làDo đó, tích lũy đầu tiên chỉ đơn giản là . Hãy nhớ lại rằng , vì vậy các tích lũy tiếp theo là , . Do đó, độ lệch làK ' ( 0 ) = ψ ( 0 ) ( α ) + ln ( θ ) ψ ( n ) ( x ) = d n + 1 ln Γ

K(t)=lnM(t)=tlnθ+lnΓ(α+t)lnΓ(α).
K(0)=ψ(0)(α)+ln(θ) K ( n ) ( 0 ) = ψ ( n - 1 ) ( α ) n 2 E [ ( Y - E [ Y ] ) 3 ]ψ(n)(x)= =dn+1lnΓ(x)/dxn+1K(n)(0)= =ψ(n-1)(α)n2
E[(Y-E[Y])3]Var(Y)3/2= =ψ(2)(α)[ψ(1)(α)]3/2.

Một ghi chú bên lề, bản phân phối cụ thể này dường như đã được AC Olshen nghiên cứu kỹ lưỡng trong Biến đổi phân phối Pearson Type III , Bản phân phối liên tục của Johnson và cộng sự cũng có một phần nhỏ về nó. Kiểm tra xem.


3
Bạn nên phân biệt thay vì vì đây là hàm tạo tích lũy - liên quan trực tiếp hơn đến các khoảnh khắc trung tâm - trong đó là hàm đa thêM ( t ) s k e w = K ( 3 ) ( 0 ) = ψ ( 2 ) ( α )K(t)=log[M(t)]=tlog[θ]+log[Γ(α+t)]log[Γ(α)]M(t)skew=K(3)(0)=ψ(2)(α)ψ(n)(z)
xác suất

1
@probabilityislogic: cuộc gọi rất tốt, đã thay đổi câu trả lời của tôi
Francis

@probabilityislogic Đây là một bổ sung tuyệt vời, cảm ơn rất nhiều. Tôi chỉ muốn lưu ý, kẻo một số độc giả sẽ bối rối, rằng sự sai lệch không được đưa ra trực tiếp bởi người tích lũy thứ ba: đó là khoảnh khắc tiêu chuẩn thứ ba, không phải là khoảnh khắc trung tâm thứ ba. Francis đã trả lời đúng trong câu trả lời của mình, nhưng công thức cuối cùng trong bình luận của bạn không hoàn toàn đúng.
amip nói rằng Phục hồi Monica

13

I. Tính toán trực tiếp

Gradshteyn & Ryzhik [1] (giáo phái 4.358, lần thứ 7) liệt kê các biểu mẫu đóng rõ ràng cho cho trong khi trường hợp được thực hiện trong 4.352 (giả sử bạn coi các biểu thức trong các hàm và là dạng đóng) - từ đó chắc chắn có thể thực hiện được đến mức kurtosis; chúng cung cấp tích phân cho tất cả như là một dẫn xuất của hàm gamma nên có lẽ khả thi để tăng cao hơn. Vì vậy, độ lệch chắc chắn là có thể làm được nhưng không đặc biệt "gọn gàng".

0xν1eμx(lnx)pdx
p=2,3,4p=1Γ,ψζp

Chi tiết về đạo hàm của các công thức trong 4.358 nằm trong [2]. Tôi sẽ trích dẫn các công thức được đưa ra ở đó vì chúng được nêu rõ hơn một chút và đặt 4.352.1 trong cùng một hình thức.

Đặt . Sau đó:δ=ψ(a)lnμ

0xa1eμxlnxdx=Γ(a)μa{δ}0xa1eμxln2xdx=Γ(a)μa{δ2+ζ(2,a)}0xa1eμxln3xdx=Γ(a)μa{δ3+3ζ(2,a)δ2ζ(3,a)}0xa1eμxln4xdx=Γ(a)μa{δ4+6ζ(2,a)δ28ζ(3,a)δ+3ζ2(2,a)+6ζ(4,a))}

trong đó là hàm zeta Hurwitz (hàm zeta Riemann là trường hợp đặc biệt ).ζ(z,q)=n=01(n+q)zq=1

Bây giờ đến khoảnh khắc nhật ký của một biến ngẫu nhiên gamma.

Trước tiên, trên thang đo log, tham số tỷ lệ hoặc tỷ lệ của mật độ gamma chỉ là một tham số shift, vì vậy nó không có tác động đến các thời điểm trung tâm; chúng tôi có thể lấy bất cứ ai chúng tôi sử dụng là 1.

Nếu thìXGamma(α,1)

E(logpX)=1Γ(α)0logpxxα1exdx.

Chúng ta có thể đặt trong các công thức tích phân ở trên, mang lại cho chúng ta những khoảnh khắc thô; chúng ta có , , , .μ=1E(Y)E(Y2)E(Y3)E(Y4)

Vì chúng tôi đã loại bỏ khỏi những điều trên, nên không sợ nhầm lẫn, giờ đây chúng tôi có thể sử dụng lại để thể hiện khoảnh khắc trung tâm thứ theo cách thông thường. Sau đó chúng ta có thể có được những khoảnh khắc trung tâm từ những khoảnh khắc thô thông qua các công thức thông thường .μμkk

Sau đó, chúng ta có thể có được độ lệch và kurtosis là và .μ3μ23/2μ4μ22


Một lưu ý về thuật ngữ

Có vẻ như các trang tham chiếu của Wolfram viết những khoảnh khắc của phân phối này (họ gọi đó là phân phối ExpGamma ) theo chức năng đa thê .

Ngược lại, Chan (xem bên dưới) gọi đây là bản phân phối log-gamma.


II. Công thức của Chan qua MGF

Chan (1993) [3] đưa ra mgf là rất gọn gàng .Γ(α+t)/Γ(α)

(Một dẫn xuất rất hay cho điều này được đưa ra trong câu trả lời của Francis, sử dụng thực tế đơn giản là mgf của chỉ là .)đăng nhập(X)E(Xt)

Do đó, những khoảnh khắc có hình thức khá đơn giản. Chân cho:

E(Y)= =ψ(α)

và những khoảnh khắc trung tâm như

E(Y-μY)2= =ψ'(α)E(Y-μY)3= =ψ"(α)E(Y-μY)4= =ψ(α)

và do đó, độ lệch là và kurtosis là . Có lẽ các công thức trước đây tôi có ở trên nên đơn giản hóa những công thức này.ψ"(α)/(ψ'(α)3/2)ψ(α)/(ψ'(α)2)

Thuận tiện, R cung cấp các hàm digamma ( ) và trigamma ( ) cũng như hàm polygamma tổng quát hơn trong đó bạn chọn thứ tự của đạo hàm. (Một số chương trình khác cung cấp các chức năng thuận tiện tương tự.)ψψ'

Do đó, chúng ta có thể tính toán độ lệch và độ nhiễu khá trực tiếp trong R:

skew.eg <- function(a) psigamma(a,2)/psigamma(a,1)^(3/2)
kurt.eg <- function(a) psigamma(a,3)/psigamma(a,1)^2

Thử một vài giá trị của a( ở trên), chúng tôi tái tạo một vài hàng đầu tiên của bảng ở cuối Sec 2.2 trong Chan [3], ngoại trừ các giá trị kurtosis trong bảng đó được cho là dư thừa, nhưng Tôi chỉ tính kurtosis bằng các công thức được đưa ra ở trên bởi Chan; những cái này nên khác nhau 3.α

(Ví dụ: nhật ký của số mũ, bảng cho biết mức độ tổn thương dư thừa là 2,4, nhưng công thức cho là ... và đó 2.4. )β2ψ(1)/ψ'(1)2

Mô phỏng xác nhận rằng khi chúng tôi tăng kích thước mẫu, mức độ suy giảm của nhật ký theo cấp số nhân được hội tụ vào khoảng 5,4 chứ không phải 2,4. Có vẻ như luận án có thể có lỗi.

Do đó, các công thức của Chan cho các khoảnh khắc trung tâm dường như thực sự là các công thức cho các tích lũy (xem phần dẫn xuất trong câu trả lời của Francis). Điều này có nghĩa là công thức xiên là chính xác; bởi vì các tích lũy thứ hai và thứ ba bằng với khoảnh khắc trung tâm thứ hai và thứ ba.

Tuy nhiên, đây là những công thức đặc biệt thuận tiện miễn là chúng ta ghi nhớ rằng kurt.egsẽ gây ra sự tổn thương quá mức.

Người giới thiệu

[1] Gradshteyn, IS & Ryzhik IM (2007), Bảng tích phân, sê-ri và sản phẩm, tái bản lần thứ 7.
Học thuật báo chí, Inc.

[2] Victor H. Moll (2007)
Các tích phân trong Gradshteyn và Ryzhik, Phần 4: Hàm gamma
SCIENTIA Series A: Toán học Khoa học, Tập. 15, 37 Từ46
Đại học Técnica Federico Santa María, Valparaíso, Chile
http://129.81.170.14/~vhm/FORM-PROOFS_html/final4.pdf

[3] Chan, PS (1993),
Một nghiên cứu thống kê về phân phối log-gamma,
Đại học McMaster (luận án tiến sĩ)
https://macsphere.mcmaster.ca/bitstream/11375/6816/1/fulltext.pdf


1
Mát mẻ. Cảm ơn rất nhiều! Theo mục từ bách khoa toàn thư mà Stephan liên kết ở trên, câu trả lời cuối cùng cho sự sai lệch là (gần như đủ điều kiện là "gọn gàng"!). Vì vậy, có vẻ như tất cả các zetas đáng sợ sẽ phải hủy bỏ. ψ"(α)/ψ'(α)3/2
amip nói rằng Phục hồi Monica

1
Xin lỗi chỉ mới thấy bình luận của bạn (Tôi đã chỉnh sửa khoảng một giờ hoặc lâu hơn); điều đó đúng, mặc dù nếu bách khoa toàn thư đưa ra sự bực bội theo cách mà Chan đưa ra trong luận án của mình, có vẻ như nó sai (như đã nêu ở trên), nhưng đã được sửa chữa. Các công thức gọn gàng dường như là dành cho tích lũy hơn là những khoảnh khắc trung tâm được tiêu chuẩn hóa.
Glen_b -Reinstate Monica

Vâng, bách khoa toàn thư không đưa ra công thức tương tự cho bệnh kurtosis.
amip nói phục hồi Monica

Hmm, ý tôi là nói đến những thứ thường được ký hiệu là và . Tôi sẽ sửa. γ1γ2
Glen_b -Reinstate Monica

2
Tôi có lẽ nên thêm lưu ý rằng hàm zeta Hurwitz có thể được biểu thị dưới dạng hàm đa thê và ngược lại : Vì vậy, câu trả lời cho câu hỏi của @ amoeba là "chức năng tetragamma có xuất hiện không?" là có.
ψ(n)(z)= =(-1)n+1Γ(n+1)ζ(n+1,z)
JM không phải là một thống kê
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.