Về cách điều chỉnh dữ liệu phù hợp với phân phối chuẩn-lệch Bạn có thể tính toán ước tính khả năng tối đa từ các nguyên tắc đầu tiên. Lưu ý đầu tiên mà hàm mật độ xác suất của phân phối chuẩn nghiêng với tham số vị trí , thông số quy mô ω và tham số hình dạng α làξωα
2ωϕ(x−ξω)Φ(α(x−ξω))
nơi là tiêu chuẩn hàm mật độ bình thường và Φ ( ⋅ ) là CDF bình thường tiêu chuẩn. Lưu ý rằng mật độ này là một thành viên của lớp được mô tả trong câu trả lời của tôi cho câu hỏi này .ϕ(⋅)Φ(⋅)
Khả năng đăng nhập dựa trên mẫu quan sát độc lập từ phân phối này là:n
- n đăng nhập( Ω ) + Σi = 1nđăng nhậpφ ( x - ξω) +nhật kýΦ ( α ( x - ξω) )
Thực tế là không có giải pháp dạng đóng cho MLE này. Nhưng, nó có thể được giải quyết bằng số. Ví dụ: trong R
, bạn có thể mã hóa hàm khả năng như (lưu ý, tôi đã làm cho nó nhỏ gọn / hiệu quả hơn mức có thể để làm cho nó hoàn toàn minh bạch về cách tính toán hàm khả năng ở trên):
set.seed(2345)
# generate standard normal data, which is a special case
n = 100
X = rnorm(n)
# Calculate (negative) log likelihood for minimization
# P[1] is omega, P[2] is xi and P[3] is alpha
L = function(P)
{
# positivity constraint on omega
if( P[1] <= 0 ) return(Inf)
S = 0
for(i in 1:n)
{
S = S - log( dnorm( (X[i] - P[2])/P[1] ) )
S = S - log( pnorm( P[3]*(X[i] - P[2])/P[1] ) )
}
return(S + n*log(P[1]))
}
Bây giờ chúng tôi chỉ tối thiểu hóa số lượng chức năng này (tức là tối đa hóa khả năng). Bạn có thể làm điều này mà không phải tính toán các công cụ phái sinh bằng cách sử dụng Thuật toán Simplex , đây là cách triển khai mặc định trong optim()
gói R
.
α = 0
# log likelihood constraining alpha=0.
L2 = function(Q) L(c(Q[1],Q[2],0))
# log likelihood from the constrained model
-optim(c(1,1),L2)$value
[1] -202.8816
# log likelihood from the full model
-optim(c(1,1,1),L)$value
[1] -202.0064
# likelihood ratio test statistic
LRT = 2*(202.8816-202.0064)
# p-value under the null distribution (chi square 1)
1-pchisq(LRT,1)
[1] 0.1858265
α = 0
Ở đây việc so sánh rất đơn giản, vì phân phối bình thường là một mô hình con. Trong các trường hợp khác, tổng quát hơn, bạn có thể so sánh độ lệch bình thường với các phân phối tham chiếu khác bằng cách so sánh, ví dụ, AIC (như được thực hiện ở đây ) nếu bạn đang sử dụng công cụ ước tính khả năng tối đa trong tất cả các mức độ phù hợp cạnh tranh. Ví dụ: bạn có thể điều chỉnh dữ liệu theo khả năng tối đa theo phân phối gamma và dưới độ lệch bình thường và xem liệu khả năng được thêm có thể chứng minh độ phức tạp thêm của độ lệch (3 tham số thay vì 2). Bạn cũng có thể xem xét sử dụng một thử nghiệm Kolmogorov Smirnov mẫu để so sánh dữ liệu của bạn với ước tính phù hợp nhất từ gia đình bình thường.