Tôi có một chuỗi thời gian dữ liệu với số lượng N = 14 tại mỗi thời điểm và tôi muốn tính hệ số Gini và một lỗi tiêu chuẩn cho ước tính này tại mỗi thời điểm.
Vì tôi chỉ có N = 14 đếm tại mỗi thời điểm nên tôi đã tiến hành bằng cách tính phương sai jackknife, tức là từ phương trình 7 của Tomson Ogwang 'Một phương pháp thuận tiện để tính toán chỉ số Gini và' lỗi tiêu chuẩn 'của nó . Trong đó là hệ số Gini của các giá trị N không có phần tử và là giá trị trung bình của .
Thực hiện ngây thơ trực tiếp của công thức trên cho phương sai.
calc.Gini.variance <- function(x) {
N <- length(x)
# using jacknifing as suggested by Tomson Ogwang - equation 7
# in the Oxford Bulletin of Economics and Statistics, 62, 1 (2000)
# ((n-1)/n) \times \sum_{k=1}^n (G(n,k)-\bar{G}(n))^2
gini.bar <- Gini(x)
gini.tmp <- vector(mode='numeric', length=N)
for (k in 1:N) {
gini.tmp[k] <- Gini(x[-k])
}
gini.bar <- mean(gini.tmp)
sum((gini.tmp-gini.bar)^2)*(N-1)/N
}
calc.Gini.variance(c(1,2,2,3,4,99))
# [1] 0.1696173
Gini(c(1,2,2,3,4,99))
# [1] 0.7462462
Đây có phải là một cách tiếp cận hợp lý cho một N nhỏ? Bất cứ một đề nghị nào khác?