Sẽ có một số lượng vô hạn các bản phân phối trông rất giống với bản vẽ của bạn, với nhiều giá trị khác nhau cho sự suy yếu.
Với các điều kiện cụ thể trong câu hỏi của bạn và được cung cấp, chúng tôi giữ điểm giao nhau ở bên trong, hoặc ít nhất là không quá xa bên ngoài ±1 , đó là trường hợp bạn bị tổn thương lớn hơn một chút so với bình thường. Tôi sẽ chỉ ra ba trường hợp điều đó xảy ra, và sau đó tôi sẽ chỉ ra một trường hợp nhỏ hơn - và giải thích nguyên nhân khiến nó xảy ra.
Cho rằng và Φ ( x ) là pdf và cdf tiêu chuẩn tương ứng, hãy viết cho chúng ta một hàm nhỏϕ(x)Φ(x)
f(x)={ϕ(x)a+b.g(x);|x|>t;|x|≤t
đối với một số mật độ đối xứng liên tục, (với cdf G tương ứng ), với giá trị trung bình 0 , sao cho và .gG0 a=ϕ(t)-b. g(t)b=Φ(t)–½–t.ϕ(t)G(t)–½–t.g(t)a=ϕ(t)−b.g(t)
Nghĩa là, và được chọn để làm cho mật độ liên tục và tích hợp thành .b 1ab1
Ví dụ 1 Xétvà,t = 1g(x)=3ϕ(3x)t=1
trông giống như bản vẽ của bạn, ở đây được tạo bởi mã R sau:
f <- function(x, t=1,
dg=function(x) 2*dnorm(2*x),
pg=function(x) pnorm(2*x),
b=(pnorm(t) - 0.5 - t*dnorm(t))/ (pg(t) - 0.5 - t*dg(t)),
a=dnorm(t)-b*dg(t) ) {
ifelse(abs(x)>t,dnorm(x),a+b*dg(x))
}
f1 <- function(x) f(x,t=1,dg=function(x) 3*dnorm(3*x),pg=function(x) pnorm(3*x))
curve(f1,-4,4,col=2)
lines(x,dnorm(x),col=3)
Bây giờ tính toán. Hãy tạo một hàm để đánh giá :xpf1(x)
fp <- function(x,p=2) x^p*f1(x)
để chúng ta có thể đánh giá những khoảnh khắc Đầu tiên là phương sai:
integrate(fp,-Inf,Inf) # should be just smaller than 1
0.9828341 with absolute error < 1.4e-07
Tiếp theo khoảnh khắc trung tâm thứ tư:
integrate(fp,-Inf,Inf,p=4) # should be just smaller than 3
2.990153 with absolute error < 8.3e-06
Chúng ta cần tỷ lệ của những con số đó, cần có độ chính xác khoảng 5 con số
integrate(fp,-Inf,Inf,p=4)$value/(integrate(fp,-Inf,Inf)$value^2)
[1] 3.095515
Vì vậy, kurtosis là khoảng 3.0955, lớn hơn một chút so với trường hợp bình thường.
Tất nhiên chúng ta có thể tính toán nó theo đại số và có được câu trả lời chính xác, nhưng không cần, điều này cho chúng ta biết những gì chúng ta muốn biết.
Ví dụ 2 Với hàmđược xác định ở trên, chúng ta có thể thử nó cho tất cả các cách của.gfg
Đây là Laplace:
library(distr)
D <- DExp(rate = 1)
f2 <- function(x) f(x,t=1,dg=d(D),pg=p(D))
curve(f2,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp2 <- function(x,p=2) x^p*f2(x)
integrate(fp2,-Inf,Inf) # should be just smaller than 1
0.9911295 with absolute error < 1.1e-07
integrate(fp2,-Inf,Inf,p=4) # should be just smaller than 3
2.995212 with absolute error < 5.9e-06
integrate(fp2,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.049065
Không có gì đáng ngạc nhiên, một kết quả tương tự.
Ví dụ 3 : Giả sửlà phân phối Cauchy (phân phối Student-t với 1 df), nhưng với tỷ lệ 2/3 (nghĩa là, nếulà một Cauchy tiêu chuẩn,và một lần nữa đặt ngưỡng, t (cho các điểm,, bên ngoài mà chúng tôi 'chuyển' thành bình thường), thành 1.gh(x)g(x)=1.5h(1.5x)±t
dg <- function(x) 1.5*dt(1.5*x,df=1)
pg <- function(x) pt(1.5*x,df=1)
f3 <- function(x) f(x,t=1,dg=dg,pg=pg)
curve(f3,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp3 <- function(x,p=2) x^p*f3(x)
integrate(fp3,-Inf,Inf) # should be just smaller than 1
0.9915525 with absolute error < 1.1e-07
integrate(fp3,-Inf,Inf,p=4) # should be just smaller than 3
2.995066 with absolute error < 6.2e-06
integrate(fp3,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 3.048917
Và chỉ để chứng minh rằng chúng ta đã thực sự có một mật độ thích hợp:
integrate(f3,-Inf,Inf)
1 with absolute error < 9.4e-05
Ví dụ 4 : Tuy nhiên , điều gì xảy ra khi chúng ta thay đổi t ?
Lấy và làm ví dụ trước, nhưng thay đổi ngưỡng thành :gGt=2
f4 <- function(x) f(x,t=2,dg=dg,pg=pg)
curve(f4,-4,4,col=2)
lines(x,dnorm(x),col=3)
fp4 <- function(x,p=2) x^p*f4(x)
integrate(fp4,-Inf,Inf,p=4)$value/(integrate(fp2,-Inf,Inf)$value^2)
[1] 2.755231
Làm thế nào điều này xảy ra?
Chà, điều quan trọng cần biết là kurtosis là (nói hơi lỏng lẻo) 1+ phương sai bình phương về :μ±σ
Tất cả ba phân phối có cùng một ý nghĩa và phương sai.
Đường cong màu đen là mật độ chuẩn thông thường. Đường cong màu xanh lá cây cho thấy phân phối khá tập trung về (nghĩa là phương sai về là nhỏ, dẫn đến một sự suy yếu tiến đến 1, nhỏ nhất có thể). Đường cong màu đỏ hiển thị trường hợp phân phối bị "đẩy đi" khỏi ; đó là kurtosis lớn.μ±σμ±σμ±σ
Với ý nghĩ đó, nếu chúng ta đặt các điểm ngưỡng đủ xa bên ngoài chúng ta có thể đẩy mức độ tổn thương xuống dưới 3, và vẫn có đỉnh cao hơn.μ±σ