Tôi đang cố gắng sử dụng hàm ' mật độ ' trong R để thực hiện ước tính mật độ hạt nhân. Tôi gặp một số khó khăn giải thích kết quả và so sánh bộ dữ liệu khác nhau như có vẻ như diện tích dưới đường cong không nhất thiết phải là 1. Đối với bất kỳ hàm mật độ xác suất (pdf) , chúng ta cần phải có khu vực ∫ ∞ - ∞ φ ( x ) d x = 1 . Tôi giả sử rằng ước tính mật độ hạt nhân báo cáo pdf. Tôi đang sử dụng integrate.xy từ sfsmisc để ước tính diện tích dưới đường cong.
> # generate some data
> xx<-rnorm(10000)
> # get density
> xy <- density(xx)
> # plot it
> plot(xy)
> # load the library
> library(sfsmisc)
> integrate.xy(xy$x,xy$y)
[1] 1.000978
> # fair enough, area close to 1
> # use another bw
> xy <- density(xx,bw=.001)
> plot(xy)
> integrate.xy(xy$x,xy$y)
[1] 6.518703
> xy <- density(xx,bw=1)
> integrate.xy(xy$x,xy$y)
[1] 1.000977
> plot(xy)
> xy <- density(xx,bw=1e-6)
> integrate.xy(xy$x,xy$y)
[1] 6507.451
> plot(xy)
Không phải diện tích dưới đường cong luôn là 1 sao? Có vẻ như băng thông nhỏ là một vấn đề, nhưng đôi khi bạn muốn hiển thị các chi tiết, vv trong đuôi và băng thông nhỏ là cần thiết.
Cập nhật / Trả lời:
> xy <- density(xx,n=2^15,bw=.001)
> plot(xy)
> integrate.xy(xy$x,xy$y)
[1] 1.000015
> xy <- density(xx,n=2^20,bw=1e-6)
> integrate.xy(xy$x,xy$y)
[1] 2.812398