Tìm khoảng mật độ xác suất


9

Tôi có véc tơ

x <- c(1,2,3,4,5,5,5,6,6,6,6,
       7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
       7,7,7,7,7,7,7,7,8,8,8,8,9,9,9,10)

(vectơ thực tế của tôi có độ dài> 10.000) và tôi muốn tìm các khoảng thời gian có 90% mật độ nằm. Là quantile(x, probs=c(0.05,0.95), type=5)thích hợp nhất hoặc có cách nào khác?


Câu hỏi của bạn hơi mơ hồ về "các khoảng trong đó ..." - có thể có nhiều khoảng. Bạn có quan tâm đến chỉ 90% bên trong, tức là cắt tỉa đối xứng ở mỗi bên? Rốt cuộc, từ mức tối thiểu đến 90%, 90% dữ liệu được ghi lại, tương tự với 10% ile với giá trị tối đa.
Lặp lại

Bạn đang tìm kiếm một khoảng thời gian ngắn nhất, một khoảng đối xứng (xác suất bằng nhau ở mỗi đầu), hoặc một cái gì khác?
Glen_b -Reinstate Monica

Câu trả lời:


19

Như đã chỉ ra ở trên, có nhiều cách khác nhau để xác định một khoảng bao gồm 90% mật độ. Một khoảng chưa được chỉ ra là khoảng mật độ [sau] cao nhất ( wikipedia ), được định nghĩa là "khoảng thời gian ngắn nhất mà sự khác biệt trong các giá trị hàm mật độ tích lũy theo kinh nghiệm của các điểm cuối là xác suất danh nghĩa".

library(coda)
HPDinterval(as.mcmc(x), prob=0.9)

3

Nó chắc chắn có vẻ như là cách tiếp cận đơn giản nhất. Chức năng khá nhanh. Tôi sử dụng nó mọi lúc trên các mẫu lớn hơn hàng trăm lần so với mẫu bạn đang sử dụng và tính ổn định của các ước tính phải tốt ở cỡ mẫu của bạn.

Có các hàm trong các gói khác cung cấp các bộ thống kê mô tả đầy đủ hơn. Gói tôi sử dụng là Hmisc::describe, nhưng có một số gói khác có describechức năng.


3

Cách của bạn có vẻ hợp lý, đặc biệt là với dữ liệu rời rạc trong ví dụ,

quantile(x,probs=c(0.05,0.95), type=5)
 5% 95% 
2.8 9.0

nhưng một cách khác là sử dụng hạt nhân mật độ tính toán:

dx <- density(x)
dn <- cumsum(dx$y)/sum(dx$y)
li <- which(dn>=0.05)[1]
ui <- which(dn>=0.95)[1]
dx$x[c(li,ui)]
[1] 2.787912 9.163246

-1

Đúng. :-). Bạn có thể tìm thấy đầu ra của stats::densitysẽ hữu ích hơn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.