Làm cách nào để tính khoảng tin cậy của giá trị trung bình trong mẫu không phân phối thông thường?


19

Làm cách nào để tính khoảng tin cậy của giá trị trung bình trong mẫu không phân phối thông thường?

Tôi hiểu các phương thức bootstrap thường được sử dụng ở đây, nhưng tôi mở cho các tùy chọn khác. Trong khi tôi đang tìm kiếm một lựa chọn không tham số, nếu ai đó có thể thuyết phục tôi rằng một giải pháp tham số là hợp lệ thì sẽ ổn thôi. Cỡ mẫu là> 400.

Nếu bất cứ ai có thể đưa ra một mẫu trong R, nó sẽ được đánh giá cao.


3
Định lý giới hạn trung tâm ngụ ý rằng phân phối giới hạn của giá trị trung bình mẫu là bình thường bất kể phân phối dữ liệu gốc (trong một số điều kiện). Trong nhiều trường hợp, cỡ mẫu đủ lớn để xấp xỉ bình thường khá chính xác nhưng độ chính xác phụ thuộc vào phân phối chính - ví dụ, có thể hữu ích nếu bạn đăng một biểu đồ của dữ liệu gốc. n>400
Macro

Câu trả lời:


18

Trước hết, tôi sẽ kiểm tra xem giá trị trung bình có phải là một chỉ số thích hợp cho nhiệm vụ trong tay không. Nếu bạn đang tìm kiếm "giá trị tiêu biểu / hoặc trung tâm" của phân phối bị lệch, giá trị trung bình có thể chỉ cho bạn một giá trị không đại diện. Hãy xem xét phân phối log-normal:

x <- rlnorm(1000)
plot(density(x), xlim=c(0, 10))
abline(v=mean(x), col="red")
abline(v=mean(x, tr=.20), col="darkgreen")
abline(v=median(x), col="blue")

Giá trị trung bình (màu đỏ), trung bình 20% (màu xanh lá cây) và trung bình (màu xanh) cho phân phối thông thường

Giá trị trung bình (đường màu đỏ) nằm khá xa so với phần lớn dữ liệu. 20% trung bình cắt (màu xanh lá cây) và trung bình (màu xanh) gần với giá trị "điển hình".

Các kết quả phụ thuộc vào loại phân phối "không bình thường" của bạn (biểu đồ dữ liệu thực tế của bạn sẽ hữu ích). Nếu nó không bị lệch, nhưng có đuôi nặng, các TCTD của bạn sẽ rất rộng.

Trong mọi trường hợp, tôi nghĩ rằng bootstrapping thực sự là một cách tiếp cận tốt, vì nó cũng có thể cung cấp cho bạn các TCTD bất đối xứng. Các Rgói simplebootlà một khởi đầu tốt:

library(simpleboot)
# 20% trimmed mean bootstrap
b1 <- one.boot(x, mean, R=2000, tr=.2)
boot.ci(b1, type=c("perc", "bca"))

... cho bạn kết quả như sau:

# The bootstrap trimmed mean:
> b1$t0
[1] 1.144648

BOOTSTRAP CONFIDENCE INTERVAL CALCULATIONS
Based on 2000 bootstrap replicates
Intervals : 
Level     Percentile            BCa          
95%   ( 1.062,  1.228 )   ( 1.065,  1.229 )  
Calculations and Intervals on Original Scale

Cảm ơn rất nhiều cho câu trả lời chi tiết. Bạn có muốn bình luận về sự khác biệt (tối thiểu) giữa phần trăm và phần trăm điều chỉnh (BCa) không?
đánh dấu

"Khoảng thời gian tăng tốc được điều chỉnh theo độ lệch bootstrap (BCa) là một sửa đổi của phương pháp phân vị điều chỉnh các phân vị để sửa cho sai lệch và sai lệch" (Hesterberg, T., Monaghan, S., Moore, D., Clipson, A., & Epstein, R. (2005). Phương pháp Bootstrap và kiểm tra hoán vị. Giới thiệu về Thực hành Thống kê, 14.1 .14,70.). Bất cứ khi nào phần mềm cho phép, hãy sử dụng CI đã được sửa BCa (lưu ý: nó cần> 1000 mẫu)
Felix S

Dường như từ tài liệu cho gói Simpleboot rằng đối số để cắt xén không còn được hỗ trợ. :(
et là

8

Nếu bạn cởi mở với một giải pháp bán tham số, thì đây là: Johnson, N. (1978) Đã sửa đổi t Các thử nghiệm và Khoảng tin cậy cho các quần thể không đối xứng, JASA . Các trung tâm của khoảng tin cậy được chuyển bởi κ / ( 6 s 2 n ) , nơi κκ^/(6S2n)κ^Ôi(n-1/2)Ôi(n-1)n1/2>20n>400

(điểm kinh nghiệm(1)+2)*điểm kinh nghiệm(1)-1kappa = (exp(1)+2)*sqrt( exp(1) - 1) = 6.184877s = sqrt( (exp(1)-1)*exp(1) ) = 2.1611972*s*qnorm(0.975)/sqrt(n) = 0.2678999kappa*s/(6*n) = 0.00222779kappa


2

Hãy thử phân phối log-normal, tính toán:

  1. Logarit của dữ liệu;
  2. Độ lệch trung bình và độ lệch chuẩn của (1)
  3. Khoảng tin cậy tương ứng với (2)
  4. Số mũ của (3)

Bạn sẽ kết thúc với khoảng tin cậy không đối xứng xung quanh giá trị mong đợi (không phải là giá trị trung bình của dữ liệu thô).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.