Định nghĩa tiêu chuẩn của một ngoại lệ cho âm mưu Box and Whisker là các điểm nằm ngoài phạm vi , trong đó và là tứ phân vị đầu tiên và là phần tư thứ ba của dữ liệu. I Q R = Q 3 - Q 1 Q 1 Q 3
Cơ sở cho định nghĩa này là gì? Với số lượng điểm lớn, ngay cả một phân phối hoàn toàn bình thường cũng trả về các ngoại lệ.
Ví dụ: giả sử bạn bắt đầu với chuỗi:
xseq<-seq(1-.5^1/4000,.5^1/4000, by = -.00025)
Trình tự này tạo ra một thứ hạng phần trăm của 4000 điểm dữ liệu.
Kiểm tra tính quy phạm cho qnorm
loạt bài này cho kết quả:
shapiro.test(qnorm(xseq))
Shapiro-Wilk normality test
data: qnorm(xseq)
W = 0.99999, p-value = 1
ad.test(qnorm(xseq))
Anderson-Darling normality test
data: qnorm(xseq)
A = 0.00044273, p-value = 1
Kết quả chính xác như mong đợi: tính quy tắc của phân phối bình thường là bình thường. Tạo một qqnorm(qnorm(xseq))
tạo (như mong đợi) một dòng dữ liệu:
Nếu một boxplot của cùng một dữ liệu được tạo, boxplot(qnorm(xseq))
tạo ra kết quả:
Boxplot, không giống như shapiro.test
, ad.test
hoặc qqnorm
xác định một số điểm là ngoại lệ khi kích thước mẫu đủ lớn (như trong ví dụ này).