Có một khái niệm đặc biệt để so sánh các bản phân phối, nên được biết đến nhiều hơn: phân phối tương đối.
Giả sử chúng ta có các biến ngẫu nhiên với các hàm phân phối tích lũy và chúng tôi muốn so sánh chúng, sử dụng làm tham chiếu.Y0,YF0,FF0
Xác định
Phân phối biến ngẫu nhiên là phân phối tương đối của , với là tham chiếu. Lưu ý rằng chúng ta có luôn có phân phối đồng đều (với các biến ngẫu nhiên liên tục, nếu các biến ngẫu nhiên là rời rạc thì điều này sẽ gần đúng).
R=F0(Y)
RYY0F0(Y0)
Chúng ta hãy xem xét một ví dụ. Trang web http://www.math.hope.edu/swanson/data/cellphone.txt cung cấp dữ liệu về thời lượng cuộc gọi điện thoại cuối cùng của nam và nữ. Hãy để chúng tôi thể hiện sự phân phối độ dài cuộc gọi điện thoại cho sinh viên nam, với sinh viên nữ là tài liệu tham khảo.
Chúng ta có thể thấy ngay rằng đàn ông (trong lớp đại học này ...) có xu hướng gọi điện thoại ngắn hơn phụ nữ ... và điều này được thể hiện trực tiếp, theo cách rất trực tiếp. Trên trục được hiển thị tỷ lệ trong phân phối của phụ nữ và chúng ta có thể đọc rằng, ví dụ, trong thời gian (dù đó là gì, giá trị của nó không được hiển thị) sao cho 20% các cuộc gọi của phụ nữ ngắn hơn (hoặc bằng) do đó, mật độ tương đối của nam giới trong khoảng đó thay đổi trong khoảng 1,3 đến 1,4. Nếu chúng ta ước tính (về mặt tinh thần từ biểu đồ) mật độ tương đối trung bình trong khoảng đó là 1,35, chúng ta thấy rằng tỷ lệ nam giới trong khoảng đó cao hơn khoảng 35% so với tỷ lệ nữ. Điều đó tương ứng với 27% nam giới trong khoảng thời gian đó.xT
Chúng ta cũng có thể tạo cùng một âm mưu với các khoảng tin cậy theo điểm xung quanh đường cong mật độ tương đối:
Các dải tin cậy rộng trong trường hợp này phản ánh kích thước mẫu nhỏ.
Có một cuốn sách về phương pháp này: Handcock
Mã R cho cốt truyện ở đây:
phone <- read.table(file="phone.txt", header=TRUE)
library(reldist)
men <- phone[, 1]
women <- phone[, 3]
reldist(men, women)
title("length of mens last phonecall with women as reference")
Đối với cốt truyện cuối cùng thay đổi thành:
reldist(men, women, ci=TRUE)
title("length of mens last phonecall with women as reference\nwith pointwise confidence interval (95%)")
Lưu ý rằng các ô được tạo ra bằng cách sử dụng ước tính mật độ hạt nhân, với mức độ mịn được chọn thông qua gcv (xác thực chéo tổng quát).
Một số chi tiết về mật độ tương đối. Đặt là hàm lượng tử tương ứng với . Đặt là một lượng tử của với giá trị tương ứng trên thang đo ban đầu. Sau đó, mật độ tương đối có thể được viết là
hoặc trên thang đo ban đầu là . Điều này cho thấy mật độ tương đối có thể được hiểu là tỷ lệ mật độ. Nhưng, ở dạng đầu tiên, với đối số , nó cũng là một mật độ riêng, tích hợp thành một trong khoảng . Điều đó làm cho nó một điểm khởi đầu tốt cho suy luận.Q0F0rRyr
g(r)=f(Q0(r))f0(Q0(r))
r(0,1)g(r)=f(yr)f0(yr)r(0,1)
hist
; mật độ mịn ,density
; Lô đất QQqqplot
; lô gốc và lá (một chút cổ xưa)stem
. Ngoài ra, xét nghiệm Kolmogorov-Smirnov có thể là một bổ sung tốtks.test
.