Hiệu chỉnh liên tục của Yates trong khoảng tin cậy được prop.test trả về


8

Đây là khoảng tin cậy được ước tính bởi prop.test

n <- 600; x <- 276; p <- 0.40
prop.test(x, n, p, alternative="two.sided", conf.level=0.95, correct=T)
95 percent confidence interval:
 0.4196787 0.5008409 

Tôi đã cố gắng tái tạo nó, đọc mã theo prop.test. Đây là một cách đơn giản để có được hai giới hạn đó

ESTIMATE <- x/n
YATES <- 0.5
conf.level <- 0.95
z <- qnorm((1 + conf.level)/2)
YATES <- min(YATES, abs(x - n * p)) 
z22n <- z^2/(2 * n)
p.c <- ESTIMATE + YATES/n
(p.c + z22n + z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.5008409
p.c <- ESTIMATE - YATES/n
(p.c + z22n - z * sqrt(p.c * (1 - p.c)/n + z22n/(2 * n)))/(1 + 2 * z22n)
[1] 0.4196787

Bạn có thể giải thích cho tôi tại sao xác suất thành công cơ bản (p) được sử dụng trong dòng 5 không? hoặc có lẽ bạn có thể đề xuất nơi tôi có thể tìm thêm thông tin về sự điều chỉnh YATE này ảnh hưởng đến ESTIMATE.

Cảm ơn bạn

Câu trả lời:


3

Trang trợ giúp chỉ ra rằng "Hiệu chỉnh liên tục chỉ được sử dụng nếu nó không vượt quá chênh lệch giữa tỷ lệ mẫu và null trong giá trị tuyệt đối." Đây là những gì dòng 5 đang kiểm tra: x/nlà tỷ lệ thực nghiệm, plà tỷ lệ null. (Trên thực tế, tôi thấy "nếu" hơi sai lệch vì nó nhiều hơn một "trong chừng mực không vượt quá" khi nhìn vào dòng 5.)


7

Ở câu hỏi thứ hai về nơi bạn có thể tìm thêm thông tin về hiệu chỉnh liên tục này (được quy cho Yates trong trợ giúp prop.testnhưng không phải trong các giới thiệu bên dưới, tôi nghĩ rằng Yates đã đề xuất một cách hiệu chỉnh liên tục chỉ cho phép thử chi bình phương cho các bảng dự phòng ) :

  1. Newcombe RG. Khoảng tin cậy hai mặt cho tỷ lệ đơn: so sánh bảy phương pháp. Stat Med 1998; 17 (8): 857-872. PMID: 9595616

  2. Brown LD, Cai TT, DasGupta A. Ước tính khoảng cho tỷ lệ nhị thức (với Nhận xét & Rejoinder). Khoa học thống kê 2001; 16 (2): 101-133. doi: 10.1214 / ss / 1009213286

Khoảng thời gian điểm Wilson được hiệu chỉnh liên tục là 'phương pháp 4' trong Newcomb. Brown và cộng sự. chỉ xem xét khoảng thời gian điểm Wilson chưa được xử lý trong văn bản chính, nhưng George Casella đề nghị sử dụng phiên bản sửa lỗi liên tục trong Nhận xét của mình (p121), mà Brown et al. thảo luận trong Rejoinder của họ (tr130):

Casella gợi ý khả năng thực hiện hiệu chỉnh liên tục trên thống kê điểm trước khi xây dựng khoảng tin cậy. Chúng tôi không đồng ý với đề xuất này từ bất kỳ quan điểm nào. Các khoảng Wilson Wilson được điều chỉnh liên tục có các đặc tính bảo hiểm cực kỳ bảo thủ, mặc dù về nguyên tắc chúng có thể không được đảm bảo ở mọi nơi bảo thủ. Nhưng ngay cả khi mục tiêu của một người, không giống như chúng ta, là tạo ra những khoảng thời gian bảo thủ, những khoảng thời gian này sẽ rất kém hiệu quả ở mức bình thường so với Blythiêu Still hoặc thậm chí là Clopper đấm Pearson.

Khoảng thời gian 'chính xác' của Clopper-Pearson được cung cấp bởi binom.testR. Tôi đề nghị sử dụng khoảng đó thay vì prop.testnếu bạn muốn có một khoảng bảo thủ, tức là khoảng bảo đảm bảo hiểm ít nhất 95%. Nếu bạn thích một khoảng có độ che phủ trung bình gần 95% (trên p) và do đó sẽ thường hẹp hơn, bạn có thể sử dụng prop.test(…, correct=FALSE)để đưa ra khoảng cách điểm Wilson không được quan tâm.

Sách giáo khoa tiêu chuẩn cho những vấn đề như vậy là Phương pháp thống kê Fleiss cho tỷ lệ và tỷ lệ . Newcomb tham khảo phiên bản gốc năm 1981 nhưng phiên bản mới nhất là phiên bản thứ 3 (2003) . Tôi đã không tự mình kiểm tra nó.


2
Một tài liệu tham khảo khác để so sánh các TCTD nhị thức là Brown LD, Cai TT, & DasGupta, A. (2001). Ước tính khoảng cho một tỷ lệ nhị thức. Khoa học thống kê, 16 (2), 101-133. projecteuclid.org/euclid.ss/1009213286 (truy cập mở). binomGói của R cũng có CI Agresti-Coull.
caracal
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.