Khoảng tin cậy xung quanh tỷ lệ của hai tỷ lệ


20

Tôi có hai tỷ lệ (ví dụ: tỷ lệ nhấp (TLB) trên một liên kết trong bố cục kiểm soát và TLB trên một liên kết trong bố cục thử nghiệm) và tôi muốn tính khoảng tin cậy 95% xung quanh tỷ lệ của các tỷ lệ này.

Làm thế nào để tôi làm điều này? Tôi biết tôi có thể sử dụng phương pháp delta để tính toán phương sai của tỷ lệ này, nhưng tôi không chắc phải làm gì ngoài điều đó. Tôi nên sử dụng gì làm trung điểm của khoảng tin cậy (tỷ lệ quan sát của tôi hoặc tỷ lệ dự kiến ​​khác nhau) và tôi nên lấy bao nhiêu độ lệch chuẩn xung quanh tỷ lệ này?

Tôi có nên sử dụng phương sai delta không? (Tôi không thực sự quan tâm đến phương sai, chỉ là khoảng tin cậy.) Tôi có nên sử dụng Định lý Fieller , sử dụng Trường hợp 1 (vì tôi đang thực hiện tỷ lệ, tôi đoán tôi đáp ứng yêu cầu phân phối bình thường)? Tôi có nên tính một mẫu bootstrap không?


1
Bạn có một vấn đề cơ bản: hầu hết các tỷ lệ đều có cơ hội dương bằng 0, do đó tỷ lệ (tỷ lệ độc lập) có cơ hội tích cực không được xác định. Điều này có thể gây ra những khó khăn nghiêm trọng cho các phương pháp gần đúng (như phương pháp delta) và gợi ý rằng các xấp xỉ bình thường nên được xem xét một cách có ý thức hơn và được kiểm tra chặt chẽ hơn bình thường.
whuber

Joseph L. Fleiss, Bruce Levin, Myunghee Cho Paik: Phương pháp thống kê tỷ lệ và tỷ lệ [1] thảo luận về Rủi ro tương đối, là thương số của hai tỷ lệ. Tôi không có sách, vì vậy tôi chỉ có thể đi theo mục lục và mục lục, nhưng có lẽ thư viện của bạn có nó. [1]: onlinel Library.wiley.com/book/10.1002/0471445428
cbeleites hỗ trợ Monica

Chắc chắn một bootstrap phần trăm sẽ là phương pháp tốt nhất?
Peter Ellis

Câu trả lời:


19

Cách tiêu chuẩn để thực hiện điều này trong dịch tễ học (trong đó tỷ lệ tỷ lệ thường được gọi là tỷ lệ rủi ro ) là trước tiên chuyển đổi tỷ lệ, tính toán khoảng tin cậy trên thang đo log bằng phương pháp delta và giả sử phân phối bình thường, sau đó biến đổi trở lại. Điều này hoạt động tốt hơn ở các cỡ mẫu vừa phải so với sử dụng phương pháp delta trên thang đo chưa được xử lý, mặc dù vậy nó vẫn sẽ hoạt động kém nếu số lượng sự kiện trong một nhóm rất nhỏ và thất bại hoàn toàn nếu không có sự kiện nào trong cả hai nhóm.

Nếu có x 2 thành công trong hai nhóm ra khỏi tổng số n 1n 2 , sau đó dự toán rõ ràng cho tỷ lệ tỷ lệ là θ = x 1 / n 1x1x2n1n2

θ^=x1/n1x2/n2.

Sử dụng phương pháp đồng bằng và giả định hai nhóm độc lập và những thành công được phân phối binomially, bạn có thể thấy rằng Lấy vuông gốc rễ của điều này sẽ cho sai số chuẩn SE ( log θ ) . Giả sử rằng log θ thường phân tán, khoảng tin cậy 95% cho log θ

Var(logθ^)=1/x11/n1+1/x21/n2.
SE(logθ^)logθ^logθđược Exponentiating này đưa ra một khoảng tin cậy 95% cho tỷ lệ tỷ lệ q như θ exp [ ± 1,96 SE ( log θ ) ] .
logθ^±1.96SE(logθ^).
θ
θ^exp[±1.96SE(logθ^)].

5
Điều này hoạt động rất tốt với điều kiện n 2 là lớn (vài trăm trở lên) và n 1 p 1n 2 p 2 không quá nhỏ (khoảng 10 trở lên). Mặt khác, khoảng cách có xu hướng quá lớn. Nó cũng cần một số cách để xử lý các trường hợp x 2 = 0x i = n i . Hóa ra cả hai vấn đề có thể được giải quyết với một cách tiếp cận liên tục sửa như: add 1 / 2 cho cả x i , thêm 1n1n2n1p1n2p210x2=0xi=ni1/2xi1cho cả và tiến hành. Sau đó, CI này tốt đáng ngạc nhiên với điều kiện cả hai p i n i4 hoặc lớn hơn, bất kể kích thước của n i . nipini4ni
whuber

@whuber: "cách tiếp cận giống như hiệu chỉnh liên tục" - việc sử dụng 1/2 đặc biệt là một mẹo phổ biến? (Trái ngược với một số giả nhỏ khác.) Cách bạn diễn đạt nó tạo ra 1/2 âm thanh theo nguyên tắc nào đó =) - có phải vậy không?
raegtin

xini

Tại sao căn bậc hai của sai số chuẩn phương sai trong trường hợp này, không phải là độ lệch chuẩn?
Mikko

2
@onestop Điều này có được thực hiện trong gói R nào không?
Bogdan Vasilescu
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.