Clopper-Pearson cho các nhà toán học không


12

Tôi đã tự hỏi nếu có ai có thể giải thích cho tôi về trực giác ngoài Clopper-Pearson CI về tỷ lệ.

Theo tôi biết, mỗi CI bao gồm một phương sai trong đó. Tuy nhiên, đối với tỷ lệ, ngay cả khi tỷ lệ của tôi là 0 hoặc 1 (0% hoặc 100%), Clopper-Pearson CI có thể được tính toán. Tôi đã thử xem các công thức và tôi hiểu rằng nó có thứ gì đó có phần trăm phân phối Binomial và tôi hiểu rằng việc tìm CI bao gồm các lần lặp, nhưng tôi tự hỏi liệu có ai có thể giải thích logic và lý trí bằng "từ đơn giản" hay với toán học tối thiểu ?

Câu trả lời:


22

Khi bạn nói rằng bạn đã quen với các khoảng tin cậy có chứa một biểu thức cho phương sai, bạn đang nghĩ đến trường hợp Gaussian, trong đó thông tin về hai tham số đặc trưng cho dân số Một nghĩa của nó và phương sai khác của nó được tóm tắt bằng mẫu trung bình & phương sai mẫu. Giá trị trung bình mẫu ước tính trung bình dân số, nhưng độ chính xác mà nó làm phụ thuộc vào phương sai dân số, được ước tính lần lượt theo phương sai mẫu. Mặt khác, phân phối nhị thức chỉ có một tham số, xác suất thành công trên mỗi thử nghiệm riêng lẻ & tất cả thông tin được cung cấp bởi mẫu về tham số này được tóm tắt trong tổng số không. thành công trong số rất nhiều thử nghiệm độc lập. Phương sai dân số và giá trị trung bình đều được xác định bởi tham số này.

πxn

Pr(X=x)=(nx)πx(1π)nx

Tăng cho đến khi xác suất hoặc ít thành công giảm xuống 2,5%: đó là giới hạn trên của bạn. Giảm cho đến khi xác suất hoặc nhiều thành công giảm xuống còn 2,5%: đó là giới hạn dưới của bạn. (Tôi khuyên bạn nên thực sự thử làm điều này nếu không hiểu rõ về nó.) Những gì bạn đang làm ở đây là tìm các giá trị của mà khi được coi là một giả thuyết khống sẽ dẫn đến việc nó (chỉ) bị từ chối bởi thử nghiệm hai đuôi ở mức ý nghĩa 5%. Về lâu dài, các giới hạn được tính theo cách này bao gồm giá trị thực của , bất kể đó là gì, ít nhất 95% thời gian.πxπxππ


+1. Điều này có thể tự nó xứng đáng với một câu hỏi, nhưng tôi sẽ nhanh chóng hỏi ở đây: đối với một ứng dụng cụ thể tôi muốn có một biện pháp không chắc chắn duy nhất (một cái gì đó hoạt động như sai số chuẩn của trung bình) cho các tỷ lệ khác nhau. Tôi biết rằng có một số quy trình CI nhị thức, bao gồm Clopper-Pearson. Sẽ có ý nghĩa nếu lấy chiều rộng của một CI như một biện pháp không chắc chắn? Hoặc có lẽ chiều rộng / 1,96 / 2 để làm cho nó mang lại chính xác SEM trong giới hạn Gaussian.
amip nói rằng Phục hồi lại

1
@amoeba: Có lẽ bạn đang nghĩ về kích thước mẫu nhỏ: (1) Bạn có thể muốn một cái gì đó giống như các TCTD Blaker-Spjotvoll thay vì các CIs dựa trên thử nghiệm diện tích đuôi bằng nhau. (2) Phân phối độ tin cậy khá khó khăn, điều này sẽ làm cho độ rộng của bất kỳ khoảng thời gian nhất định nào nhạy cảm với độ bao phủ bạn quy định.
Scortchi - Tái lập Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.