Hãy xem xét một thử nghiệm đưa ra tỷ lệ trong khoảng từ 0 đến 1. Làm thế nào để đạt được tỷ lệ này không phù hợp trong bối cảnh này. Nó đã được xây dựng trong phiên bản trước của câu hỏi này , nhưng đã bị xóa cho rõ ràng sau một cuộc thảo luận về meta .
Thí nghiệm này được lặp lại lần, trong khi nhỏ (khoảng 3-10). Các được giả định là độc lập và phân phối giống nhau. Từ những điều này, chúng tôi ước tính giá trị trung bình bằng cách tính trung bình , nhưng làm thế nào để tính khoảng tin cậy tương ứng ?
Khi sử dụng phương pháp tiêu chuẩn để tính khoảng tin cậy, đôi khi lớn hơn 1. Tuy nhiên, trực giác của tôi là khoảng tin cậy chính xác ...
- ... nên nằm trong phạm vi 0 và 1
- ... nên nhỏ hơn khi tăng
- ... đại khái là theo thứ tự được tính toán bằng cách sử dụng phương pháp tiêu chuẩn
- ... được tính theo phương pháp toán học
Đây không phải là những yêu cầu tuyệt đối, nhưng ít nhất tôi muốn hiểu tại sao trực giác của tôi sai.
Tính toán dựa trên câu trả lời hiện có
Sau đây, các khoảng tin cậy do các câu trả lời hiện có được so sánh với .
Phương pháp tiếp cận tiêu chuẩn (còn gọi là "Toán học")
, σ 2 = 0,0204 , do đó khoảng tin cậy 99% là [ 0,865 , 1,053 ] . Điều này mâu thuẫn với trực giác 1.
Cắt xén (được đề xuất bởi @soakley trong các bình luận)
Chỉ cần sử dụng phương pháp tiêu chuẩn sau đó cung cấp là kết quả rất dễ thực hiện. Nhưng chúng ta có được phép làm điều đó không? Tôi chưa tin rằng ranh giới dưới chỉ không đổi (-> 4.)
Mô hình hồi quy logistic (được đề xuất bởi @Rose Hartman)
Dữ liệu được chuyển đổi: Kết quả là [ , chuyển đổi lại kết quả trong [ 0,543 , 0,999 ] . Rõ ràng, 6,90 là một ngoại lệ đối với dữ liệu được chuyển đổi trong khi 0,99 không dành cho dữ liệu chưa được xử lý, dẫn đến khoảng tin cậy làrấtlớn. (-> 3.)
Khoảng tin cậy tỷ lệ nhị thức (được đề xuất bởi @Tim)
Cách tiếp cận có vẻ khá tốt, nhưng tiếc là nó không phù hợp với thí nghiệm. Chỉ cần kết hợp các kết quả và diễn giải nó như một thử nghiệm Bernoulli lặp đi lặp lại lớn như được đề xuất bởi @ZahavaKor sẽ cho kết quả như sau:
trên tổng số 5 ∗ 1000 . Cho ăn này vào Adj. Máy tính Wald cho . Đây dường như không phải thực tế, bởi vì không phải là một đơn X i là bên trong khoảng thời gian đó! (-> 3.)
Bootstrapping (được đề xuất bởi @soakley)
Với ta có 3125 hoán vị có thể. Lấy 3093có nghĩa là trung bình của hoán vị, chúng ta nhận được[0,91,0,99]. Ngoại hình khôngcóxấu, mặc dù tôi mong chờ một khoảng lớn hơn (-> 3.). Tuy nhiên, mỗi công trình không bao giờ lớn hơn[min(Xi),max(X . Do đó, đối với một mẫu nhỏ, nó sẽ phát triển hơn là co lại để tăng n (-> 2.). Đây là ít nhất những gì xảy ra với các mẫu được đưa ra ở trên.