Dựa trên nhận xét tiếp theo của bạn, có vẻ như bạn đang cố ước tính xác suất bao phủ của khoảng tin cậy khi bạn giả sử phương sai lỗi không đổi khi phương sai lỗi thực sự không phải là hằng số.
Cách tôi nghĩ về điều này là, với mỗi lần chạy, khoảng tin cậy sẽ bao gồm giá trị thực hoặc không. Xác định một biến chỉ báo:
YTôi= { 10tôi e t h e i n t e r v a l c o v e r s tôi e i t d o e s n o t
Sau đó, xác suất bảo hiểm bạn quan tâm là mà bạn có thể ước tính theo tỷ lệ mẫu mà tôi nghĩ là những gì bạn đang đề xuất.E( YTôi) = p
Làm cách nào để đặt số lần chạy lặp?
Chúng ta biết rằng phương sai của một thử nghiệm Bernoulli là , và mô phỏng của bạn sẽ tạo IID thử nghiệm Bernoulli, do đó phương sai của mô phỏng dựa ước tính của bạn của p là p ( 1 - p ) / n , nơi n là số lượng mô phỏng. Bạn có thể chọn n để thu nhỏ phương sai này bao nhiêu tùy ý. Đó là một thực tế là p ( 1 - p ) / n ≤ 1 / 4 np ( 1 - p )pp ( 1 - p ) / nnn
p ( 1 - p ) / n ≤ 1 / 4 n
Vì vậy, nếu bạn muốn phương sai được ít hơn một số xác định trước ngưỡng, , sau đó bạn có thể đảm bảo điều này bằng cách chọn n ≥ 1 / 4 δ .δn ≥ 1 / 4 δ
Trong một cài đặt tổng quát hơn, nếu bạn đang cố gắng điều tra các thuộc tính của phân phối lấy mẫu của công cụ ước tính bằng mô phỏng (ví dụ: trung bình và phương sai) thì bạn có thể chọn số lượng mô phỏng dựa trên mức độ chính xác mà bạn muốn đạt được trong một tương tự thời trang được mô tả ở đây.
Cũng lưu ý rằng, khi giá trị trung bình (hoặc một thời điểm khác) của một biến là đối tượng quan tâm, như ở đây, bạn có thể xây dựng khoảng tin cậy cho nó dựa trên các mô phỏng sử dụng xấp xỉ bình thường (ví dụ định lý giới hạn trung tâm) , như đã thảo luận trong câu trả lời hay của MansT. Giá trị gần đúng bình thường này tốt hơn khi số lượng mẫu tăng lên, vì vậy, nếu bạn có kế hoạch xây dựng khoảng tin cậy bằng cách kháng cáo định lý giới hạn trung tâm, bạn sẽ muốn đủ lớn để áp dụng. Đối với trường hợp nhị phân, như bạn có ở đây, có vẻ như xấp xỉ này là tốt ngay cả khi n p và n ( 1 - p ) khá vừa phải - giả sử, 20 .nn pn ( 1 - p )20
Có đúng là lớn hơn các bản sao cần thiết có thể dẫn đến sai lệch giả? Nếu vậy, làm thế nào?
Như tôi đã đề cập trong một bình luận - điều này phụ thuộc vào ý của bạn bởi giả mạo. Số lượng mô phỏng lớn hơn sẽ không tạo ra sai lệch theo nghĩa thống kê, nhưng nó có thể cho thấy một thiên vị không quan trọng chỉ đáng chú ý với kích thước mẫu lớn trong thiên văn. Ví dụ: giả sử xác suất bảo hiểm thực sự của khoảng tin cậy sai chính tả là . Sau đó, đây thực sự không phải là một vấn đề theo nghĩa thực tế, nhưng bạn chỉ có thể nhận ra sự khác biệt này nếu bạn chạy một tấn mô phỏng.94.9999 %