Giả sử rằng bạn muốn biết bao nhiêu phần trăm mọi người sẽ bỏ phiếu cho một ứng cử viên cụ thể (giả sử, , lưu ý rằng theo định nghĩa π là từ 0 đến 100). Bạn lấy mẫu N cử tri một cách ngẫu nhiên để tìm hiểu xem họ sẽ bỏ phiếu như thế nào và khảo sát của bạn về những cử tri N này cho bạn biết rằng tỷ lệ phần trăm là p . Vì vậy, bạn muốn thiết lập một khoảng tin cậy cho tỷ lệ phần trăm thực sự.ππNNp
Nếu bạn giả sử rằng được phân phối bình thường (một giả định có thể hoặc không thể được chứng minh tùy thuộc vào mức độ ' N ' lớn ) thì khoảng tin cậy của bạn đối với π sẽ có dạng sau:
C I = [ p - k ∗ s d ( p ) , p + k ∗ s d ( p ) ]
trong đó k là hằng số phụ thuộc vào mức độ tự tin mà bạn muốn (nghĩa là 95% hoặc 99%, v.v.).pNπ
CI=[p−k∗sd(p), p+k∗sd(p)]
k
Từ góc độ bỏ phiếu, bạn muốn độ rộng của khoảng tin cậy của bạn là 'thấp'. Thông thường, những người thăm dò ý kiến làm việc với biên độ lỗi, về cơ bản là một nửa của CI. Nói cách khác, . MoE=k∗sd(p)
Dưới đây là cách chúng ta sẽ tính toán : Theo định nghĩa, p = ∑ X i / N trong đó, X i = 1 nếu cử tri i bỏ phiếu cho ứng cử viên và 0 khác.sd(p)p=∑Xi/NXi=1i0
Vì, chúng tôi đã lấy mẫu các cử tri một cách ngẫu nhiên, chúng tôi có thể giả sử rằng là biến ngẫu nhiên iid Bernoulli. Do đó,
V một r ( P ) = V ( Σ X iXi
Do đó,
sd(p)=√
Var(P)=V(∑XiN)=∑V(Xi)N2=Nπ(1−π)N2=π(1−π)N.
Bây giờ để ước tính sai số chúng ta cần phải biết
πmà chúng tôi không biết rõ ràng. Nhưng, việc kiểm tra tử số cho thấy ước tính 'tệ nhất' cho
sd(p)theo nghĩa là chúng ta có độ lệch chuẩn 'lớn nhất' là khi
π=0,5. Do đó, độ lệch chuẩn tồi tệ nhất có thể là:
sd(p)=√sd(p)=π∗(1−π)N−−−−−−−−−√
πsd(p)π=0.5sd(p)=0.5∗0.5/N−−−−−−−−−√=0.5/N−−√
NN
k=1.96N=1000
[p−1.960.51000−−−−√, p+1.960.51000−−−−√]=[p−0.03, p+0.03]
NNπ=50%