Ngoài các câu trả lời xuất sắc đã được đăng, tôi nghĩ có thể hữu ích khi có một hình dung khám phá sự phân bố tỷ lệ quan sát được cho các giá trị và khác nhau .np
Để tạo ra các biểu đồ dưới đây, tôi đã lấy mẫu từ một thử nghiệm Bernoulli với xác suất và lặp lại quá trình này 10.000 lần. Sau đó, tôi đã tạo ra một biểu đồ về tỷ lệ quan sát được từ mỗi 10.000 thí nghiệm đó.np
Nói một cách trực quan, có vẻ như khá hợp lý. Mặc dù khi dường như vẫn có một số lần cắt xảy ra với và . Khi bạn nhận được , tác động có vẻ khá nhỏ.n p ≥ 5n = 50n p = 5,5n p = 6,5n p = 7,5
Cũng lưu ý rằng những âm mưu sẽ là đối xứng vì nếu chúng ta mất mới giá trị của .p'p'= ( 1 - p )
Mã Python để tạo các ô. Bạn có thể sử dụng điều này để điều chỉnh và nếu bạn muốn tự thử nghiệm.np
import matplotlib.pyplot as plt
import numpy as np
np.random.seed(20190915)
def make_hists(axs, n):
proportions = np.linspace(0.01, 0.19, len(axs))
for i, prop in enumerate(proportions):
# Draw n samples 10,000 times
x = np.random.rand(n, 10_000) < prop
means = x.mean(axis=0)
axs[i].hist(means, bins=np.linspace(0, 0.5, n//2))
axs[i].set_xlim([0, 0.5])
axs[i].set_yticklabels([])
ylim_mean = np.mean(axs[i].get_ylim())
axs[i].text(-0.08, ylim_mean * 3/2, f'$p={prop:.2f}$', va='center')
axs[i].text(-0.08, ylim_mean * 2/3, f'$np={n * prop:.1f}$', va='center')
axs[0].set_title(f'$n={n}$')
def main():
f, axs = plt.subplots(10, 2, sharex=True, figsize=(12, 8))
make_hists(axs[:, 0], 50)
make_hists(axs[:, 1], 250)
f.suptitle(
'Histograms of 10,000 sample proportions, varying $p$ and $n$',
fontsize=14
)
plt.show()
main()