Hãy tưởng tượng một cuộc bầu cử trong đó người đưa ra lựa chọn nhị phân: họ bỏ phiếu cho A hoặc chống lại nó. Kết quả là m người bỏ phiếu cho A, và vì vậy kết quả của A là p = m / n .
Nếu tôi muốn mô hình hóa các cuộc bầu cử này, tôi có thể giả sử rằng mỗi người bỏ phiếu cho A một cách độc lập với xác suất , dẫn đến phân phối phiếu nhị thức: phiếu bầu cho A ∼ B i n o m ( n , p ) . Phân phối này có nghĩa là m = n p và phương sai n p ( 1 - p ) .
Tôi có thể đưa ra các giả định khác là tốt. Ví dụ, tôi có thể giả sử rằng xác suất tự nó là một biến ngẫu nhiên đến từ một số phân phối (ví dụ: beta); điều này có thể dẫn đến phân phối phiếu nhị phân beta cho A. Hoặc tôi có thể giả sử rằng mọi người bỏ phiếu theo nhóm k , trong đó mỗi nhóm k người đưa ra lựa chọn giống nhau và đó là A với xác suất p . Điều này sẽ dẫn đến một phân phối nhị thức với phương sai lớn hơn. Trong tất cả các trường hợp này, phương sai của phân phối kết quả lớn hơn trong sơ đồ nhị thức đơn giản nhất.
Tôi có thể đưa ra yêu cầu rằng phân phối nhị thức có phương sai nhỏ nhất có thể không? Nói cách khác, yêu cầu này có thể được thực hiện chính xác bằng cách nào đó, ví dụ bằng cách chỉ định một số điều kiện hợp lý trên các bản phân phối có thể? Những điều kiện này sẽ là gì?
Hoặc có thể có một số phân phối hợp lý có phương sai thấp hơn?
Tôi có thể tưởng tượng phương sai thấp hơn, ví dụ khi tất cả người đồng ý trước về cách họ sẽ bỏ phiếu và vì vậy phiếu bầu cho A không thực sự là một biến ngẫu nhiên, mà là một số cố định m . Khi đó phương sai bằng không. Hoặc có lẽ hầu hết tất cả đều đồng ý nhưng một vài người thì không, và sau đó người ta có thể có phương sai nhỏ xung quanh m . Nhưng điều này cảm thấy như gian lận. Một người có thể có phương sai nhị phân nhỏ hơn mà không có bất kỳ sự sắp xếp nào, tức là khi mỗi người bỏ phiếu theo một nghĩa nào đó một cách ngẫu nhiên?