Chúng tôi đang điều tra thử nghiệm thống kê Bayes, và bắt gặp một hiện tượng kỳ lạ (với tôi ít nhất).
Hãy xem xét trường hợp sau: chúng tôi quan tâm đến việc đo dân số, A hoặc B, có tỷ lệ chuyển đổi cao hơn. Để kiểm tra độ tỉnh táo, chúng tôi đặt , nghĩa là xác suất chuyển đổi là bằng nhau ở cả hai nhóm. Chúng tôi tạo dữ liệu nhân tạo bằng mô hình nhị thức, ví dụ:
Sau đó, chúng tôi cố gắng ước tính bằng mô hình nhị phân beta Bayes để chúng tôi có được hậu thế cho mỗi tỷ lệ chuyển đổi, ví dụ:
Thống kê kiểm tra của chúng tôi được tính bằng cách tính thông qua monte carlo.
Điều làm tôi ngạc nhiên là nếu , thì . Suy nghĩ của tôi là nó sẽ tập trung vào khoảng 0,5, và thậm chí hội tụ đến 0,5 khi cỡ mẫu, N , tăng lên.
Câu hỏi của tôi là, tại sao khi ?
Đây là một số mã Python để chứng minh:
%pylab
from scipy.stats import beta
import numpy as np
import pylab as P
a = b = 0.5
N = 10000
samples = [] #collects the values of S
for i in range(5000):
assert a==b
A = np.random.binomial(N, a); B = np.random.binomial(N, b)
S = (beta.rvs(A+1, N-A+1, size=15000) > beta.rvs(B+1, N-B+1, size=15000)).mean()
samples.append(S)
P.hist(samples)
P.show()
R