Khi tôi đang nghiên cứu về sự đầy đủ, tôi đã bắt gặp câu hỏi của bạn bởi vì tôi cũng muốn hiểu trực giác về Từ những gì tôi đã thu thập được, đây là những gì tôi nghĩ ra (cho tôi biết bạn nghĩ gì, nếu tôi mắc lỗi, v.v.).
Hãy để là một mẫu ngẫu nhiên từ một phân phối với trung bình Poisson θX1,…,Xn .θ>0
Chúng ta biết rằng là một thống kê đủ cho θ , kể từ khi phân phối có điều kiện của X 1 , ... , X n cho T ( X ) hoàn toàn miễn θ , nói cách khác, không phụ thuộc vào θ .T(X)=∑ni=1XiθX1,…,XnT(X)θθ
Bây giờ, nhà thống kê biết rằng X 1 , Mạnh , X n i . i . d ∼ P o i s s o n ( 4 ) và tạo n = 400 giá trị ngẫu nhiên từ phân phối này:A X1,…,Xn∼i.i.dPoisson(4)n=400
n<-400
theta<-4
set.seed(1234)
x<-rpois(n,theta)
y=sum(x)
freq.x<-table(x) # We will use this latter on
rel.freq.x<-freq.x/sum(freq.x)
Đối với các giá trị thống kê đã tạo, anh ta lấy tổng của nó và hỏi nhà thống kê B như sau:AB
"Tôi đã những giá trị mẫu lấy từ một phân phối Poisson. Biết rằng Σ n i = 1 x i = yx1,…,xn , những gì bạn có thể cho tôi biết về phân phối này?"∑ni=1xi=y=4068
Vì vậy, chỉ biết rằng (và thực tế là mẫu phát sinh từ phân phối Poisson) là đủ để nhà thống kê B nói bất cứ điều gì về∑ni=1xi=y=4068B ? Vì chúng tôi biết rằng đây là một thống kê đầy đủ, chúng tôi biết rằng câu trả lời là "có".θ
Để hiểu rõ hơn về ý nghĩa của việc này, chúng ta hãy làm như sau (lấy từ "Giới thiệu về thống kê toán học" của Hogg & Mckean & Craig, ấn bản thứ 7, bài tập 7.1.9):
" quyết định tạo ra một số quan sát giả, mà ông gọi là z 1 , z 2 , ... , z n (như ông biết họ có thể sẽ không thể bằng bản gốc x -values) như sau. Ông ghi chú rằng xác suất có điều kiện của Poisson độc lập ngẫu nhiên biến Z 1 , Z 2 ... , Z n là tương đương với z 1 , z 2 , ... , z n , trao Σ z i = y , làBz1,z2,…,znxZ1,Z2…,Znz1,z2,…,zn∑zi=y
θz1e−θz1!θz2e−θz2!⋯θzne−θzn!nθye−nθy!=y!z1!z2!⋯zn!(1n)z1(1n)z2⋯(1n)zn
kể từ khi có phân phối với trung bình Poisson n θ . Phân phối thứ hai là đa cực với các thử nghiệm độc lập y , mỗi thử nghiệm kết thúc theo một trong n cách loại trừ và triệt để lẫn nhau, mỗi cách đều có cùng xác suất 1 / n . Theo đó, B chạy một thí nghiệm đa thức như y thử nghiệm độc lập và có được z 1 , ... , z nY=∑Zinθyn1/nByz1,…,zn ".
Đây là những gì các bài tập nêu. Vì vậy, hãy làm chính xác điều đó:
# Fake observations from multinomial experiment
prob<-rep(1/n,n)
set.seed(1234)
z<-as.numeric(t(rmultinom(y,n=c(1:n),prob)))
y.fake<-sum(z) # y and y.fake must be equal
freq.z<-table(z)
rel.freq.z<-freq.z/sum(freq.z)
Zk=0,1,…,13
# Verifying distributions
k<-13
plot(x=c(0:k),y=dpois(c(0:k), lambda=theta, log = FALSE),t="o",ylab="Probability",xlab="k",
xlim=c(0,k),ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(8,0.2, legend=c("Real Poisson","Random Z given y"),
col = c("black","green"),pch=c(1,4))
θY=∑Xin tăng, hai đường cong trở nên giống hơn).
XZ|y
plot(rel.freq.x,t="o",pch=16,col="red",ylab="Relative Frequency",xlab="k",
ylim=c(0,max(c(rel.freq.x,rel.freq.z))))
lines(rel.freq.z,t="o",col="green",pch=4)
legend(7,0.2, legend=c("Random X","Random Z given y"), col = c("red","green"),pch=c(16,4))
Chúng tôi thấy rằng chúng cũng khá giống nhau (như mong đợi)
XiY=X1+X2+⋯+Xn