Đây không phải là bằng chứng (và +1 cho câu trả lời của @ whuber), nhưng đó là một cách hình học để xây dựng một số trực giác về lý do tại sao là một câu trả lời hợp lý.E(X1|T)=T/nE(X1|T)=T/n
Đặt và nên . Sau đó, chúng tôi sẽ điều chỉnh sự kiện rằng đối với một số , vì vậy điều này giống như vẽ các Gaussian đa biến được hỗ trợ trên nhưng chỉ nhìn vào những cái cuối cùng trong affine không gian . Sau đó, chúng tôi muốn biết trung bình của tọa độ của các điểm hạ cánh trong không gian affine này (đừng bận tâm rằng đó là tập hợp con số 0).X=(X1,…,Xn)TX=(X1,…,Xn)T1=(1,…,1)T1=(1,…,1)TT=1TXT=1TX1TX=t1TX=tt∈Rt∈RRnRn{x∈Rn:1Tx=t}{x∈Rn:1Tx=t}x1x1
Chúng ta biết
vì vậy chúng ta đã có một Gaussian hình cầu có vectơ trung bình không đổi và vectơ trung bình nằm trên cùng một đường thẳng với vectơ bình thường của siêu phẳng .X∼N(μ1,I)X∼N(μ1,I)
μ1μ1xT1=0xT1=0
Điều này cho chúng ta một tình huống như hình dưới đây:
Ý tưởng chính: đầu tiên hãy tưởng tượng mật độ trên không gian con affine . Mật độ của đối xứng quanh vì . Mật độ cũng sẽ đối xứng trên vì cũng đối xứng trên cùng một đường và điểm xung quanh nó đối xứng là giao điểm của các đường và . Điều này xảy ra với .Ht:={x:xT1=t}Ht:={x:xT1=t}XXx1=x2x1=x2E(X)∈span 1E(X)∈span 1HtHtHtHtx1+x2=tx1+x2=tx1=x2x1=x2x=(t/2,t/2)x=(t/2,t/2)
Để hình ảnh chúng ta có thể tưởng tượng việc lấy mẫu lặp đi lặp lại, và sau đó bất cứ khi nào chúng ta nhận được một điểm trong chúng ta chỉ lấy tọa độ và lưu nó. Từ tính đối xứng của mật độ trên , phân bố tọa độ cũng sẽ đối xứng và nó sẽ có cùng điểm trung tâm là . Giá trị trung bình của phân bố đối xứng là điểm trung tâm của đối xứng nên điều này có nghĩa là và rằng vì và có thể được loại bỏ mà không ảnh hưởng bất cứ điều gìE(X1|T)E(X1|T)HtHtx1x1HtHtx1x1t/2t/2E(X1|T)=T/2E(X1|T)=T/2E(X1|T)=E(X2|T)E(X1|T)=E(X2|T)X1X1X2X2
Ở các chiều cao hơn, điều này trở nên khó (hoặc không thể) để hình dung chính xác, nhưng ý tưởng tương tự cũng được áp dụng: chúng ta có một Gaussian hình cầu với trung bình trong khoảng , và chúng ta đang nhìn vào một không gian con affine vuông góc với nó . Điểm cân bằng của phân phối trên không gian con vẫn sẽ là giao điểm của và nằm ở và mật độ vẫn đối xứng nên điểm cân bằng này lại là giá trị trung bình.11span 1span 1{x:xT1=t}{x:xT1=t}x=(t/n,…,t/n)x=(t/n,…,t/n)
Một lần nữa, đó không phải là một bằng chứng, nhưng tôi nghĩ rằng nó đưa ra một ý tưởng đúng đắn về lý do tại sao bạn mong đợi hành vi này ngay từ đầu.
Ngoài ra, như một số người như @StubbornAtom đã lưu ý, điều này thực sự không yêu cầu phải là Gaussian. Trong 2-D, lưu ý rằng nếu có thể trao đổi thì (nói chung hơn, ) vì vậy phải đối xứng với dòng . Chúng tôi cũng có vì vậy mọi thứ tôi đã nói liên quan đến "ý tưởng chính" trong bức ảnh đầu tiên vẫn giữ chính xác. Đây là một ví dụ trong đó là iid từ mô hình hỗn hợp Gaussian. Tất cả các dòng có cùng ý nghĩa như trước.XXXXf(x1,x2)=f(x2,x1)f(x1,x2)=f(x2,x1)f(x)=f(xσ)f(x)=f(xσ)ffx1=x2x1=x2E(X)∈span 1E(X)∈span 1XiXi