Hãy để chúng tôi hiển thị kết quả cho trường hợp chung trong đó công thức của bạn cho thống kê kiểm tra là trường hợp đặc biệt. Nói chung, chúng tôi cần xác minh rằng số liệu thống kê có thể, theo đặc tính của phân phốiF , được viết dưới dạng tỷ lệ độc lập rvs chia cho mức độ tự do của chúng.χ2
Đặt với và biết, nonrandom và có thứ hạng cột đầy đủ . Điều này thể hiện hạn chế tuyến tính đối với (không giống như trong ký hiệu OP) hồi quy bao gồm cả số hạng không đổi. Vì vậy, trong ví dụ của @ user1627466, tương ứng với các hạn chế về việc đặt tất cả các hệ số độ dốc về 0.H0:R′β=rRrR:k×qqqkp−1q=k−1
Theo quan điểm của , chúng tôi có
sao cho (với là "căn bậc hai ma trận" của , thông qua, ví dụ: a Phân rã cholesky)
là
Var(β^ols)=σ2(X′X)−1R′(β^ols−β)∼N(0,σ2R′(X′X)−1R),
B−1/2={R′(X′X)−1R}−1/2B−1={R′(X′X)−1R}−1n:=B−1/2σR′(β^ols−β)∼N(0,Iq),
Vmột r ( n )= == =B- 1 / 2σR'Vmột r ( β^ols) R B- 1 / 2σB- 1 / 2σσ2B B- 1 / 2σ= Tôi
trong đó dòng thứ hai sử dụng phương sai của OLSE.
Điều này, như thể hiện trong câu trả lời mà bạn liên kết đến (xem thêm ở đây ), độc lập với
trong đó là ước tính phương sai lỗi không thiên vị thông thường, với là 'dư ma trận sản xuất' từ suy thoái trên .d: = ( N - k ) σ^2σ2∼ χ2n - k,
σ 2=y'MXy/(n-k)MX=I-X(X'X)-1X'Xσ^2= y'MXy/ (n-k)MX= Tôi- X( X'X)- 1X'X
Vì vậy, vì là một hình thức bậc hai theo quy tắc,
Đặc biệt, trong , điều này làm giảm số liệu thống kê
n'nn'n∼ χ2q/ qd/ (n-k)= ( β^ols- β)'R { R'( X'X)- 1R }- 1R'( β^ols- β) / qσ^2~ Fq, n - k.
H0: R'β= rF= ( R'β^ols- r )'{ R'( X'X)- 1R }- 1( R'β^ols−r)/qσ^2∼Fq,n−k.
Mang tính minh họa, hãy xem xét các trường hợp đặc biệt , , , và . Sau đó,
khoảng cách Euclide bình phương của OLS ước tính từ nguồn gốc được chuẩn hóa theo số lượng phần tử - làm nổi bật rằng, vì là các quy tắc chuẩn bình phương và do đó , có thể thấy phân phối dưới dạng phân phối "trung bình .R′=Ir=0q=2σ 2 = 1 X ' X = I F = β ' ols β ols / 2 = β 2 ols , 1 + β 2 ols , 2σ^2= 1X'X= TôiF= β^'olsβ^ols/ 2= β^2ols , 1+ β^2ols , 22,
β2ols,2χ21Fχ2β^2ols , 2χ21Fχ2
Trong trường hợp bạn thích một mô phỏng nhỏ (tất nhiên không phải là bằng chứng!), Trong đó null được kiểm tra rằng không có biến hồi quy trọng - điều mà chúng thực sự không có, do đó chúng tôi mô phỏng phân phối null.k
Chúng tôi thấy thỏa thuận rất tốt giữa mật độ lý thuyết và biểu đồ thống kê kiểm tra Monte Carlo.
library(lmtest)
n <- 100
reps <- 20000
sloperegs <- 5 # number of slope regressors, q or k-1 (minus the constant) in the above notation
critical.value <- qf(p = .95, df1 = sloperegs, df2 = n-sloperegs-1)
# for the null that none of the slope regrssors matter
Fstat <- rep(NA,reps)
for (i in 1:reps){
y <- rnorm(n)
X <- matrix(rnorm(n*sloperegs), ncol=sloperegs)
reg <- lm(y~X)
Fstat[i] <- waldtest(reg, test="F")$F[2]
}
mean(Fstat>critical.value) # very close to 0.05
hist(Fstat, breaks = 60, col="lightblue", freq = F, xlim=c(0,4))
x <- seq(0,6,by=.1)
lines(x, df(x, df1 = sloperegs, df2 = n-sloperegs-1), lwd=2, col="purple")
Để thấy rằng các phiên bản của thống kê kiểm tra trong câu hỏi và câu trả lời thực sự tương đương nhau, lưu ý rằng null tương ứng với các hạn chế và .R′=[0I]r=0
Đặt được phân vùng theo các hệ số được giới hạn bằng 0 dưới giá trị null (trong trường hợp của bạn, tất cả trừ hằng số, nhưng đạo hàm phải tuân theo là chung). Ngoài ra, hãy để là ước tính OLS được phân vùng phù hợp.X=[X1X2]β ols = ( β ' ols , 1 , β ' ols , 2 ) 'β^ols=(β^′ols,1,β^′ols,2)′
Sau đó,
và
khối dưới bên phải của
Bây giờ, hãy sử dụng kết quả cho các nghịch đảo được phân vùng để có được
trong đó .R′β^ols=β^ols,2
R′(X′X)−1R≡D~,
(XTX)−1=(X′1X1X′2X1X′1X2X′2X2)−1≡(A~C~B~D~)
~ D =(X ' 2 X2-X ' 2 X1(X ' 1 X1)-1X ' 1 X2)-1=(X ' 2 M X 1 X2)-1M X 1 =ID~=(X′2X2−X′2X1(X′1X1)−1X′1X2)−1=(X′2MX1X2)−1
MX1=I−X1(X′1X1)−1X′1
Do đó, tử số của thống kê trở thành (không chia cho )
Tiếp theo, hãy nhớ lại rằng theo định lý Frisch-Waugh-Lovell, chúng ta có thể viết
sao cho
FqFnum=β^′ols,2(X′2MX1X2)β^ols,2
β^ols,2=(X′2MX1X2)−1X′2MX1y
Fnum=y′MX1X2(X′2MX1X2)−1(X′2MX1X2)(X′2MX1X2)−1X′2MX1y=y′MX1X2(X′2MX1X2)−1X′2MX1y
Vẫn còn cho thấy tử số này giống hệt với , sự khác biệt về tổng số dư không giới hạn và giới hạn của bình phương.USSR−RSSR
Ở đây,
là tổng bình phương còn lại từ hồi quy trên , nghĩa là, áp dụng . Trong trường hợp đặc biệt của bạn, đây chỉ là , phần dư của hồi quy trên hằng số.RSSR=y′MX1y
yX1H0TSS=∑i(yi−y¯)2
Một lần nữa sử dụng FWL (cũng cho thấy phần dư của hai cách tiếp cận giống hệt nhau), chúng ta có thể viết (SSR trong ký hiệu của bạn) dưới dạng SSR của hồi quy
USSRMX1yonMX1X2
Đó là,
USSR====y′M′X1MMX1X2MX1yy′M′X1(I−PMX1X2)MX1yy′MX1y−y′MX1MX1X2((MX1X2)′MX1X2)−1(MX1X2)′MX1yy′MX1y−y′MX1X2(X′2MX1X2)−1X′2MX1y
Như vậy
RSSR−USSR==y′MX1y−(y′MX1y−y′MX1X2(X′2MX1X2)−1X′2MX1y)y′MX1X2(X′2MX1X2)−1X′2MX1y