Một bình luận trong một câu hỏi khác đưa ra những nghi ngờ về tầm quan trọng của điều kiện , cho rằng nó có thể được sửa chữa bởi sự bao gồm của một thuật ngữ liên tục trong các đặc điểm kỹ thuật hồi quy, và như vậy "có thể dễ dàng bỏ qua".E(u∣X)=0
Đây không phải là như vậy. Việc đưa vào một thuật ngữ không đổi trong hồi quy sẽ hấp thụ giá trị trung bình có điều kiện khác không của thuật ngữ lỗi nếu chúng ta giả sử rằng giá trị trung bình có điều kiện này đã là hằng số và không phải là hàm của các biến hồi quy . Đây là giả định quan trọng phải được thực hiện độc lập cho dù chúng tôi có bao gồm một thuật ngữ không đổi hay không:
E(u∣X)=const.
Nếu điều này giữ, thì giá trị khác không trở thành một mối phiền toái mà chúng ta có thể giải quyết đơn giản bằng cách bao gồm một thuật ngữ không đổi.
Nhưng nếu điều này không giữ được , (nghĩa là nếu giá trị trung bình có điều kiện không phải là hằng số 0 hoặc khác không ), thì việc bao gồm thuật ngữ không đổi không giải quyết được vấn đề: cái mà nó sẽ "hấp thụ" trong trường hợp này là độ lớn điều đó phụ thuộc vào mẫu cụ thể và việc thực hiện các biến hồi quy. Trong thực tế, hệ số chưa biết gắn liền với chuỗi số không thực sự là một hằng số mà là biến số, phụ thuộc vào các biến hồi quy thông qua trung bình điều kiện không liên tục của thuật ngữ lỗi.
Điều này có nghĩa là gì?
Để đơn giản hóa, giả sử trường hợp đơn giản nhất, trong đó ( i lập chỉ mục các quan sát) nhưng E ( u i ∣ x i ) = h ( x i ) . Tức là thuật ngữ lỗi không có ý nghĩa - độc lập với các biến hồi quy ngoại trừ các thuật ngữ cùng thời (trong X chúng tôi không bao gồm một loạt các lỗi).E(ui∣X−i)=0iE(ui∣xi)=h(xi)X
Giả sử rằng chúng ta xác định hồi quy với việc bao gồm một số hạng không đổi (một hồi quy của một loạt các số).
y=a+Xβ+ε
và ký hiệu nén
y=Zγ+ε
a=(a,a,a...)′Z=[1:X]γ=(a,β)′, ε=u−a.
Then the OLS estimator will be
γ^=γ+(Z′Z)−1Z′ε
For unbiasedness we need E[ε∣Z]=0. But
E[εi∣xi]=E[ui−a∣xi]=h(xi)−a
which cannot be zero for all i, since we examine the case where h(xi) is not a constant function. So
E[ε∣Z]≠0⟹E(γ^)≠γ
and
If E(ui∣xi)=h(xi)≠h(xj)=E(uj∣xj), then even if we include a constant term in the regression, the OLS estimator will not be unbiased, meaning also that the Gauss-Markov result on efficiency, is lost.
Moreover, the error term ε has a different mean for each i, and so also a different variance (i.e. it is conditionally heteroskedastic). So its distribution conditional on the regressors differs across the observations i.
But this means that even if the error term ui is assumed normal, then the distribution of the sampling error γ^−γ will be normal but not zero-mean mormal, and with unknown bias. And the variance will differ.
So
If E(ui∣xi)=h(xi)≠h(xj)=E(uj∣xj), then even if we include a constant term in the regression, Hypothesis testing is no longer valid.
In other words, "finite-sample" properties are all gone.
We are left only with the option to resort to asymptotically valid inference, for which we will have to make additional assumptions.
So simply put, Strict Exogeneity cannot be "easily ignored".