Giả định để lấy công cụ ước tính OLS


14

Ai đó có thể giải thích ngắn gọn cho tôi, tại sao mỗi trong số sáu giả định là cần thiết để tính toán công cụ ước tính OLS không? Tôi chỉ tìm thấy về tính đa hướng mà nếu nó tồn tại, chúng ta không thể đảo ngược ma trận (X'X) và lần lượt ước tính tổng ước tính. Còn những người khác (ví dụ, tuyến tính, lỗi trung bình bằng không, v.v.) thì sao?



1
Bạn đang tìm kiếm một lời giải thích khái niệm, hoặc bạn cần một minh chứng toán học?
gung - Phục hồi Monica

4
Bình phương tối thiểu thông thường là một thủ tục số, bạn không cần nhiều giả định để tính toán nó (ngoài tính không khả dụng). Các giả định là cần thiết để biện minh cho suy luận dựa trên nó, xem câu trả lời của tôi ngày hôm qua: stats.stackexchange.com/questions/148804/ Kẻ
kjetil b halvorsen

1
Chính xác thì "sáu giả định" mà bạn đang đề cập đến là gì? Bạn chỉ đề cập đến ba.
whuber

Tôi đề cập đến 1) tuyến tính 2) không có đa cộng tuyến 3) sai số trung bình bằng 0) sai số hình cầu (homoscedasticity và không autocorrelation) 5) hồi quy không ngẫu nhiên và 6) phân phối chuẩn. Vì vậy, như tôi đã hiểu từ câu trả lời dưới đây, chỉ có ba cái đầu tiên là cần thiết để lấy được công cụ ước tính và cái khác chỉ cần thiết để đảm bảo công cụ ước tính là XANH?
Ieva

Câu trả lời:


23

Bạn luôn có thể tính toán công cụ ước tính OLS, ngoài trường hợp khi bạn có tính đa hình hoàn hảo. Trong trường hợp này, bạn có sự phụ thuộc đa tuyến hoàn hảo trong ma trận X của bạn. Do đó, giả định xếp hạng đầy đủ không được thực hiện và bạn không thể tính toán công cụ ước tính OLS, vì các vấn đề không thể thực hiện được.

Về mặt kỹ thuật, bạn không cần các giả định OLS khác để tính toán công cụ ước tính OLS. Tuy nhiên, theo định lý Markov Gauss, bạn cần hoàn thành giả định OLS (giả định clrm) để công cụ ước tính của bạn có màu XANH LÁ.

Bạn có thể tìm thấy một cuộc thảo luận rộng rãi về định lý Gauss thống Markov và dẫn xuất toán học của nó ở đây:

http: // ec economtheoryblog.com/2015/02/26/markov_theorem/

Hơn nữa, nếu bạn đang tìm kiếm một cái nhìn tổng quan về giả định OLS, tức là có bao nhiêu, họ yêu cầu gì và điều gì xảy ra nếu bạn vi phạm giả định OLS đơn lẻ có thể tìm thấy một cuộc thảo luận chi tiết ở đây:

http: // ec economtheoryblog.com/2015/04/01/ols_assumptions/

Tôi hy vọng rằng sẽ giúp, chúc mừng!


14

Dưới đây dựa trên các mặt cắt đơn giản, đối với chuỗi thời gian và bảng điều khiển, nó có phần khác nhau.

  1. Trong dân số, và do đó trong mẫu, mô hình có thể được viết là:
    Y=β0+β1x1++βkxk+u=Xβ+u
    Đây là giả định tuyến tính, đôi khi bị hiểu nhầm. Mô hình nên tuyến tính trong các tham số - cụ thể làβk. Bạn có thể tự do làm bất cứ điều gì bạn muốn vớixi. Nhật ký, hình vuông, v.v ... Nếu đây không phải là trường hợp, thì mô hình có thể được ước tính bằng OLS - bạn cần một số ước tính phi tuyến khác.
  2. Một mẫu ngẫu nhiên (cho các mặt cắt ngang) Điều này là cần thiết cho suy luận và các thuộc tính mẫu. Nó có phần không liên quan đến các cơ chế thuần túy của OLS.
  3. Không có Collinearity hoàn hảo Điều này có nghĩa là không thể có mối quan hệ hoàn hảo giữa xi . Đây là giả định đảm bảo rằng (XX) không có giá trị, sao cho (XX)1 tồn tại.
  4. Không có nghĩa là có điều kiện: E(u|X)=0 . Điều này có nghĩa là bạn đã chỉ định đúng mô hình sao cho: không có biến bị bỏ qua và dạng chức năng bạn ước tính là chính xác so với mô hình dân số (chưa biết). Đây luôn là giả định có vấn đề với OLS, vì không có cách nào để biết liệu nó có thực sự hợp lệ hay không.
  5. Phương sai của thuật ngữ lỗi là không đổi, có điều kiện trên tất cả : V a r ( u | X ) = σ 2 Một lần nữa, điều này có nghĩa là không có gì cho cơ học của OLS, nhưng nó đảm bảo rằng các lỗi tiêu chuẩn thông thường là hợp lệ.XiVar(u|X)=σ2
  6. Bình thường; thuật ngữ lỗi u không phụ thuộc vào , và sau u ~ N ( 0 , σ 2 ) . Một lần nữa đây là không thích hợp cho các cơ chế OLS, nhưng đảm bảo rằng việc phân phối mẫu của β k là bình thường, ^ β k ~ N ( β k , V một r ( ^ β k ) ) .XiuN(0,σ2)βkβk^N(βk,Var(βk^))

Bây giờ cho các hàm ý.

  1. Dưới 1 - 6 (các giả định mô hình tuyến tính cổ điển) OLS là BLUE (công cụ ước lượng không thiên vị tuyến tính tốt nhất), tốt nhất theo nghĩa phương sai thấp nhất. Nó cũng hiệu quả trong số tất cả các công cụ ước tính tuyến tính, cũng như tất cả các công cụ ước tính sử dụng một số chức năng của x. Quan trọng hơn dưới 1 - 6, OLS cũng là công cụ ước lượng không thiên vị tối thiểu. Điều đó có nghĩa là trong số tất cả các công cụ ước tính không thiên vị (không chỉ tuyến tính), OLS có phương sai nhỏ nhất. OLS cũng phù hợp.

  2. Dưới 1 - 5 (giả định Gauss-Markov) OLS là MÀU XANH và hiệu quả (như được mô tả ở trên).

  3. Dưới 1 - 4, OLS không thiên vị và nhất quán.

Trên thực tế OLS cũng nhất quán, theo giả định yếu hơn cụ thể là: ( 1 ) E ( u ) = 0( 2 ) C o v ( x j , u ) = 0 . Sự khác biệt so với giả định 4 là, theo giả định này, bạn không cần phải đóng đinh mối quan hệ chức năng một cách hoàn hảo.(4)(1) E(u)=0(2) Cov(xj,u)=0


Tôi nghĩ bạn vẽ một bức tranh quá tối về điều kiện không có nghĩa. Nếu có sai lệch, thì tối thiểu hóa tổng sai lệch bình phương sẽ không phải là điều thích hợp để làm, nhưng mặt khác, bạn có thể nắm bắt được độ lệch bằng cách chuyển phương trình hồi quy (hấp thụ độ lệch thành ), và sau đó bạn làm có ý nghĩa 0. Nói cách khác, 4 là cả hai không thể xác minh và dễ dàng bỏ qua. β0
dùng3697176

Tôi xin lỗi, nhưng tôi không đồng ý. Hoặc có thể tôi chỉ hiểu lầm bạn? Bạn có thể khơi gợi hoặc đưa ra một tài liệu tham khảo.
Repmat

Tôi không nói ước lượng về cố ý bóp méo (như hồi quy sườn núi), mà tôi tin rằng OP đã không được quan tâm. Tôi đang nói về một mô hình có dạng , trong đó --- vì một lý do lạ --- dư ε có nghĩa là alpha 0 . Trong trường hợp này nó rất dễ dàng để làm một chuyển đổi chính thức đối với y = α + β 0 + β 1 x 1 + ... +y=β0+β1x1++βxxn+ϵϵα0 , nơi giá trị trung bình của η là zero. y=α+β0+β1x1++βxxn+ηη
dùng3697176

@ user3697176 Những gì bạn viết không đúng. Tôi chỉ đăng một câu trả lời để giải thích tại sao.
Alecos Papadopoulos

Nếu giả định 1 không thỏa mãn, chúng ta vẫn có thể sử dụng OLS để ước tính hiệp phương sai dân số (mặc dù chúng ta biết không có mối quan hệ tuyến tính)?
tối đa

7

Một bình luận trong một câu hỏi khác đưa ra những nghi ngờ về tầm quan trọng của điều kiện , cho rằng nó có thể được sửa chữa bởi sự bao gồm của một thuật ngữ liên tục trong các đặc điểm kỹ thuật hồi quy, và như vậy "có thể dễ dàng bỏ qua".E(uX)=0

Đây không phải là như vậy. Việc đưa vào một thuật ngữ không đổi trong hồi quy sẽ hấp thụ giá trị trung bình có điều kiện khác không của thuật ngữ lỗi nếu chúng ta giả sử rằng giá trị trung bình có điều kiện này đã là hằng số và không phải là hàm của các biến hồi quy . Đây là giả định quan trọng phải được thực hiện độc lập cho dù chúng tôi có bao gồm một thuật ngữ không đổi hay không:

E(uX)=const.

Nếu điều này giữ, thì giá trị khác không trở thành một mối phiền toái mà chúng ta có thể giải quyết đơn giản bằng cách bao gồm một thuật ngữ không đổi.

Nhưng nếu điều này không giữ được , (nghĩa là nếu giá trị trung bình có điều kiện không phải là hằng số 0 hoặc khác không ), thì việc bao gồm thuật ngữ không đổi không giải quyết được vấn đề: cái mà nó sẽ "hấp thụ" trong trường hợp này là độ lớn điều đó phụ thuộc vào mẫu cụ thể và việc thực hiện các biến hồi quy. Trong thực tế, hệ số chưa biết gắn liền với chuỗi số không thực sự là một hằng số mà là biến số, phụ thuộc vào các biến hồi quy thông qua trung bình điều kiện không liên tục của thuật ngữ lỗi.

Điều này có nghĩa là gì? Để đơn giản hóa, giả sử trường hợp đơn giản nhất, trong đó ( i lập chỉ mục các quan sát) nhưng E ( u ix i ) = h ( x i ) . Tức là thuật ngữ lỗi không có ý nghĩa - độc lập với các biến hồi quy ngoại trừ các thuật ngữ cùng thời (trong X chúng tôi không bao gồm một loạt các lỗi).E(uiXi)=0iE(uixi)=h(xi)X

Giả sử rằng chúng ta xác định hồi quy với việc bao gồm một số hạng không đổi (một hồi quy của một loạt các số).

y=a+Xβ+ε

và ký hiệu nén

y=Zγ+ε

a=(a,a,a...)Z=[1:X]γ=(a,β), ε=ua.

Then the OLS estimator will be

γ^=γ+(ZZ)1Zε

For unbiasedness we need E[εZ]=0. But

E[εixi]=E[uiaxi]=h(xi)a

which cannot be zero for all i, since we examine the case where h(xi) is not a constant function. So

E[εZ]0E(γ^)γ

and

If E(uixi)=h(xi)h(xj)=E(ujxj), then even if we include a constant term in the regression, the OLS estimator will not be unbiased, meaning also that the Gauss-Markov result on efficiency, is lost.

Moreover, the error term ε has a different mean for each i, and so also a different variance (i.e. it is conditionally heteroskedastic). So its distribution conditional on the regressors differs across the observations i.

But this means that even if the error term ui is assumed normal, then the distribution of the sampling error γ^γ will be normal but not zero-mean mormal, and with unknown bias. And the variance will differ. So

If E(uixi)=h(xi)h(xj)=E(ujxj), then even if we include a constant term in the regression, Hypothesis testing is no longer valid.

In other words, "finite-sample" properties are all gone.

We are left only with the option to resort to asymptotically valid inference, for which we will have to make additional assumptions.

So simply put, Strict Exogeneity cannot be "easily ignored".


I'm not completely sure I understand this. Isn't assuming that the mean is a not a function of the regressors equivalent to assuming homoscedasticity?
Batman

@Batman To what part of my post are you referring to?
Alecos Papadopoulos

When you say "The inclusion of a constant term in the regression will absorb the possibly non-zero conditional mean of the error term if we assume that this conditional mean is already a constant and not a function of the regressors. This is the crucial assumption that must be made independently of whether we include a constant term or not." Isn't assuming that the conditional mean isn't a function of the regressors exactly what we're assuming when we assume homoscedasticity?
Batman

@Batman Homoskedasticity is an assumption about the variance. Assuming mean -independence does not imply that E(uj2x) is also a constant, which is also needed for conditional homoskedasticity. In fact, mean-independence, E(ux)=const. together with conditional heteroskedasticity, E(u2x)=g(x) is a standard model variant.
Alecos Papadopoulos
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.