Tại sao phần dư trong hồi quy tuyến tính luôn luôn bằng 0 khi bao gồm một phần chặn?


14

Tôi đang tham gia một khóa học về các mô hình hồi quy và một trong những đặc tính được cung cấp cho hồi quy tuyến tính là phần dư luôn luôn bằng 0 khi bao gồm một phần chặn.

Ai đó có thể cung cấp một lời giải thích tốt cho lý do tại sao đây là trường hợp?


3
Trước tiên, bạn có thể suy nghĩ về câu hỏi liên quan chặt chẽ nhưng đơn giản hơn về lý do tại sao trong một mẫu đơn biến, phần dư bạn có được bằng cách trừ trung bình mẫu từ mỗi giá trị cũng bằng 0. (Hãy thử theo đại số thông qua nếu bạn có thể.)
Glen_b - Phục hồi

3
Ngay khi bạn nhận ra rằng "tổng bằng không" có nghĩa là "trực giao với một trong các biến giải thích", câu trả lời trở nên rõ ràng về mặt hình học.
whuber

Câu trả lời:


18

Điều này diễn ra trực tiếp từ các phương trình bình thường, tức là các phương trình mà công cụ ước tính OLS giải quyết,

X(yXb)e=0

Tất nhiên, vectơ bên trong dấu ngoặc đơn là vectơ dư hoặc hình chiếu của lên phần bù trực giao của không gian cột của X , nếu bạn thích đại số tuyến tính. Bây giờ bao gồm một vectơ của các ma trận trong ma trận X , bằng cách này, không phải ở cột đầu tiên như được thực hiện theo quy ước, dẫn đếnyXX

1e=0i=1nei=0

Trong bài toán hai biến, điều này thậm chí còn đơn giản hơn để xem, vì tối thiểu hóa tổng số dư bình phương đưa chúng ta đến

i=1n(yiabxi)=0

khi chúng ta lấy đạo hàm liên quan đến đánh chặn. Từ đó, chúng tôi tiến hành lấy công cụ ước tính quen thuộc

a=y¯bx¯

một lần nữa chúng ta thấy rằng việc xây dựng các công cụ ước tính của chúng ta áp đặt điều kiện này.


16

Trong trường hợp bạn đang tìm kiếm một lời giải thích khá trực quan.

Trong một số ý nghĩa, mô hình hồi quy tuyến tính không có gì ngoài một ý nghĩa ưa thích. Để tìm giá trị trung bình số học x¯ trên một số giá trị x1,x2,,xn , chúng tôi tìm một giá trị là số đo trung tâm theo nghĩa là tổng của tất cả các độ lệch (trong đó mỗi độ lệch được xác định là ui=xix¯) ở bên phải của giá trị trung bình bằng tổng của tất cả các độ lệch ở bên trái của giá trị trung bình đó. Không có lý do cố hữu tại sao biện pháp này là tốt, chứ chưa nói đến cách tốt nhất để mô tả giá trị trung bình của một mẫu, nhưng nó chắc chắn là trực quan và thực tế. Điểm quan trọng là, bằng cách xác định trung bình số học theo cách này, nó nhất thiết phải tuân theo rằng một khi chúng ta xây dựng trung bình số học, tất cả các sai lệch so với trung bình đó phải bằng 0 theo định nghĩa!

Trong hồi quy tuyến tính, điều này không khác. Chúng phù hợp với những dòng như vậy mà tổng của tất cả sự khác biệt giữa các giá trị của chúng tôi được trang bị (nếu phù hợp với đường hồi quy) và các giá trị thực tế mà là ở trên đường là chính xác bằng tổng của tất cả sự khác nhau giữa đường hồi quy và tất cả các giá trị bên dưới các hàng. Một lần nữa, không có lý do cố hữu, tại sao đây là cách tốt nhất để xây dựng sự phù hợp, nhưng nó đơn giản và hấp dẫn bằng trực giác. Cũng giống như với trung bình số học: bằng cách xây dựng các giá trị được trang bị của chúng tôi theo cách này, nó nhất thiết phải tuân theo, bằng cách xây dựng, rằng tất cả các sai lệch từ dòng đó phải bằng 0 nếu không đây sẽ không phải là một suy thoái OLS.


2
+1 cho câu trả lời đơn giản, đơn giản và trực quan!

2

Khi chặn được bao gồm trong nhiều hồi quy tuyến

y^i=β0+β1xi,1+β2xi,2++βpxi,p
Trong hình vuông hồi quy Least, tổng của bình phương của các lỗi được giảm thiểu.
SSE=i=1n(ei)2=i=1n(yiyi^)2=i=1n(yiβ0β1xi,1β2xi,2βpxi,p)2
Lấy đạo hàm riêng của SSE tương ứng vớiβ0 và đặt nó về 0.
SSEβ0=i=1n2(yiβ0β1xi,1β2xi,2βpxi,p)1(1)=2i=1nei=0
Do đó, phần dư luôn luôn bằng 0 khi chặn được đưa vào hồi quy tuyến tính.


1

A key observation is that because the model has intercept, 1, which is the first column of design matrix X, can be written as

1=Xe,
where e is a column vector with all zeros but the first component one. Also note, in matrix notation, the sum of residuals is just 1T(yy^).

Therefore,

1T(yy^)=1T(IH)y=eTXT(IX(XTX)1XT)y=eT(XTXTX(XTX)1XT)y=eT(XTXT)y=0.


0

A simple derivation using matrix algebra:

e can be written as 1Te

Then

1Te=1T(Mxy) where Mx is the orthogonal matrix. Since Mx is symmetric we can rearrange so that (Mx1)Ty

which equals zero if Mx and 1 are orthogonal, which is the case if the matrix of the regressors x contains the intercept (a vector of 1, indeed).


I don't think this is right.
Michael R. Chernick

If you explain why then I will be happy to learn something
Mino

0
  1. ei=yi[1,X][a,b]=yiXba=via
  2. ddaei2ei1=via=0 so a^=1nvi
  3. ei=ivia=ivinnivi=0

..

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.