Hồi quy tuyến tính: * Tại sao * bạn có thể phân vùng tổng bình phương?


9

Bài đăng này đề cập đến mô hình hồi quy tuyến tính bivariate, . Tôi đã luôn luôn phân chia tổng số bình phương (SSTO) thành tổng bình phương cho lỗi (SSE) và tổng bình phương cho mô hình (SSR) trên đức tin, nhưng một khi tôi thực sự nghĩ về nó, tôi không hiểu tại sao nó hoạt động ...Yi=β0+β1xi

Phần tôi làm hiểu:

yi : Giá trị quan sát của y

y¯ : Giá trị trung bình của tất cả các s được quan sátyi

y^i : Giá trị được trang bị / dự đoán của y cho một quan sát đã cho x

yiy^i : Dư / lỗi (nếu bình phương và thêm vào cho tất cả các quan sát thì đây là SSE)

y^iy¯ : Giá trị của mô hình được trang bị khác bao nhiêu so với giá trị trung bình (nếu bình phương và cộng lại cho tất cả các quan sát thì đây là SSR)

yiy¯ : Giá trị quan sát khác với giá trị trung bình là bao nhiêu (nếu được sửa và cộng lại cho tất cả các quan sát, đây là SSTO).

Tôi có thể hiểu tại sao, đối với một quan sát duy nhất, mà không bình phương bất cứ thứ gì, . Và tôi có thể hiểu tại sao, nếu bạn muốn thêm mọi thứ lên trên tất cả các quan sát, bạn phải bình phương chúng hoặc chúng sẽ cộng thành 0.(yiy¯)=(y^iy¯)+(yiy^i)

Phần tôi không hiểu là tại sao (ví dụ: SSTO = SSR + SSE). Có vẻ như nếu bạn có một tình huống trong đó , thì , không phải . Tại sao không phải là trường hợp ở đây?(yiy¯)2=(y^iy¯)2+(yiy^i)2A=B+CA2=B2+2BC+C2A2=B2+C2


5
Bạn đã bỏ qua phần tóm tắt trong đoạn cuối cùng của bạn. SST = SSR + SSE là tổng của , nhưng đẳng thức của bạn bạn đã viết ngay trước khi nó không thực sự đúng nếu không có dấu hiệu tổng kết ở đó. i
Glen_b -Reinstate Monica

Trong đoạn cuối cùng của bạn, bạn muốn (ví dụ SSTO = SSR + SSE) chứ không (ví dụ SSTO = SSR + SSE). "eg" là tên viết tắt của cụm từ Latin " exempli gratia " hoặc "ví dụ" trong tiếng Anh. "tức là" là viết tắt của " id est " và có thể được đọc bằng tiếng Anh là "nghĩa là".
Matthew Gunn

Câu trả lời:


9

Có vẻ như nếu bạn có một tình huống trong đó , thì , không phải . Tại sao không phải là trường hợp ở đây?A=B+CA2=B2+2BC+C2A2=B2+C2

Về mặt khái niệm, ý tưởng là vì và là trực giao (tức là vuông góc).BC=0BC


Trong bối cảnh hồi quy tuyến tính ở đây, phần dư là trực giao với dự báo hạ thấp . Dự báo từ hồi quy tuyến tính tạo ra phân rã trực giao của theo nghĩa tương tự như là phân rã trực giao.ϵi=yiy^iy^iy¯y(3,4)=(3,0)+(0,4)

Phiên bản đại số tuyến tính:

Để cho:

z=[y1y¯y2y¯yny¯]z^=[y^1y¯y^2y¯y^ny¯]ϵ=[y1y^1y2y^2yny^n]=zz^

Hồi quy tuyến tính (có hằng số bao gồm) phân tách thành tổng của hai vectơ: dự báo và dưzz^ϵ

z=z^+ϵ

Hãy biểu thị sản phẩm chấm . (Nói chung, có thể là sản phẩm bên trong .).,.X,Y E[XY]

z,z=z^+ϵ,z^+ϵ=z^,z^+2z^,ϵ+ϵ,ϵ=z^,z^+ϵ,ϵ

Trường hợp dòng cuối cùng xuất phát từ thực tế là (nghĩa là và là trực giao). Bạn có thể chứng minh và là trực giao dựa trên cách xây dựng hồi quy bình phương nhỏ nhất bình thường .z^,ϵ=0z^ϵ=zz^z^ϵz^

z^hình chiếu tuyến tính của lên không gian con được xác định bởi khoảng tuyến tính của các biến hồi quy , , v.v .... dư là trực giao với toàn bộ không gian con do đó (nằm trong khoảng của , , v.v ...) là trực giao với .zx1x2ϵz^x1x2ϵ


Lưu ý rằng như tôi đã định nghĩa là sản phẩm chấm, chỉ đơn giản là một cách viết khác (tức là SSTO = SSR + SSE).,.z,z=z^,z^+ϵ,ϵi(yiy¯)2=i(y^iy¯)2+i(yiy^i)2


8

Toàn bộ điểm cho thấy rằng các vectơ nhất định là trực giao và sau đó sử dụng định lý Pythagore.

Chúng ta hãy xem xét hồi quy tuyến tính đa biến . Chúng tôi biết rằng công cụ ước tính OLS là . Bây giờ hãy xem xét ước tínhY=Xβ+ϵβ^=(XtX)1XtY

Y^=Xβ^=X(XtX)1XtY=HY (Ma trận H còn được gọi là ma trận "mũ")

Trong đó là ma trận chiếu trực giao của Y lên . Bây giờ chúng tôi cóHS(X)

YY^=YHY=(IH)Y

trong đó là ma trận chiếu lên phần bù trực giao của là . Do đó, chúng ta biết rằng và là trực giao.(IH)S(X)S(X)YY^Y^

Bây giờ hãy xem xét một mô hình conY=X0β0+ϵ

trong đó và tương tự, chúng tôi có công cụ ước tính OLS và ước tính và với ma trận chiếu lên . Tương tự như vậy, chúng ta có và là trực giao. Và bây giờX=[X0|X1]β0^Y0^H0S(X0)YY0^Y0^

Y^Y0^=HYH0Y=HYH0HY=(IH0)HY

trong đó một lần nữa là ma trận chiếu trực giao trên phần bù của là . Do đó, chúng ta có tính trực giao của và . Vì vậy, cuối cùng chúng ta có(IH0)S(X0)S(X0)Y^Y0^Y0^

||YY^||2=||Y||2||Y^||2=||YY0^||2+||Y0^||2||Y^Y0^||2||Y0^||2

và cuối cùng||YY0^||2=||YY^||2+||Y^Y0^||2

Cuối cùng, trung bình chỉ đơn giản là khi xem xét mô hình null .Y¯Y0^Y=β0+e


Cảm ơn bạn vì câu trả lời! S () (như trong S (X) trong bài viết của bạn) là gì?
bluemouse

S(X) là một không gian con sinh ra bởi các cột của ma trậnX
Łukasz Grad
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.