Có một cách thanh lịch / sâu sắc để hiểu bản sắc hồi quy tuyến tính này cho nhiều không?


9

Trong hồi quy tuyến tính, tôi đã bắt gặp một kết quả thú vị rằng nếu chúng ta phù hợp với mô hình

E[Y]=β1X1+β2X2+c,

sau đó, nếu chúng tôi chuẩn hóa và căn giữa dữ liệu Y , X1X2 ,

R2=Cor(Y,X1)β1+Cor(Y,X2)β2.

Cảm giác này đối với tôi giống như một phiên bản 2 biến của R2=Cor(Y,X)2 cho hồi quy y=mx+c , rất dễ chịu.

Nhưng bằng chứng duy nhất tôi biết không phải là dù mang tính xây dựng hay sâu sắc (xem bên dưới), và khi nhìn vào nó, cảm giác như nó có thể dễ hiểu.

Ví dụ suy nghĩ:

  • Các tham số β1β2 cung cấp cho chúng tôi 'tỷ lệ' của X1X2 trong Y và vì vậy chúng tôi đang lấy tỷ lệ tương ứng của chúng ...
  • Các β của mối tương quan một phần, R2 là nhiều mối tương quan bình phương ... mối tương quan nhân với hệ số tương quan một phần ...
  • Nếu chúng ta trực giao hóa trước thì β s sẽ là Cov/Var ... kết quả này có mang ý nghĩa hình học nào không?

Không ai trong số các chủ đề này dường như dẫn đến bất cứ nơi nào cho tôi. Bất cứ ai có thể cung cấp một lời giải thích rõ ràng về cách hiểu kết quả này.


Bằng chứng không hài lòng

R2= =SSregSSTot= =SSregN= =(β1X1+β2X2)2= =β12X12+β22X22+2β1β2X1X2

Cor(Y,X1)β1+Cor(Y,X2)β2= =YX1β1+YX2β2= =β1X12+β2X1X2β1+β1X1X2+β2X22β2= =β12X12+β22X22+2β1β2X1X2

QED.


Bạn phải sử dụng các biến được tiêu chuẩn hóa, vì nếu không, công thức của bạn cho không được đảm bảo nằm giữa và . Mặc dù giả định này được đưa ra trong bằng chứng của bạn, nhưng nó sẽ giúp làm cho nó rõ ràng ngay từ đầu. Tôi cũng bối rối về những gì bạn đang thực sự làm: của bạn rõ ràng chỉ là một chức năng của mô hình - không liên quan gì đến dữ liệu - nhưng bạn bắt đầu đề cập rằng bạn đã "khớp" mô hình với một cái gì đó . 0 1 R 2R201R2
whuber

Không phải kết quả hàng đầu của bạn chỉ giữ nếu X1 & X2 hoàn toàn không tương thích?
gung - Phục hồi Monica

@gung Tôi không nghĩ vậy - bằng chứng ở phía dưới dường như nói rằng nó hoạt động bất kể. Kết quả này cũng làm tôi ngạc nhiên, do đó muốn có một "bằng chứng hiểu biết rõ ràng"
Korone

@whuber Tôi không chắc ý của bạn là "chức năng của mô hình"? Tôi chỉ đơn giản có nghĩa là cho OLS đơn giản với hai biến dự đoán. Tức là đây là phiên bản 2 biến củaR 2 = C o r ( Y , X ) 2R2R2=Cor(Y,X)2
Korone

Tôi không thể biết liệu của bạn là tham số hay ước tính. βTôi
whuber

Câu trả lời:


9

Ma trận mũ là idempotent.

(Đây là một cách đại số tuyến tính cho biết OLS là hình chiếu trực giao của vectơ đáp ứng lên không gian được kéo dài bởi các biến.)


Nhớ lại rằng theo định nghĩa

R2= =ESSTSS

Ở đâu

ESS= =(Y^)'Y^

là tổng bình phương của các giá trị dự đoán (ở giữa) và

TSS= =Y'Y

là tổng bình phương của các giá trị đáp ứng (ở giữa). Chuẩn hóa trước cho phương sai đơn vị cũng ngụ ýY

TSS= =Y'Y= =n.

Nhớ lại, các hệ số ước tính được đưa ra bởi

β^= =(X'X)-X'Y,

từ đâu

Y^= =Xβ^= =X(X'X)-X'Y= =HY

nơi là "ma trận mũ" thực hiện việc chiếu của vào bình phương nhỏ nhất của nó phù hợp với . Nó là đối xứng (rõ ràng từ chính hình thức của nó) và idempotent . Dưới đây là một bằng chứng về sau cho những người không quen với kết quả này. Nó chỉ xáo trộn dấu ngoặc đơn xung quanh:YHYY^

H'H= =HH= =(X(X'X)-X')(X(X'X)-X')= =X(X'X)-(X'X)(X'X)-X'= =X(X'X)-X'= =H.

vì thế

R2= =ESSTSS= =1n(Y^)'Y^= =1nY'H'HY= =1nY'HY= =(1nY'X)β^.

Di chuyển quan trọng ở giữa đã sử dụng tính không thay đổi của ma trận mũ. Phía bên tay phải là công thức kỳ diệu của bạn bởi vì là (hàng) vector của hệ số tương quan giữa và các cột của .1nY'XYX


(+1) Viết rất hay. Nhưng tại sao ^{-}thay vì ^{-1}ở khắp mọi nơi?
amip

1
@amoeba Đó là một nghịch đảo tổng quát , đặt ở đó để xử lý các trường hợp có thể là số ít. X'X
whuber

4
@amoeba Penrose, trong bài báo gốc của mình ( A Generalized Inverse for Matrices , 1954) đã sử dụng ký hiệu . Tôi không thích cả ký hiệu vì chúng quá dễ bị nhầm lẫn với liên hợp, hoán vị hoặc liên hợp, trong khi ký hiệu rất gợi ý người đọc thông thường có thể thoát khỏi suy nghĩ về nó là nếu họ thích. Bạn chỉ là một người đọc quá tốt - nhưng cảm ơn vì đã chú ý. MộtMột+Một-Một-1
whuber

1
Động lực thú vị và hấp dẫn, nhưng tôi có thể hỏi nếu ký hiệu này là thứ đôi khi được sử dụng ở nơi khác hoặc nó là phát minh của riêng bạn?
amip

5
@amoeba: Vâng, ký hiệu này xuất hiện ở nơi khác, kể cả trong các văn bản cổ điển của Graybill trên mô hình tuyến tính.
Đức hồng y

4

Ba công thức sau đây được biết đến, chúng được tìm thấy trong nhiều cuốn sách về hồi quy tuyến tính. Không khó để lấy được chúng.

β1= =rYX1-rYX2rX1X21-rX1X22

β2= =rYX2-rYX1rX1X21-rX1X22

R2= =rYX12+rYX22-2rYX1rYX2rX1X21-rX1X22

Nếu bạn thay thế hai betas vào phương trình của bạn , bạn sẽ nhận được công thức trên cho bình phương R.R2= =rYX1β1+rYX2β2


Đây là một "cái nhìn sâu sắc" hình học. Dưới đây là hai hình ảnh cho thấy hồi quy của theo X 1X 2 . Kiểu biểu diễn này được gọi là các biến như các vectơ trong không gian chủ đề (vui lòng đọc nội dung của nó). Các hình ảnh được vẽ sau khi tất cả ba biến được căn giữa và vì vậy (1) mỗi chiều dài của vectơ = st. độ lệch của biến tương ứng và (2) góc (cosin của nó) giữa mỗi hai vectơ = tương quan giữa các biến tương ứng.YX1X2

nhập mô tả hình ảnh ở đây

là dự đoán hồi quy (chiếu trực giao củaYlên "máy bay X"); elà thuật ngữ lỗi; cosY Y =| Y | /| Y| , hệ số tương quan nhiều.Y^YecoSYY^= =|Y^|/|Y|

Bức tranh mô tả trái tọa độ nghiêng của Y trên các biến X 1X 2 . Chúng ta biết rằng tọa độ như vậy liên quan đến các hệ số hồi quy. Cụ thể, tọa độ là: b 1 | X 1 | = b 1 σ X 1b 2 | X 2 | = b 2 σ X 2 .Y^X1X2b1|X1|= =b1σX1b2|X2|= =b2σX2

Và hình bên phải hiển thị tọa độ vuông góc tương ứng . Chúng ta biết rằng các tọa độ như vậy liên quan đến các hệ số tương quan bậc 0 (đây là các cosin của các phép chiếu trực giao). Nếu là mối tương quan giữa YX 1r * 1 là mối tương quan giữa YX 1 sau đó tọa độ là r 1 | Y | = r 1 σ Y = r 1 | Y | = rr1YX1r1*Y^X1 . Tương tự như vậy đối với tọa độ khác,r2| Y| =r2σY=r2 | Y | =R * 2 σ Y .r1|Y|=r1σY=r1|Y^|=r1σY^r2|Y|=r2σY=r2|Y^|=r2σY^

Cho đến nay nó đã được giải thích chung về biểu diễn vector hồi quy tuyến tính. Bây giờ chúng ta chuyển sang cho công việc để chứng tỏ nó có thể dẫn đến .R2=r1β1+r2β2

Trước hết, hãy nhớ lại rằng trong câu hỏi của họ @Corone đưa ra điều kiện là biểu thức là đúng khi cả ba biến được chuẩn hóa , nghĩa là, không chỉ tập trung mà còn được chia tỷ lệ thành phương sai 1. Sau đó (nghĩa là là "phần làm việc" của vectơ) ta có tọa độ bằng: b 1 | X 1 | = β 1 ; b 2 | X 2 | = β 2 ;|X1|=|X2|=|Y|=1b1|X1|=β1b2|X2|=β2 ; r 2 | Y | = r 2 ; cũng như R = | Y | / | Y | = | Y | . Vẽ lại, trong những điều kiện này, chỉ là "mặt phẳng X" của các hình trên:r1|Y|=r1r2|Y|=r2R=|Y^|/|Y|=|Y^|

nhập mô tả hình ảnh ở đây

Y^RP=SCPpoints X axesSCaxes X axes

X1X2r12r1=β1+β2r12r2=β1r12+β2

rβR2=r1β1+r2β2R2=β12+β22+2β1β2r12 β1β2r12

Điều này cũng đúng với bất kỳ số lượng dự đoán X. Thật không may, không thể vẽ các bức tranh giống nhau với nhiều dự đoán.


1
+1 cũng rất vui khi thấy nó được xây dựng theo cách này, nhưng điều này không làm tăng thêm cái nhìn sâu sắc so với câu trả lời của người đánh bóng
Korone

2
@Corone, tôi đã thêm một số "cái nhìn sâu sắc" mà bạn có thể mất.
ttnphns

1
r1=β1+β2r12

Thực sự chỉnh sửa mát mẻ, chuyển đổi được chấp nhận.
Korone
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.