Ảnh hưởng của phản ứng chuyển đổi và biến giải thích trong hồi quy tuyến tính đơn giản


48

Hãy nói rằng có tồn tại một số mối quan hệ "true" giữa yx như vậy mà y=ax+b+ϵ , nơi ab là hằng số và ϵ là iid tiếng ồn bình thường. Khi tôi tạo ngẫu nhiên dữ liệu từ mã R đó: x <- 1:100; y <- ax + b + rnorm(length(x))và sau đó khớp với một mô hình như thế y ~ x, rõ ràng tôi nhận được các ước tính hợp lý tốt cho ab .

(x ~ y)Tuy nhiên, nếu tôi chuyển đổi vai trò của các biến như trong , sau đó viết lại kết quả cho y thành hàm của x , thì độ dốc kết quả luôn dốc hơn (âm hơn hoặc dương hơn) so với ước tính của y ~ xhồi quy. Tôi đang cố gắng để hiểu chính xác lý do tại sao và sẽ đánh giá cao nó nếu bất cứ ai có thể cho tôi một trực giác về những gì đang xảy ra ở đó.


1
Điều đó nói chung không đúng. Có lẽ bạn chỉ nhìn thấy điều đó trong dữ liệu của bạn. Dán mã này: y = rnorm (10); x = rnorm (10); lm (y ~ x); lm (x ~ y); vào R nhiều lần và bạn sẽ thấy nó đi cả hai chiều.
Macro

Điều đó hơi khác so với những gì tôi đã mô tả. Trong ví dụ của bạn, y hoàn toàn không phải là một hàm của x, vì vậy thực sự không có bất kỳ "độ dốc" nào ('a' trong ví dụ của tôi).
Greg Aponte

lm (y ~ x) phù hợp với mô hình y=β0+β1x+ε bởi bình phương tối thiểu (tương đương với ước lượng ML khi lỗi là iid bình thường). Có một con dốc.
Macro

2
Câu hỏi của bạn được hỏi và trả lời (sắp xếp) tại stats.stackexchange.com/questions/13126stats.stackexchange.com/questions/18434 . Tuy nhiên, tôi tin rằng chưa có ai đóng góp một lời giải thích đơn giản, rõ ràng về mối quan hệ giữa (a) hồi quy của Y vs X , (b) hồi quy của X so với Y , (c) phân tích mối tương quan của XY , (d) hồi quy lỗi trong biến của XY và (e) phù hợp với phân phối chuẩn bivariate cho (X,Y) . Đây sẽ là một nơi tốt cho một giải trình như vậy :-).
whuber

2
Tất nhiên Macro là chính xác: bởi vì x và y đóng vai trò tương đương trong câu hỏi, độ dốc nào cực đoan hơn là vấn đề may rủi. Tuy nhiên, hình học gợi ý (không chính xác) rằng khi chúng ta đảo ngược x và y trong hồi quy, chúng ta sẽ có được điểm đối của độ dốc ban đầu. Điều đó không bao giờ xảy ra trừ khi x và y phụ thuộc tuyến tính. Câu hỏi này có thể được hiểu là hỏi tại sao.
whuber

Câu trả lời:


23

Với điểm dữ liệu ( x tôi , y i ) , i = 1 , 2 , ... n , trong mặt phẳng, chúng ta hãy vẽ một đường thẳng y = một x + b . Nếu chúng ta dự đoán một x i + b là giá trị y i của y i , thì lỗi( y i - y i ) = ( yn(xi,yi),i=1,2,ny=ax+baxi+by^iyi ,sai số bình phương ( y i - a x i - b ) 2tổng bình phương lỗin i = 1 ( y i - a x i - b ) 2 . Chúng tôi hỏi(yiy^i)=(yiaxib)(yiaxib)2 i=1n(yiaxib)2

Có gì lựa chọn b Giảm thiểu S = n Σ i = 1 ( y i - một x i - b ) 2 ?abS=i=1n(yiaxib)2

là khoảng cách dọc của ( x i , y i ) từ đường thẳng, nên chúng tôi yêu cầu đường thẳng sao cho tổng bình phương của khoảng cách dọc của các điểm từ dòng càng nhỏ càng tốt. Bây giờ S là hàm bậc hai của cả ab và đạt giá trị tối thiểu khi ab sao cho S(yiaxib)(xi,yi)Sabab Từ phương trình thứ hai, chúng tôi nhận b=1

Sa=2i=1n(yiaxib)(xi)=0Sb=2i=1n(yiaxib)(1)=0
trong đó μy=1
b=1ni=1n(yiaxi)=μyaμx
là các giá trị trung bình số học củayixi. Thay vào phương trình đầu tiên, ta được a=( 1μy=1ni=1nyi, μx=1ni=1nxiyixi Do đó, dòng thu nhỏScó thể được biểu thị là y=ax+b=μy+((1
a=(1ni=1nxiyi)μxμy(1ni=1nxi2)μx2.
S
y=ax+b=μy+((1ni=1nxiyi)μxμy(1ni=1nxi2)μx2)(xμx),
S
Smin=[(1ni=1nyi2)μy2][(1ni=1nxi2)μx2][(1ni=1nxiyi)μxμy]2(1ni=1nxi2)μx2.

Nếu chúng ta trao đổi vai trò của và , hãy vẽ một đường và yêu cầu các giá trị của và làm giảm thiểu nghĩa là chúng ta muốn đường thẳng sao cho tổng bình phương của khoảng cách ngang của các điểm từ dòng càng nhỏ càng tốt, sau đó chúng tôi nhận đượcxyx=a^y+b^a^b^

T=i=1n(xia^yib^)2,

x=a^y+b^=μx+((1ni=1nxiyi)μxμy(1ni=1nyi2)μy2)(yμy)
và giá trị tối thiểu của là T
Tmin=[(1ni=1nyi2)μy2][(1ni=1nxi2)μx2][(1ni=1nxiyi)μxμy]2(1ni=1nyi2)μy2.

Lưu ý rằng cả hai dòng đều đi qua điểm nhưng các sườn là nói chung là khác nhau. Thật vậy, như @whuber chỉ ra trong một nhận xét, các sườn giống nhau khi tất cả các điểm nằm trên cùng một đường thẳng. Để thấy điều này, lưu ý rằng (μx,μy)

a=(1ni=1nxiyi)μxμy(1ni=1nxi2)μx2,  a^1=(1ni=1nyi2)μy2(1ni=1nxiyi)μxμy
(xi,yi)
a^1a=Smin(1ni=1nxiyi)μxμy=0Smin=0yi=axi+b,i=1,2,,n.

Cảm ơn! abs (tương quan) <1 giải thích tại sao độ dốc có hệ thống dốc hơn trong trường hợp đảo ngược.
Greg Aponte

(+1) nhưng tôi đã thêm một câu trả lời chỉ bằng một minh họa về những gì bạn vừa nói, vì tôi có đầu óc hình học :)
Elvis

Trả lời lớp học (+1)
Digio

39

Chỉ để minh họa câu trả lời của Dilip: trên các hình ảnh sau đây,

  • các chấm đen là các điểm dữ liệu;
  • ở bên trái, đường màu đen là đường hồi quy thu được bằng cách thu y ~ xnhỏ các ô vuông có độ dài của các đoạn màu đỏ;
  • ở bên phải, đường màu đen là đường hồi quy thu được bằng cách thu x ~ ynhỏ các ô vuông có độ dài của các đoạn màu đỏ.

đường hồi quy

Chỉnh sửa (hồi quy hình chữ nhật tối thiểu)

Nếu không có cách tự nhiên nào để chọn "phản hồi" và "đồng biến", mà là hai biến phụ thuộc lẫn nhau, bạn có thể muốn giữ vai trò đối xứng cho và ; trong trường hợp này, bạn có thể sử dụng "hồi quy hình chữ nhật tối thiểu."yx

  • viết , như thường lệ;Y=aX+b+ϵ
  • biểu thị và các ước tính của điều kiện cho và của điều kiện với ;y^i=axi+bx^i=1a(yib)YiX=xiXiY=yi
  • thu nhỏ, dẫn đến i|xix^i||yiy^i|
    y^=sign(cov(x,y))σ^yσ^x(xx¯)+y¯.

Dưới đây là một minh họa với cùng một điểm dữ liệu, cho mỗi điểm, một "hình chữ nhật" được tính là tích của hai đoạn màu đỏ và tổng các hình chữ nhật được thu nhỏ. Tôi không biết nhiều về các thuộc tính của hồi quy này và tôi không tìm thấy nhiều với google.

hình chữ nhật nhỏ nhất


14
Một số lưu ý: ( 1 ) Trừ khi tôi nhầm, có vẻ như "hồi quy hình chữ nhật nhỏ nhất" tương đương với giải pháp thu được từ việc lấy thành phần chính đầu tiên trên ma trận sau khi căn giữa và thay đổi kích thước để có phương sai đơn vị và sau đó backsubstituting. (tt)X=(y,x)
Đức hồng y

14
(tt) ( 2 ) Đã xem theo cách này, dễ dàng nhận thấy rằng "hồi quy hình chữ nhật nhỏ nhất" này tương đương với một dạng bình phương trực giao (hoặc tổng) nhỏ nhất và do đó, ( 3 ) Một trường hợp đặc biệt của hồi quy Deming trên các vectơ trung tâm, được định cỡ lại lấy . Bình phương tối thiểu trực giao có thể được coi là "hồi quy vòng tròn nhỏ nhất". δ=1
Đức hồng y

2
@cardinal Bình luận rất thú vị! (+1) Tôi tin rằng trục chính (giảm thiểu khoảng cách vuông góc giữa đường reg và tất cả các điểm, à la PCA) hoặc giảm hồi quy trục chính hoặc hồi quy loại II như được minh họa trong gói lmodel2 R của P Legendre, cũng có liên quan ở đây vì các kỹ thuật này được sử dụng khi khó có thể nói vai trò nào (phản hồi hoặc dự đoán) đóng từng biến hoặc khi chúng ta muốn tính đến các lỗi đo lường.
chl

1
@chl: (+1) Có, tôi tin rằng bạn đúng và trang Wikipedia trên tổng bình phương tối thiểu liệt kê một số tên khác cho cùng một quy trình, không phải tất cả những gì tôi quen thuộc. Nó dường như quay trở lại ít nhất R. Frisch, Phân tích hợp lưu thống kê bằng các hệ thống hồi quy hoàn chỉnh , Đại học Økonomiske Instituut, 1934 nơi nó được gọi là hồi quy chéo .
Đức hồng y

3
@cardinal Tôi nên cẩn thận hơn khi đọc mục Wikipedia ... Để tham khảo trong tương lai, đây là hình ảnh được chụp từ Thiết kế và phân tích sinh học bằng R , của M. Logan (Wiley, 2010; Hình 8.4, trang 174) , trong đó tóm tắt các cách tiếp cận khác nhau, giống như minh họa đẹp của Elvis.
chl

13

Chỉ cần một lưu ý ngắn gọn về lý do tại sao bạn thấy độ dốc nhỏ hơn cho một hồi quy. Cả hai độ dốc phụ thuộc vào ba số: độ lệch chuẩn của và ( và ) và mối tương quan giữa và ( ). Hồi quy với là phản hồi có độ dốc và hồi quy với là phản hồi có độ dốc , do đó tỷ lệ của độ dốc thứ nhất so với nghịch đảo của lần thứ hai bằng .xysxsyxyryrsysxxrsxsyr21

Vì vậy, tỷ lệ phương sai được giải thích càng lớn, độ dốc thu được từ mỗi trường hợp càng gần. Lưu ý rằng tỷ lệ phương sai được giải thích là đối xứng và bằng với tương quan bình phương trong hồi quy tuyến tính đơn giản.


1

Một cách đơn giản để xem xét điều này là lưu ý rằng, nếu đối với mô hình thực sự , bạn chạy hai hồi quy:y=α+βx+ϵ

  • y=ayx+byxx
  • x=axy+bxyy

Sau đó, chúng tôi có, sử dụng :byx=cov(x,y)var(x)=cov(x,y)var(y)var(y)var(x)

byx=bxyvar(y)var(x)

Vì vậy, việc bạn có được độ dốc cao hơn hay không chỉ phụ thuộc vào tỷ lệ . Tỷ lệ này bằng, dựa trên mô hình đúng giả định:var(y)var(x)

var(y)var(x)=β2var(x)+var(ϵ)var(x)

Liên kết với các câu trả lời khác

Bạn có thể kết nối kết quả này với câu trả lời từ những người khác, họ nói rằng khi , nó sẽ là đối ứng. Thật vậy, , và cũng, (không có lỗi ước tính), do đó:R2=1R2=1var(ϵ)=0byx=β

R2=1byx=bxyβ2var(x)+0var(x)=bxyβ2

Vậybxy=1/β


0

Nó trở nên thú vị khi có tiếng ồn trên đầu vào của bạn (mà chúng ta có thể tranh luận luôn luôn như vậy, không có lệnh hay quan sát nào là hoàn hảo).

Tôi đã xây dựng một số mô phỏng để quan sát hiện tượng, dựa trên mối quan hệ tuyến tính đơn giản , với nhiễu Gaussian trên cả x và y. Tôi đã tạo các quan sát như sau (mã python):x=y

x = np.linspace(0, 1, n)
y = x

x_o = x + np.random.normal(0, 0.2, n)
y_o = y + np.random.normal(0, 0.2, n)

Xem các kết quả khác nhau (odr ở đây là hồi quy khoảng cách trực giao , nghĩa là giống như hồi quy hình chữ nhật nhỏ nhất):

nhập mô tả hình ảnh ở đây

Tất cả các mã nằm trong đó:

https://gist.github.com/jclevesque/5273ad9077d9ea93994f6d96c20b0ddd


0

Đường hồi quy không (luôn luôn) giống như mối quan hệ thực sự

Bạn có thể có một số mối quan hệ nhân quả 'thật' như

y=a+bx+ϵ

nhưng các đường hồi quy được trang bị y ~ xhoặc x ~ ykhông có nghĩa giống như mối quan hệ nhân quả đó (ngay cả khi trong thực tế, biểu thức cho một trong các đường hồi quy có thể trùng với biểu thức cho mối quan hệ 'đúng' nguyên nhân)


Mối quan hệ chính xác hơn giữa các sườn

Đối với hai hồi quy tuyến tính đơn giản chuyển đổi:

Y=a1+b1XX=a2+b2Y

bạn có thể liên hệ các sườn dốc như sau:

b1=ρ21b21b2

Vì vậy, các sườn không phải là nghịch đảo lẫn nhau.


Trực giác

Lý do là

  • Các đường hồi quy và tương quan không nhất thiết phải tương ứng một đối một với mối quan hệ nhân quả.
  • Các đường hồi quy liên quan trực tiếp hơn đến xác suất có điều kiện hoặc dự đoán tốt nhất.

Bạn có thể tưởng tượng rằng xác suất có điều kiện liên quan đến sức mạnh của mối quan hệ. Các đường hồi quy phản ánh điều này và độ dốc của các đường có thể vừa nông khi độ mạnh của mối quan hệ nhỏ hoặc cả hai dốc khi độ mạnh của mối quan hệ mạnh. Các sườn không chỉ đơn giản là nghịch đảo lẫn nhau.

Thí dụ

Nếu hai biến và liên quan với nhau bởi mối quan hệ tuyến tính (nguyên nhân) thì bạn có thể tưởng tượng rằng sẽ không tốt khi đảo ngược hoàn toàn mối quan hệ đó trong trường hợp bạn muốn thể hiện dựa trên giá trị .XY

Y=a little bit of X+ a lot of error
XY

Thay vì

X=a lot of Y+ a little of error

nó sẽ tốt hơn để sử dụng

X=a little bit of Y+ a lot of error

Xem các phân phối ví dụ sau với các đường hồi quy tương ứng của chúng. Các bản phân phối là đa biến thông thường với vàΣ11Σ22=1Σ12=Σ21=ρ

thí dụ

Các giá trị dự kiến ​​có điều kiện (những gì bạn sẽ nhận được trong hồi quy tuyến tính) là

E(Y|X)=ρXE(X|Y)=ρY

và trong trường hợp này với một phân phối chuẩn nhiều biến số, thì các phân phối biên làX,Y

YN(ρX,1ρ2)XN(ρY,1ρ2)

Vì vậy, bạn có thể thấy biến Y là một phần và một phần nhiễu có phương sai . Điều tương tự cũng đúng theo cách khác.ρX1ρ2

Hệ số tương quan càng lớn, hai đường sẽ càng gần nhau. Nhưng mối tương quan càng thấp, mối quan hệ càng mạnh mẽ, các đường sẽ càng dốc (điều này đúng cho cả hai dòng và )ρY ~ XX ~ Y


0

Câu trả lời ngắn

Mục tiêu của hồi quy tuyến tính đơn giản là đưa ra các dự đoán tốt nhất về ybiến, các giá trị đã cho của xbiến. Đây là một mục tiêu khác với việc cố gắng đưa ra dự đoán tốt nhất về xbiến, cho các giá trị của ybiến.

Hồi quy tuyến tính đơn giản y ~ xcung cấp cho bạn mô hình 'tốt nhất' có thể để dự đoán yđược đưa ra x. Do đó, nếu bạn phù hợp với một mô hình cho x ~ yvà đại số đảo ngược nó, mô hình đó có thể làm tốt nhất chỉ là mô hình cho y ~ x. Nhưng việc đảo ngược một mô hình phù hợp x ~ ythường sẽ làm tồi tệ hơn trong việc dự đoán yđược đưa ra x, so với y ~ xmô hình 'tối ưu' , bởi vì " x ~ ymô hình đảo ngược " được tạo ra để thực hiện một mục tiêu khác.

Hình minh họa

Hãy tưởng tượng bạn có bộ dữ liệu sau:

nhập mô tả hình ảnh ở đây

Khi bạn chạy hồi quy OLS y ~ x, bạn sẽ đưa ra mô hình sau

y = 0.167 + 1.5*x

Điều này tối ưu hóa các dự đoán ybằng cách đưa ra các dự đoán sau, có các lỗi liên quan:

nhập mô tả hình ảnh ở đây

Dự đoán của hồi quy OLS là tối ưu theo nghĩa là tổng các giá trị trong cột ngoài cùng bên phải (nghĩa là tổng bình phương) càng nhỏ càng tốt.

Khi bạn chạy hồi quy OLS x ~ y, bạn sẽ đưa ra một mô hình khác:

x = -0.07 + 0.64*y

Điều này tối ưu hóa các dự đoán của x bằng cách đưa ra các dự đoán sau, với các lỗi liên quan.

nhập mô tả hình ảnh ở đây

Một lần nữa, điều này là tối ưu theo nghĩa là tổng các giá trị của cột ngoài cùng bên phải càng nhỏ càng tốt (bằng 0.071).

Bây giờ, hãy tưởng tượng bạn đã cố gắng đảo ngược mô hình đầu tiên y = 0.167 + 1.5*x, bằng cách sử dụng đại số, đưa cho bạn mô hình x = -0.11 + 0.67*x.

Điều này sẽ cung cấp cho bạn các dự đoán sau đây và các lỗi liên quan:

nhập mô tả hình ảnh ở đây

Tổng các giá trị trong cột ngoài cùng bên phải 0.074là lớn hơn tổng tương ứng từ mô hình bạn nhận được từ hồi quy x trên y, tức là x ~ ymô hình. Nói cách khác, " y ~ xmô hình đảo ngược " đang làm một công việc tồi tệ hơn trong việc dự đoán x so với mô hình OLS của x ~ y.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.