Hồi quy với biến độc lập nghịch đảo


10

Giả sử tôi có -vector của các biến phụ thuộc và -vector của biến độc lập. Khi được vẽ với , tôi thấy rằng có một mối quan hệ tuyến tính (xu hướng tăng) giữa hai. Bây giờ, điều này cũng có nghĩa rằng có một xu hướng giảm tuyến tính giữa và .Y N X Y 1NYNXY YX1XYX

Bây giờ, nếu tôi chạy hồi quy: và nhận giá trị được trang bịY = β XY=βX+ϵY^=β^X

Sau đó, tôi chạy hồi quy: và nhận giá trị được trang bị ~ Y = α 1Y=α1X+ϵY~=α^1X

Hai giá trị dự đoán, và có xấp xỉ bằng nhau không? ~ YY^Y~

Câu trả lời:


10

 Khi Y được vẽ với , tôi thấy rằng có một mối quan hệ tuyến tính (xu hướng tăng) giữa hai. Bây giờ, điều này cũng có nghĩa là có một xu hướng giảm tuyến tính giữa Y và X1X

Câu cuối cùng là sai: có một xu hướng giảm, nhưng nó không có nghĩa là tuyến tính: Y ~ 1 / X Y ~ X

Tôi sử dụng một là hàm cộng với một chút tiếng ồn trên . Như bạn có thể thấy, trong khi âm mưu chống lại mang lại hành vi tuyến tính, chống lại xa tuyến tính. YY1f(x)=1xYY YX1XYX

(@whuber chỉ ra rằng âm mưu chống lại không có vẻ tương đồng. Tôi nghĩ rằng nó dường như có phương sai cao hơn cho thấp vì mật độ trường hợp cao hơn nhiều dẫn đến phạm vi lớn hơn về cơ bản là những gì chúng ta Trên thực tế, dữ liệu là homoscedastic: Tôi đã sử dụng để tạo dữ liệu, do đó không phụ thuộc vào kích thước của )1Y YX1XYY = 1 / X + rnorm (length (X), sd = 0.1)X

Vì vậy, nói chung mối quan hệ là rất nhiều phi tuyến tính. Đó là, trừ khi phạm vi của bạn quá hẹp để bạn có thể xấp xỉĐây là một ví dụ:d 1Xd1xdx=1x2const.

Y ~ 1 / X Y ~ X

Điểm mấu chốt:

  • Nói chung, rất khó để ước tính hàm bằng hàm tuyến tính hoặc đa thức. Và không có thời hạn bù, bạn sẽ không bao giờ có được xấp xỉ hợp lý.1X
  • Nếu khoảng đủ hẹp để cho phép xấp xỉ tuyến tính, dù sao bạn cũng không thể từ dữ liệu để đoán mối quan hệ phải là và không phải tuyến tính ( ).1X X1XX

YXY1/XYX

2
@whuber: Tôi hoàn toàn xin lỗi nhưng có vẻ khá dày đặc ngay bây giờ. Câu hỏi cho biết: "Khi Y được vẽ trên 1 / X, tôi thấy rằng có một mối quan hệ tuyến tính (xu hướng tăng)". Đó là những gì tôi đã cố gắng miêu tả trong hình ảnh thứ 1 và thứ 3: Y trên 1 / X tăng tuyến tính. Sau đó, tôi vẽ Y tương ứng trên X (phi tuyến, giảm). Tôi hiểu nhầm OP ở đâu?
cbeleites không hài lòng với SX 4/12/14

1
Y1/X

Cảm ơn bạn đã quan sát về homoscedasticity. Bằng cách chuyển đổi biến độc lập, bạn không thay đổi tính đồng nhất của phản hồi - nhưng sự xuất hiện của nó chắc chắn có thể thay đổi, như bạn chỉ ra, rất hữu ích khi biết. (Chúng tôi đã thấy hiện tượng này trong một số bài đăng khác, trong đó mọi người thuộc tính không đồng nhất thuộc tính sai đối với sự khác biệt trong dân số nhóm, chẳng hạn.)
whuber

Câu trả lời và ý kiến ​​rất kỹ lưỡng! Cảm ơn @cbeleites và @whuber!
Mayou

2

Tôi thấy không có lý do gì để chúng "gần bằng nhau" nói chung - nhưng chính xác thì ý của bạn là gì bằng nhau?

Đây là một ví dụ về đồ chơi:

library(ggplot2)
n <- 10^3
df <- data.frame(x=runif(n, min=1, max=2))
df$y <- 5 / df$x + rnorm(n)
p <- (ggplot(df, aes(x=x, y=y)) +
      geom_point() +
      geom_smooth(method="lm", formula=y ~ 0 + x) +  # Blue, OP's y hat
      geom_smooth(method="lm", formula=y ~ 0 + I(x^-1), color="red"))  # Red, OP's y tilde
p

Bức tranh:

Tôi muốn nói rằng đây là xa "gần bằng"

Mô hình "màu xanh" sẽ hoạt động tốt hơn nhiều nếu được phép có thuật ngữ chặn (tức là không đổi) ...


Thật khó để nói bạn đang làm gì với mô hình màu xanh, nhưng chắc chắn nó không giống với những gì OP mô tả! Màu đỏ gần hơn với tình huống được trình bày trong câu hỏi.
whuber

Y1/XYXY1/X
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.