Trong hồi quy tuyến tính đa biến, tại sao một biểu đồ các điểm dự đoán không nằm trên một đường thẳng?


16

Tôi đang sử dụng nhiều hồi quy tuyến tính để mô tả mối quan hệ giữa Y và X1, X2.

Từ lý thuyết tôi đã hiểu rằng nhiều hồi quy giả định mối quan hệ tuyến tính giữa Y và mỗi X (Y và X1, Y và X2). Tôi không sử dụng bất kỳ chuyển đổi nào của X.

Vì vậy, tôi đã nhận được mô hình với R = 0,45 và tất cả X đáng kể (P <0,05). Sau đó, tôi âm mưu Y chống lại X1. Tôi không hiểu tại sao các vòng tròn màu đỏ là dự đoán của mô hình không tạo thành một đường. Như tôi đã nói trước đây, tôi dự đoán rằng mỗi cặp Y và X được lắp bởi một đường.

nhập mô tả hình ảnh ở đây

Cốt truyện được tạo ra trong python theo cách này:

fig, ax = plt.subplots()
plt.plot(x['var1'], ypred, 'o', validation['var1'], validation['y'], 'ro');
ax.set_title('blue: true,   red: OLS')
ax.set_xlabel('X')
ax.set_ylabel('Y')
plt.show()

1
Bạn có thể gửi mã bạn đã sử dụng cho cốt truyện / phân tích. Các đường màu đỏ và màu xanh trông giống như sự hốt hoảng của nhau. Vì vậy, đằng sau âm mưu này có thể giúp trả lời vấn đề của bạn tốt hơn.
Dawny33

Bạn sẽ chỉ mong đợi một dòng nếu (i) giá trị của yếu tố dự đoán được giả sử là giống nhau cho từng điểm dự đoán (và nếu bạn thử giả sử các giá trị khác nhau của x 2 thì bạn sẽ nhận được một dòng khác nhau) hoặc ( ii) nếu bạn sử dụng dự đoán cho dữ liệu thực tế của mình, nhưng "hết một phần" (nghĩa là bù cho) các biến thể trong x 2 , đó là biểu đồ hồi quy một phần hoặc biểu đồ biến được thêm vào để làm gì. Không biết chính xác bạn đã xây dựng cốt truyện này như thế nào, không thể biết vấn đề của bạn là gì, như @ dawny33 nóix2x2x2
Silverfish

Tôi nghĩ nhận xét của @Silverfish là chính xác; trong ba chiều đại diện cho một chiếc máy bay P . Nếu bạn giảm xuống hai chiều thì bạn 'chiếu' mặt phẳng theo ba chiều ( P ) vào mặt phẳng eg ( y , x 1 ) , đây sẽ chỉ là một đường thẳng nếu P trực giao với mặt phẳng ( y , x 1 ) . y=β0+β1x1+β2x2PP(y,x1)P(y,x1)

@ Dawny33: đã đăng.
Klausos

@f coppens: Cảm ơn. Vậy thì tại sao tài liệu nói rằng một mô hình hồi quy tuyến tính đa giả định mối quan hệ tuyến tính giữa Y và mỗi X (Y và X1, Y và X2)?
Klausos

Câu trả lời:


33

Giả sử phương trình hồi quy bội của bạn là

y^=2x1+5x2+3

nơi y có nghĩa là "dự đoán y ".y^y

Bây giờ chỉ lấy những điểm mà . Sau đó, nếu bạn vẽ y chống lại x 1 , những điểm này sẽ thỏa mãn phương trình:x2=1y^x1

y^=2x1+5(1)+3=2x1+8

Vì vậy, họ phải nằm trên một đường dốc 2 và với intercept 8.y

Bây giờ lấy những điểm mà . Khi bạn vẽ y chống lại x 1 , sau đó những điểm thoả mãn:x2=2y^x1

y^=2x1+5(2)+3=2x1+13

Vì vậy, đó là một đường dốc 2 và với intercept 13. Bạn có thể tự xác minh rằng nếu x 2 = 3 thì bạn nhận được một đường dốc 2 khác và y- intercept là 18.yx2=3y

Chúng ta thấy rằng các điểm có giá trị khác nhau của sẽ nằm trên các đường khác nhau, nhưng tất cả đều có cùng độ dốc: ý nghĩa của hệ số 2 x 1 trong phương trình hồi quy ban đầu là, ceteris paribus tức là giữ hằng số dự đoán khác, một đơn vị tăng x 1 tăng dự đoán trung bình phản ứng y bởi hai đơn vị, trong khi ý nghĩa của đánh chặn của 3 trong phương trình hồi quy là khi x 1 = 0x 2 = 0 thì phản ứng trung bình dự đoán là 3x22x1x1y^3x1=0x2=03. Nhưng không phải tất cả các điểm của bạn đều có cùng , điều đó có nghĩa là chúng nằm trên các đường có một phần chặn khác nhau - dòng đó chỉ có khả năng chặn 3 đối với những điểm mà x 2 = 0 . Vì vậy, thay vì nhìn thấy một dòng duy nhất, bạn có thể thấy (nếu chỉ có một số giá trị nhất định của x 2 xảy ra, ví dụ nếu x 2 luôn là số nguyên), một chuỗi các "đường chéo" chéo. Hãy xem xét các dữ liệu sau, nơi y = 2 x 1 + 5 x 2 + 3 .x23x2=0x2x2y^=2x1+5x2+3

Trước khi thêm dòng

Ở đây có những "vệt" dễ nhận biết. Bây giờ nếu tôi tô màu ở những điểm mà là các vòng tròn màu đỏ, x 2 = 2 là các hình tam giác vàng và x 2 = 3 là các hình vuông màu xanh, chúng ta thấy chúng nằm trên ba đường thẳng khác nhau, tất cả đều có độ dốc 2 và y- inter accept 8, 13 và 18 như đã tính ở trên. Tất nhiên, nếu x 2 không bị hạn chế lấy các giá trị nguyên hoặc tình huống phức tạp do các biến dự đoán khác được đưa vào hồi quy, thì vệt chéo sẽ ít rõ ràng hơn, nhưng vẫn sẽ là trường hợp mà mỗi điểm dự đoán nằm trên một dòng riêng biệtx2=1x2=2x2=3yx2dựa trên các giá trị của các yếu tố dự đoán khác không được hiển thị trên biểu đồ .

Sau khi thêm dòng

yx1x2y^=2x1+5x2+3yx1x2yx1-axis chỉ về phía bên phải của bạn.

Cốt truyện 3d

yy

y^x1x2x2y^x1x2yx1 x2yx1

Mã cho các ô R

library(scatterplot3d)

data.df <- data.frame(
  x1 = c(0,2,4,5,8, 1,3,4,7,8, 0,3,5,6,7),
  x2 = c(1,1,1,1,1, 2,2,2,2,2, 3,3,3,3,3)
)

data.df$yhat <- with(data.df, 2*x1 + 5*x2 + 3)

data1.df <- data.df[data.df$x2==1,]
data2.df <- data.df[data.df$x2==2,]
data3.df <- data.df[data.df$x2==3,]

#Before lines added    
mar.default <- c(5,4,4,2) + 0.1
par(mar = mar.default + c(0, 1, 0, 0)) 
plot(data.df[c("x1","yhat")], main=expression("Predicted y against "*x[1]),
     xlab=expression(x[1]), ylab=expression(hat(y)))

#After lines added
plot(data.df[c("x1","yhat")], main=expression("Predicted y against "*x[1]),
     xlab=expression(x[1]), ylab=expression(hat(y)), pch=".")
points(data1.df[c("x1","yhat")], pch=19, col="red")
abline(lm(yhat ~ x1, data=data1.df), col="red")
points(data2.df[c("x1","yhat")], pch=17, col="gold")
abline(lm(yhat ~ x1, data=data2.df), col="gold")
points(data3.df[c("x1","yhat")], pch=15, col="blue")
abline(lm(yhat ~ x1, data=data3.df), col="blue")

#3d plot
myPlot <- scatterplot3d(data.df, pch=".", xlab=expression(x[1]),
                        ylab=expression(x[2]), zlab=expression(hat(y)),
                        main=expression("Predicted y against "*x[1]*" and "*x[2]))
myPlot$plane3d(Intercept=3, x.coef=2, y.coef=5, col="darkgrey")
myPlot$points3d(data1.df, pch=19, col="red")
myPlot$points3d(data2.df, pch=17, col="gold")
myPlot$points3d(data3.df, pch=15, col="blue")
print(myPlot)

Chỉ một câu hỏi nhỏ: Bằng cách nói máy bay, bạn cũng có nghĩa là một mặt phẳng có thể có một số độ cong?
Klausos

Nó có nghĩa là một mặt phẳng "phẳng". Tôi sẽ thêm một hình ảnh để minh họa sau.
Cá bạc

2
Tôi đang tham gia câu hỏi này chỉ để tôi có thể quay lại những âm mưu tuyệt vời này
Shadowtalker
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.