mối quan hệ giữa của hồi quy đơn giản và hồi quy bội


10

Một câu hỏi rất cơ bản liên quan đến hồi quy của OLSR2

  1. chạy hồi quy OLS y ~ x1, chúng ta có , giả sử 0,3R2
  2. chạy hồi quy OLS y ~ x2, chúng ta có , giả sử 0,4R2
  3. bây giờ chúng ta chạy hồi quy y ~ x1 + x2, giá trị R của hồi quy này có thể là giá trị nào?

Tôi nghĩ rằng rõ ràng cho hồi quy bội sẽ không dưới 0,4, nhưng liệu nó có thể lớn hơn 0,7 không?R2


2
Gợi ý: Nó có thể cao tới 1.0. Tại sao? (Nghĩ về mặt hình học. Hoặc, thậm chí cụ thể, về vòng tròn đơn vị.)
Hồng y

Câu trả lời:


4

Hồi quy thứ hai có thể chỉ đơn giản là bù cho những gì đầu tiên không quản lý để giải thích trong biến phụ thuộc. Dưới đây là một ví dụ bằng số:

Tạo x1như một hồi quy chuẩn thông thường, cỡ mẫu 20. Không mất tính tổng quát, hãy lấy , trong đó là . Bây giờ, hãy lấy biến hồi quy thứ hai đơn giản là sự khác biệt giữa biến phụ thuộc và biến hồi quy thứ nhất.u i N ( 0 , 1 )yi=0.5x1i+uiuiN(0,1)x2

n <- 20 
x1 <- rnorm(n)

y <- .5*x1 + rnorm(n)

x2 <- y - x1
summary(lm(y~x1))$r.squared
summary(lm(y~x2))$r.squared
summary(lm(y~x1+x2))$r.squared

cảm ơn! Tôi đã hiểu sai về bình phương r. Tôi nghĩ rằng nếu x1 + x2 = ysau đó summary(lm(y~x1))$r.squared + summary(lm(y~x2))$r.squarednên không ít hơn 1. nhưng rõ ràng tôi đã sai ..
Olivier Ma

3

Khác với giới hạn dưới, là 0,3 hoặc 0,4 tùy thuộc vào biến nào được đưa vào mô hình trước, bạn không thể nói gì nhiều. Bao nhiêu tăng phần lớn phụ thuộc vào thông tin mà biến thứ hai mang vào mô hình. Theo thông tin, tất nhiên chúng tôi có nghĩa là sự thay đổi được giải thích trong phản ứng.R2

Có một khái niệm rất quan trọng trong vấn đề đó và đó là mối tương quan giữa các yếu tố dự đoán. Nếu tương quan là lớn, biến mới sẽ không chỉ không mang lại điều gì cho mô hình mà còn làm phức tạp suy luận cho các biến hiện tại của bạn, vì các ước tính sẽ trở nên không chính xác (tính đa hình). Đây là lý do chúng tôi lý tưởng muốn biến mới là trực giao với các biến khác. Cơ hội rất nhỏ để điều này xảy ra trong các nghiên cứu quan sát, nhưng nó có thể được thực hiện trong các cài đặt được kiểm soát, ví dụ như khi bạn đang xây dựng thử nghiệm của riêng mình.

Nhưng làm thế nào để bạn định lượng chính xác thông tin mới mà một biến sẽ mang lại cho mô hình? Một biện pháp được sử dụng rộng rãi mà sẽ đưa tất cả những tính là các phần R2 . Nếu bạn đã quen thuộc với ANOVA của mô hình tuyến tính, thì điều này không gì khác hơn là việc giảm tỷ lệ trong Sum Sum bình phương lỗi mà bạn sẽ thực hiện bằng cách đưa biến này vào mô hình của mình. Tỷ lệ phần trăm cao là mong muốn trong khi những người thấp có thể sẽ khiến bạn suy nghĩ liệu đây có phải là hành động đúng đắn hay không.

Vì vậy, như @cardinal đã chỉ ra trong các nhận xét, hệ số xác định mới của bạn có thể lên tới 1. Nó cũng có thể thấp đến 0.400001. Không có cách nào để nói mà không có thông tin bổ sung.


@ John, bạn có phiền giải thích thêm tại sao nó cần phải lớn hơn 0,4 không? Giải thích hình học của hồi quy sẽ giúp ở đây?
Dnaiel

@Dnaiel Hệ số xác định là không tăng đối với số lượng biến trong mô hình.
JohnK

3

Hệ số xác định trong hồi quy tuyến tính bội: Trong hồi quy tuyến tính bội, hệ số xác định có thể được viết theo các tương quan cặp cho các biến sử dụng dạng bậc hai:

R2=ry,xTrx,x1ry,x,

trong đó là vectơ tương quan giữa vectơ phản hồi và từng vectơ giải thích và là ma trận tương quan giữa các vectơ giải thích (để biết thêm về điều này, hãy xem câu hỏi liên quan này ). Trong trường hợp hồi quy bivariate bạn có:ry,xrx,x

R2= =[rY,X1rY,X2]T[1rX1,X2rX1,X21]-1[rY,X1rY,X2]= =11-rX1,X22[rY,X1rY,X2]T[1-rX1,X2-rX1,X21][rY,X1rY,X2]= =11-rX1,X22(rY,X12+rY,X22-2rX1,X2rY,X1rY,X2).

Bạn đã không chỉ định hướng của các mối tương quan đơn biến trong câu hỏi của mình, vì vậy, không mất tính tổng quát, chúng tôi sẽ biểu thị . Thay thế các giá trị của bạn và mang lại:Dsgn(rY,X1)sgn(rY,X2){-1,+1}rY,X12= =0,3rY,X22= =0,4

R2= =0,7-20,12DrX1,X21-rX1,X22.

Có thể cho , vì có thể thông tin kết hợp từ hai biến sẽ nhiều hơn tổng các phần của nó. Hiện tượng thú vị này được gọi là 'tăng cường' (xem ví dụ, Lewis và Escobar 1986 ).R2>0,7

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.