Trong hồi quy tuyến tính, chúng ta thường nhận được nhiều bình phương R và R. Sự khác biệt giữa chúng là gì?
Trong hồi quy tuyến tính, chúng ta thường nhận được nhiều bình phương R và R. Sự khác biệt giữa chúng là gì?
Câu trả lời:
Vốn (trái ngược với r 2 ) thường là bội số R 2 trong mô hình hồi quy bội. Trong hồi quy tuyến tính bivariate, không có nhiều R và R 2 = r 2 . Vì vậy, một điểm khác biệt là khả năng ứng dụng: "nhiều R " hàm ý nhiều biến hồi quy, trong khi " R 2 " không nhất thiết phải như vậy.
Một sự khác biệt đơn giản là giải thích. Trong hồi quy bội, bội là hệ số tương quan bội , trong khi bình phương của nó là hệ số xác định . R có thể được hiểu một chút giống như một hệ số tương quan bivariate , sự khác biệt chính là sự tương quan nhiều là giữa biến phụ thuộc và kết hợp tuyến tính của các yếu tố dự đoán, không chỉ bất kỳ một trong số chúng, và không chỉ là trung bình của các mối tương quan bivariate đó. R 2 có thể được hiểu là tỷ lệ phần trăm của phương sai trong biến phụ thuộc có thể được giải thích bởi các yếu tố dự đoán ; như trên, điều này cũng đúng nếu chỉ có một yếu tố dự đoán.
Nhiều R thực sự có thể được xem là mối tương quan giữa đáp ứng và các giá trị được trang bị. Như vậy nó luôn luôn tích cực. Nhiều bình phương R là phiên bản bình phương của nó.
Hãy để tôi minh họa bằng một ví dụ nhỏ:
set.seed(32)
n <- 100
x1 <- runif(n)
x2 <- runif(n)
y <- 4 + x1 - 2*x2 + rnorm(n)
fit <- lm(y ~ x1 + x2)
summary(fit) # Multiple R-squared: 0.2347
(R <- cor(y, fitted(fit))) # 0.4845068
R^2 # 0.2347469
Tôi chỉ đơn giản giải thích cho học sinh của mình rằng:
bội số R được coi là giá trị tuyệt đối của hệ số tương quan (hoặc hệ số tương quan không có dấu âm)!
Bình phương R đơn giản là bình phương của bội số R. Nó có thể thông qua tỷ lệ phần trăm biến đổi gây ra bởi (các) biến độc lập
Thật dễ dàng để nắm bắt khái niệm và sự khác biệt theo cách này.