Sự khác biệt giữa tổng bình phương còn lại và bình phương nhỏ nhất bình thường là gì?


8

Chúng trông giống như tôi nhưng tôi không chắc.

Cập nhật: nhìn lại, đây không phải là một câu hỏi hay. OLS đề cập đến việc khớp một dòng với dữ liệu và RSS là hàm chi phí mà OLS sử dụng. Nó tìm thấy các tham số cung cấp tổng số lỗi vuông còn lại ít nhất . Nó được gọi là bình thường trong OLS đề cập đến thực tế là chúng ta đang thực hiện một sự phù hợp tuyến tính.

Câu trả lời:


12

Đây là một định nghĩa từ Wikipedia :

Trong thống kê, tổng bình phương còn lại (RSS) là tổng bình phương của phần dư. Nó là thước đo sự khác biệt giữa dữ liệu và mô hình ước tính; Bình phương tối thiểu thông thường (OLS) là phương pháp ước tính các tham số chưa biết trong mô hình hồi quy tuyến tính, với mục tiêu giảm thiểu sự khác biệt giữa các phản hồi quan sát được trong một số tập dữ liệu tùy ý và các phản hồi được dự đoán bởi xấp xỉ tuyến tính của dữ liệu.

Vì vậy, RSS là thước đo mức độ tốt của mô hình xấp xỉ dữ liệu trong khi OLS là phương pháp xây dựng mô hình tốt.


Bạn không biết câu trả lời của bạn hữu ích như thế nào!
NoName

5

Bình phương tối thiểu bình thường (OLS)

Bình phương tối thiểu thông thường (OLS) là đặc điểm của thống kê. Nó đưa ra một cách để có kết quả phức tạp và giải thích hành vi (như xu hướng) bằng cách sử dụng tuyến tính. Ứng dụng đơn giản nhất của OLS là phù hợp với một dòng.

Dư lượng là các lỗi có thể quan sát được từ các hệ số ước tính. Theo một nghĩa nào đó, phần dư là ước tính của các lỗi.

Hãy giải thích những điều sử dụng Rmã:

Đầu tiên phù hợp với một dòng dữ liệu kim cương nhỏ nhất bình thường trong UsingRthư viện:

library(UsingR)
data("diamond")
y <- diamond$price
	x <- diamond$carat
n <- length(y)
olsline <- lm(y ~ x)
plot(x, y,
     main ="Odinary Least square line",
     xlab = "Mass (carats)", 
     ylab = "Price (SIN $)", 
     bg = "lightblue", 
     col = "black", cex = 2, pch = 21,frame = FALSE)
abline(olsline, lwd = 2)

nhập mô tả hình ảnh ở đây

Bây giờ, chúng ta hãy tính tổng số dư còn lại của bình phương: Trong Rbạn có thể dễ dàng tính toán phần dư như resid(olsline), để trực quan hóa, hãy tính toán thủ công:

# The residuals from R method
e <- resid(olsline)
## Obtain the residuals manually, get the predicated Ys first
yhat <- predict(olsline)
# The residuals are y -yhat, Let's check by comparing this with R's build in resid function
ce <- y - yhat
max(abs(e-ce))
## Let's do it again hard coding the calculation of Yhat
max(abs(e- (y - coef(olsline)[1] - coef(olsline)[2] * x)))
# Residuals arethe signed length of the red lines
plot(diamond$carat, diamond$price,
    main ="Residuals sum of (actual Y - predicted Y)^2",
     xlab = "Mass (carats)", 
     ylab = "Price (SIN $)", 
     bg = "lightblue", 
     col = "black", cex = 2, pch = 21,frame = FALSE)
abline(olsline, lwd = 2)
for (i in 1 : n) 
  lines(c(x[i], x[i]), c(y[i], yhat[i]), col = "red" , lwd = 2)

nhập mô tả hình ảnh ở đây

Hy vọng những hình ảnh này sẽ xóa tan nghi ngờ của bạn giữa RSS & OLS


Tham khảo: Lớp mô hình hồi quy Coursera , gần đây tôi đã hoàn thành nó.
krishna Prasad

1

Theo một cách nào đó, OLS là một mô hình để ước tính đường hồi quy dựa trên dữ liệu đào tạo. Trong khi, RSS là một tham số để biết độ chính xác của mô hình cho cả dữ liệu thử nghiệm và đào tạo.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.