Hồi quy tiêu chuẩn giảm thiểu khoảng cách dọc giữa các điểm và đường thẳng, do đó, việc chuyển đổi 2 biến giờ sẽ giảm thiểu khoảng cách theo chiều ngang (được đưa ra cùng một biểu đồ phân tán). Một tùy chọn khác (đi theo một số tên) là để giảm thiểu khoảng cách vuông góc, điều này có thể được thực hiện bằng cách sử dụng các thành phần nguyên tắc.
Đây là một số mã R cho thấy sự khác biệt:
library(MASS)
tmp <- mvrnorm(100, c(0,0), rbind( c(1,.9),c(.9,1)) )
plot(tmp, asp=1)
fit1 <- lm(tmp[,1] ~ tmp[,2]) # horizontal residuals
segments( tmp[,1], tmp[,2], fitted(fit1),tmp[,2], col='blue' )
o <- order(tmp[,2])
lines( fitted(fit1)[o], tmp[o,2], col='blue' )
fit2 <- lm(tmp[,2] ~ tmp[,1]) # vertical residuals
segments( tmp[,1], tmp[,2], tmp[,1], fitted(fit2), col='green' )
o <- order(tmp[,1])
lines( tmp[o,1], fitted(fit2)[o], col='green' )
fit3 <- prcomp(tmp)
b <- -fit3$rotation[1,2]/fit3$rotation[2,2]
a <- fit3$center[2] - b*fit3$center[1]
abline(a,b, col='red')
segments(tmp[,1], tmp[,2], tmp[,1]-fit3$x[,2]*fit3$rotation[1,2], tmp[,2]-fit3$x[,2]*fit3$rotation[2,2], col='red')
legend('bottomright', legend=c('Horizontal','Vertical','Perpendicular'), lty=1, col=c('blue','green','red'))
Để tìm các ngoại lệ, bạn chỉ có thể vẽ kết quả phân tích các thành phần nguyên tắc.
Bạn cũng có thể muốn xem xét:
Bland và Altman (1986), Phương pháp thống kê để đánh giá sự thỏa thuận giữa hai phương pháp đo lường bệnh lý. Lancet, trang 307-310