Có một loạt các khả năng được JW Gillard mô tả trong Tổng quan lịch sử về hồi quy tuyến tính với các lỗi trong cả hai biến
Nếu bạn không quan tâm đến chi tiết hoặc các lý do cho việc lựa chọn một phương pháp khác hơn, chỉ cần đi với các đơn giản nhất, mà là để vẽ đường qua trọng tâm có độ dốc β = s y / s x , tức là tỷ lệ độ lệch chuẩn quan sát được (làm cho dấu hiệu của độ dốc giống như dấu hiệu của hiệp phương sai của x và y ); như bạn có lẽ có thể làm việc ra, điều này đưa ra một đánh chặn trên y trục của α = ˉ y - beta ˉ x .(x¯,y¯)β^=sy/sxxyyα^=y¯−β^x¯.
Ưu điểm của phương pháp đặc biệt này là
- nó đưa ra cùng một dòng so sánh với y như y với x ,xyyx
- nó là bất biến tỷ lệ, do đó bạn không cần phải lo lắng về các đơn vị,
- nó nằm giữa hai đường hồi quy tuyến tính thông thường
- nó đi qua chúng ở nơi chúng giao nhau ở trung tâm của các quan sát và
- nó rất dễ tính toán
Độ dốc là giá trị trung bình hình học của độ dốc của hai độ dốc hồi quy tuyến tính thông thường. Đó cũng là những gì bạn sẽ nhận được nếu bạn chuẩn hóa các quan sát và y , vẽ một đường thẳng ở 45 ° (hoặc 135 ° nếu có tương quan âm) và sau đó khử chuẩn hóa đường thẳng. Nó cũng có thể được coi là tương đương với việc đưa ra một giả định ngầm định rằng phương sai của hai bộ lỗi tỷ lệ thuận với phương sai của hai bộ quan sát; theo như tôi có thể nói, bạn tuyên bố không biết cách nào sai.xy
Dưới đây là một số mã R để minh họa: dòng màu đỏ trong biểu đồ là hồi quy OLS của trên X , dòng màu xanh là hồi quy OLS của X trên Y và dòng màu xanh lá cây là phương pháp đơn giản này. Lưu ý rằng độ dốc nên khoảng 5.YXXY
X0 <- 1600:3600
Y0 <- 5*X0 + 700
X1 <- X0 + 400*rnorm(2001)
Y1 <- Y0 + 2000*rnorm(2001)
slopeOLSXY <- lm(Y1 ~ X1)$coefficients[2] #OLS slope of Y on X
slopeOLSYX <- 1/lm(X1 ~ Y1)$coefficients[2] #Inverse of OLS slope of X on Y
slopesimple <- sd(Y1)/sd(X1) *sign(cov(X1,Y1)) #Simple slope
c(slopeOLSXY, slopeOLSYX, slopesimple) #Show the three slopes
plot(Y1~X1)
abline(mean(Y1) - slopeOLSXY * mean(X1), slopeOLSXY, col="red")
abline(mean(Y1) - slopeOLSYX * mean(X1), slopeOLSYX, col="blue")
abline(mean(Y1) - slopesimple * mean(X1), slopesimple, col="green")