Được rồi, hãy nhìn vào tình huống của bạn. Về cơ bản, bạn có hai hồi quy (APD = đường kính trước-sau, NOL = naso-chẩm chiều dài, HL = chiều dài hài hước):
- APD=β0,1+β1,1⋅NOL
- HL=β0,2+β1,2⋅NOL
Để kiểm tra giả thuyết , bạn có thể làm như sau:β1,1=β1,2
- Tạo một biến phụ thuộc mới ( ) bằng cách thêm APD vào HLYnew
- Tạo một biến độc lập mới bằng cách nối thêm NOL vào chính nó ( ) (tức là sao chép NOL)Xnew
- Tạo một biến giả ( ) là 1 nếu dữ liệu đến từ tập dữ liệu thứ hai (với HL) và 0 nếu dữ liệu đến từ tập dữ liệu đầu tiên (APD).D
- Tính toán hồi quy với là biến phụ thuộc và các tác động chính và tương tác giữa và biến giả là biến giải thích. EDIT @Jake Westfall chỉ ra rằng lỗi tiêu chuẩn còn lại có thể khác nhau đối với hai hồi quy cho mỗi DV. Jake đã đưa ra câu trả lời phù hợp với mô hình bình phương nhỏ nhất (GLS) cho phép sai số chuẩn còn lại khác nhau giữa hai hồi quy.YnewXnewD
Hãy xem xét một ví dụ với dữ liệu đã tạo (in R
):
# Create artificial data
library(nlme) # needed for the generalized least squares
set.seed(1500)
NOL <- rnorm(10000,100,12)
APD <- 10 + 15*NOL+ rnorm(10000,0,2)
HL <- - 2 - 5*NOL+ rnorm(10000,0,3)
mod1 <- lm(APD~NOL)
mod1
Coefficients:
(Intercept) NOL
10.11 15.00
mod2 <- lm(HL~NOL)
mod2
Coefficients:
(Intercept) NOL
-1.96 -5.00
# Combine the dependent variables and duplicate the independent variable
y.new <- c(APD, HL)
x.new <- c(NOL, NOL)
# Create a dummy variable that is 0 if the data are from the first data set (APD) and 1 if they are from the second dataset (HL)
dummy.var <- c(rep(0, length(APD)), rep(1, length(HL)))
# Generalized least squares model allowing for differend residual SDs for each regression (strata of dummy.var)
gls.mod3 <- gls(y.new~x.new*dummy.var, weights=varIdent(form=~1|dummy.var))
Variance function:
Structure: Different standard deviations per stratum
Formula: ~1 | dummy.var
Parameter estimates:
0 1
1.000000 1.481274
Coefficients:
Value Std.Error t-value p-value
(Intercept) 10.10886 0.17049120 59.293 0
x.new 14.99877 0.00169164 8866.430 0
dummy.var -12.06858 0.30470618 -39.607 0
x.new:dummy.var -19.99917 0.00302333 -6614.939 0
Lưu ý: Chặn và độ dốc cho hoàn toàn giống như trong hồi quy đầu tiên (mod1). Hệ số biểu thị sự khác biệt giữa đánh chặn của hai hồi quy. Hơn nữa: độ lệch chuẩn còn lại của hồi quy thứ hai được ước tính lớn hơn SD của lần đầu tiên (lớn hơn khoảng 1,5 lần). Đây chính xác là những gì chúng tôi đã chỉ định trong việc tạo dữ liệu (2 so với 3). Chúng ta đang ở gần đó: Hệ số của thuật ngữ tương tác ( ) kiểm tra sự bằng nhau của các sườn. Ở đây độ dốc của hồi quy thứ hai (mod2) là khoảng hoặc khoảng . Chênh lệch β x . n e w - β x . n e w × d u m m y . v a r 15 - 20 = - 5 20Xnewdummy.var
x.new:dummy.var
βx.new−βx.new×dummy.var15−20=−520là chính xác những gì chúng tôi đã chỉ định khi chúng tôi tạo dữ liệu. Nếu bạn làm việc ở Stata, có một lời giải thích hay ở đây.
Cảnh báo: Điều này chỉ hoạt động nếu đường kính trước-sau và chiều dài chẩm (hai biến phụ thuộc) là độc lập. Nếu không nó có thể rất phức tạp.
BIÊN TẬP
Hai bài đăng trên trang web đối phó với cùng một câu hỏi: Thứ nhất và thứ hai .