Làm thế nào để so sánh hai độ dốc hồi quy cho một yếu tố dự đoán trên hai kết quả khác nhau?


10

Tôi cần so sánh hai sườn hồi quy trong đó:

$
y_1 ~ a + b_1x
y_2 ~ a + b_2x
$

Làm thế nào tôi có thể so sánh b1 và b2?

Hoặc theo ngôn ngữ của ví dụ cụ thể của tôi ở loài gặm nhấm, tôi muốn so sánh

antero-posterior diameter ~  a + b1 * humeral length   
de naso-occipital length  ~  a + b2 * humeral length 

2
Tính toán mô hình hồi quy với cả hai biến CỘNG sự tương tác của hai biến số (chiều dài khiêm tốn đường kính trước-sau). Sự tương tác kiểm tra giả định về độ song song của độ dốc của hai biến. Nếu thuật ngữ tương tác là đáng kể, độ dốc là khác nhau. ×
COOLSerdash

Cảm ơn!! Nhưng chiều dài của con người và đường kính trước-sau của humerus là DV và chiều dài chẩm là IV. Tôi có thể chạy các phân tích như bạn đề nghị?
Dốc.

1
@ Dra.AlejandraEcheverria Bạn có nghĩa là bạn có một mô hình hồi quy tuyến tính với hai biến độc lập và bạn muốn kiểm tra sự bằng nhau của hai hệ số trên các biến độc lập hoặc, bạn có hai mô hình hồi quy tuyến tính đơn giản và bạn muốn so sánh hệ số trên hai mô hình?
Graeme Walsh

1
Kính gửi @Graeme Walsh, tôi có hai mô hình hồi quy tuyến tính đơn giản và tôi muốn so sánh các hệ số giữa hai mô hình.
Dốc.

Câu trả lời:


11

Được rồi, hãy nhìn vào tình huống của bạn. Về cơ bản, bạn có hai hồi quy (APD = đường kính trước-sau, NOL = naso-chẩm chiều dài, HL = chiều dài hài hước):

  1. APD=β0,1+β1,1NOL
  2. HL=β0,2+β1,2NOL

Để kiểm tra giả thuyết , bạn có thể làm như sau:β1,1=β1,2

  1. Tạo một biến phụ thuộc mới ( ) bằng cách thêm APD vào HLYnew
  2. Tạo một biến độc lập mới bằng cách nối thêm NOL vào chính nó ( ) (tức là sao chép NOL)Xnew
  3. Tạo một biến giả ( ) là 1 nếu dữ liệu đến từ tập dữ liệu thứ hai (với HL) và 0 nếu dữ liệu đến từ tập dữ liệu đầu tiên (APD).D
  4. Tính toán hồi quy với là biến phụ thuộc và các tác động chính và tương tác giữa và biến giả là biến giải thích. EDIT @Jake Westfall chỉ ra rằng lỗi tiêu chuẩn còn lại có thể khác nhau đối với hai hồi quy cho mỗi DV. Jake đã đưa ra câu trả lời phù hợp với mô hình bình phương nhỏ nhất (GLS) cho phép sai số chuẩn còn lại khác nhau giữa hai hồi quy.YnewXnewD

Hãy xem xét một ví dụ với dữ liệu đã tạo (in R):

# Create artificial data

library(nlme) # needed for the generalized least squares

set.seed(1500)

NOL <- rnorm(10000,100,12)
APD <- 10 + 15*NOL+ rnorm(10000,0,2)
HL <- - 2  - 5*NOL+ rnorm(10000,0,3) 

mod1 <- lm(APD~NOL)
mod1

Coefficients:
(Intercept)          NOL
      10.11        15.00

mod2 <- lm(HL~NOL)
mod2

Coefficients:
(Intercept)          NOL
      -1.96        -5.00

# Combine the dependent variables and duplicate the independent variable

y.new <- c(APD, HL)
x.new <- c(NOL, NOL)

# Create a dummy variable that is 0 if the data are from the first data set (APD) and 1 if they are from the second dataset (HL)

dummy.var <- c(rep(0, length(APD)), rep(1, length(HL)))

# Generalized least squares model allowing for differend residual SDs for each regression (strata of dummy.var)

gls.mod3 <- gls(y.new~x.new*dummy.var, weights=varIdent(form=~1|dummy.var))

Variance function:
 Structure: Different standard deviations per stratum
 Formula: ~1 | dummy.var 
 Parameter estimates:
       0        1 
1.000000 1.481274 

Coefficients:
                    Value  Std.Error   t-value p-value
(Intercept)      10.10886 0.17049120    59.293       0
x.new            14.99877 0.00169164  8866.430       0
dummy.var       -12.06858 0.30470618   -39.607       0
x.new:dummy.var -19.99917 0.00302333 -6614.939       0

Lưu ý: Chặn và độ dốc cho hoàn toàn giống như trong hồi quy đầu tiên (mod1). Hệ số biểu thị sự khác biệt giữa đánh chặn của hai hồi quy. Hơn nữa: độ lệch chuẩn còn lại của hồi quy thứ hai được ước tính lớn hơn SD của lần đầu tiên (lớn hơn khoảng 1,5 lần). Đây chính xác là những gì chúng tôi đã chỉ định trong việc tạo dữ liệu (2 so với 3). Chúng ta đang ở gần đó: Hệ số của thuật ngữ tương tác ( ) kiểm tra sự bằng nhau của các sườn. Ở đây độ dốc của hồi quy thứ hai (mod2) là khoảng hoặc khoảng . Chênh lệch β x . n e w - β x . n e w × d u m m y . v a r 15 - 20 = - 5 20Xnewdummy.varx.new:dummy.varβx.newβx.new×dummy.var1520=520là chính xác những gì chúng tôi đã chỉ định khi chúng tôi tạo dữ liệu. Nếu bạn làm việc ở Stata, có một lời giải thích hay ở đây.

Cảnh báo: Điều này chỉ hoạt động nếu đường kính trước-sau và chiều dài chẩm (hai biến phụ thuộc) là độc lập. Nếu không nó có thể rất phức tạp.

BIÊN TẬP

Hai bài đăng trên trang web đối phó với cùng một câu hỏi: Thứ nhấtthứ hai .


Để tránh nhầm lẫn, có vẻ như bạn đã trộn lẫn NOL và HL. HL là người dự đoán, NOL là DV thứ hai (và APD là DV đầu tiên, như bạn đã chỉ ra). Mặc dù tôi chỉ nhận thấy rằng chính người đăng đã thay đổi trạng thái của các biến trong một bình luận ...
Patrick Coulombe

@Patrick Coulombe Cảm ơn bạn đã chỉ ra. Nó không rõ ràng từ bình luận của cô ngày hôm qua.
COOLSerdash

@PatrickCoulombe Trên một suy nghĩ thứ hai: Tôi nghĩ Jeromy Anglim đã hiểu nhầm ý kiến ​​của Alejandra và trao đổi các biến.
COOLSerdash

1
Giải pháp này có vẻ hợp lý, nhưng tôi hơi lo ngại về thực tế là trong mô hình kết hợp / tương tác của bạn, phương sai dư được giả sử là bằng nhau ở cả hai cấp độ dummy.var, nghĩa là cho cả hai DV. Tùy thuộc vào những gì các DV trong bối cảnh ban đầu, có thể các phương sai còn lại hoàn toàn khác nhau trong các hồi quy riêng biệt của mỗi DV. Tôi tự hỏi liệu có nên sử dụng cùng một phương pháp cơ bản mà bạn đề xuất hay không, nhưng với một glsmô hình nơi chúng tôi ước tính các phương sai còn lại khác nhau cho mỗi DV. Bất kỳ suy nghĩ về điều này?
Jake Westfall

1
@COOLSerdash Chắc chắn, nó sẽ trông giống như thế này:library(nlme); mod4 <- gls(y.new~x.new*dummy.var, weights=varIdent(form= ~1 | dummy.var))
Jake Westfall
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.