Cách tốt nhất để ước tính hiệu quả điều trị trung bình trong một nghiên cứu theo chiều dọc là gì?


9

Trong một nghiên cứu theo chiều dọc, các kết quả của đơn vị đang liên tục measuret tại thời điểm với tổng số cố định dịp đo lường (đo cố định = on đơn vị được thực hiện cùng một lúc). i t mYititm

Các đơn vị được chỉ định ngẫu nhiên cho một điều trị, hoặc cho nhóm kiểm soát, . Tôi muốn ước tính và kiểm tra hiệu quả trung bình của điều trị, tức là trong đó kỳ vọng được thực hiện theo thời gian và cá nhân. Tôi xem xét sử dụng mô hình đa cấp (hiệu ứng hỗn hợp) cố định cho mục đích này:G = 0 A T E = E ( Y | G = 1 ) - E ( Y | G = 0 ) ,G=1G=0

ATE=E(Y|G=1)E(Y|G=0),

Yit=α+βGi+u0i+eit

với đánh chặn, các , một đánh chặn ngẫu nhiên trên đơn vị, và dư.beta Một T E u đαβATEue

Bây giờ tôi đang xem xét mô hình thay thế

Yit=β~Gi+j=1mκjdij+j=1mγjdijGi+u~0i+e~it

trong đó có các hiệu ứng cố định cho mỗi lần trong đó dummy nếu và khác. Ngoài ra, mô hình này có chứa sự tương tác giữa điều trị và thời gian với các tham số . Vì vậy, mô hình này tính đến rằng hiệu ứng của có thể khác nhau theo thời gian. Bản thân nó là thông tin, nhưng tôi tin rằng nó cũng sẽ làm tăng độ chính xác của việc ước tính các tham số, bởi vì tính không đồng nhất trong được tính đến. t d t = 1 j = t 0 γ G Yκjtdt=1j=t0γGY

Tuy nhiên, trong mô hình này, hệ số dường như không bằng nữa. Thay vào đó, nó đại diện cho ATE ở lần đầu tiên ( ). Vì vậy, ước tính của có thể hiệu quả hơn nhưng nó không đại diện cho nữa. MộtTEt=1 ~ β βMộtTEβ~ATEt=1β~βATE

Câu hỏi của tôi là :

  • Cách tốt nhất để ước tính hiệu quả điều trị trong thiết kế nghiên cứu theo chiều dọc này là gì?
  • Tôi có phải sử dụng mô hình 1 hay có cách nào để sử dụng mô hình 2 (có lẽ hiệu quả hơn) không?
  • Có cách nào để giải thích và độ lệch cụ thể nhân dịp (ví dụ: sử dụng mã hóa hiệu ứng) không? ATEγβ~ATEγ

Trong mô hình 2, ATE không bằng cộng với trung bình của ? gammajβ~γj
jujae

Nếu mục đích của bạn là ước tính độc quyền ATE, thì mô hình 1 sẽ đủ, vì nó sẽ không thiên vị. Tôi thêm thời gian hoặc tương tác trong mô hình sẽ làm giảm phương sai ước tính của bạn. Và tôi nghĩ rằng bạn có thể muốn thử mã dưới dạng mã hóa sai lệch (độ lệch so với mức trung bình)? γ
jujae

@jujae Lý do chính cho mô hình 2 là giảm phương sai, vâng. Nhưng tôi tự hỏi làm thế nào để đưa ATE ra khỏi mô hình 2. Nhận xét đầu tiên của bạn dường như là một con trỏ. Bạn có thể cho thấy điều này hoặc công phu? Sau đó, điều này sẽ gần với một câu trả lời cho câu hỏi của tôi!
tomka

Khi bạn phù hợp với mô hình 2, có cách hiểu về ATE trong giai đoạn 1. Các hệ số của thuật ngữ tương tác, để xem xét nhận dạng, sẽ được mã hóa với ATE ở giai đoạn 1 làm mức tham chiếu. Do đó, thực sự là sự khác biệt giữa điều trị ở giai đoạn và điều trị ở giai đoạn 1 từ đầu ra phần mềm. Vì vậy, ở mỗi giai đoạn , ATE là và khi trung bình ATE theo thời gian cụ thể, nó sẽ dẫn đến ATE có nghĩa là trong mô hình của bạn 1. γjjj ˜ β +γjββ~γjjjβ~+γjβ
jujae

Câu trả lời:


2

Trả lời câu hỏi của bạn "Tôi tự hỏi làm thế nào để đưa ATE ra khỏi mô hình 2" trong các bình luận:

Trước hết, trong mô hình 2 của bạn, không phải tất cả đều có thể nhận dạng được dẫn đến vấn đề thiếu thứ hạng trong ma trận thiết kế. Cần phải giảm một cấp, ví dụ giả sử cho . Nghĩa là, sử dụng mã hóa tương phản và giả sử hiệu quả xử lý ở giai đoạn 1 là 0. Trong R, nó sẽ mã hóa thuật ngữ tương tác với hiệu quả điều trị ở giai đoạn 1 làm mức tham chiếu và đó cũng là lý do tại sao có giải thích về hiệu quả điều trị ở giai đoạn 1. Trong SAS, nó sẽ mã hóa hiệu quả điều trị ở giai đoạn là mức tham chiếu, sau đó có giải thích về hiệu quả điều trị ở giai đoạnγ j = 0 j = 1 ˜ β m ˜ β mγjγj=0j=1β~mβ~m, không phải kỳ 1 nữa.

Giả sử độ tương phản được tạo theo cách R, thì các hệ số ước tính cho mỗi thuật ngữ tương tác (tôi vẫn sẽ biểu thị điều này bằng , mặc dù đó không phải là chính xác những gì bạn xác định trong mô hình của mình) có sự giải thích về sự khác biệt hiệu quả điều trị giữa các khoảng thời gian và khoảng thời gian 1. Suy ra ATE ở mỗi thời kỳ , sau đó cho . Do đó, công cụ ước tính cho là . (bỏ qua sự khác biệt ký hiệu giữa tham số thực và chính công cụ ước tính vì sự lười biếng) Và tự nhiênγjjATEjγj=ATEjATE1j=2,,mATEjβ~+γjATE=β=1mj=1mATEj=β~+(β~+γ2)++(β~+γm)m=β~+1m(γ2++γm) .

Tôi đã thực hiện một mô phỏng đơn giản trong R để xác minh điều này:

set.seed(1234)
time <- 4
n <-2000
trt.period <- c(2,3,4,5) #ATE=3.5
kj <- c(1,2,3,4)
intercept <- rep(rnorm(n, 1, 1), each=time)
eij <- rnorm(n*time, 0, 1.5)
trt <- rep(c(rep(0,n/2),rep(1,n/2)), each=time)
y <- intercept + trt*(rep(trt.period, n))+rep(kj,n)+eij
sim.data <- data.frame(id=rep(1:n, each=time), period=factor(rep(1:time, n)), y=y, trt=factor(trt))

library(lme4)
fit.model1 <- lmer(y~trt+(1|id), data=sim.data)
beta <- getME(fit.model1, "fixef")["trt1"]

fit.model2 <- lmer(y~trt*period + (1|id), data=sim.data)
beta_t <- getME(fit.model2, "fixef")["trt1"]
gamma_j <- getME(fit.model2, "fixef")[c("trt1:period2","trt1:period3","trt1:period4")]

results <-c(beta, beta_t+sum(gamma_j)/time)
names(results)<-c("ATE.m1", "ATE.m2")
print(results)

Và kết quả xác minh điều này:

  ATE.m1   ATE.m2 
3.549213 3.549213  

Tôi không biết cách thay đổi trực tiếp mã hóa tương phản trong mô hình 2 ở trên, để minh họa cách người ta có thể sử dụng trực tiếp hàm tuyến tính của các thuật ngữ tương tác, cũng như cách nhận được lỗi tiêu chuẩn, tôi đã sử dụng gói multcomp:

sim.data$tp <- interaction(sim.data$trt, sim.data$period)
fit.model3 <- lmer(y~tp+ (1|id), data=sim.data)
library(multcomp)
# w= tp.1.1 + (tp.2.1-tp.2.0)+(tp.3.1-tp.3.0)+(tp.4.1-tp.4.0)
# tp.x.y=interaction effect of period x and treatment y
w <- matrix(c(0, 1,-1,1,-1,1,-1,1)/time,nrow=1)
names(w)<- names(getME(fit.model3,"fixef"))
xx <- glht(fit.model3, linfct=w)
summary(xx)

Và đây là đầu ra:

 Simultaneous Tests for General Linear Hypotheses
Fit: lmer(formula = y ~ tp + (1 | id), data = sim.data)
Linear Hypotheses:
       Estimate Std. Error z value Pr(>|z|)    
1 == 0  3.54921    0.05589   63.51   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)

Tôi nghĩ rằng lỗi tiêu chuẩn có được bởi với là dạng kết hợp tuyến tính ở trên và là ma trận phương sai hiệp phương sai ước tính của các hệ số từ mô hình 3. wVwV^wTwV

Mã hóa sai lệch

Một cách khác để làm cho có cách giải thích trực tiếp là sử dụng mã hóa sai lệch , để sau đó các hiệp phương sai đại diện cho so sánh: ATEATEj-ATEβ~ATEATEjATE

sim.data$p2vsmean <- 0
sim.data$p3vsmean <- 0
sim.data$p4vsmean <- 0
sim.data$p2vsmean[sim.data$period==2 & sim.data$trt==1] <- 1
sim.data$p3vsmean[sim.data$period==3 & sim.data$trt==1] <- 1
sim.data$p4vsmean[sim.data$period==4 & sim.data$trt==1] <- 1
sim.data$p2vsmean[sim.data$period==1 & sim.data$trt==1] <- -1
sim.data$p3vsmean[sim.data$period==1 & sim.data$trt==1] <- -1
sim.data$p4vsmean[sim.data$period==1 & sim.data$trt==1] <- -1


fit.model4 <- lmer(y~trt+p2vsmean+p3vsmean+p4vsmean+ (1|id), data=sim.data)

Đầu ra:

Fixed effects:
            Estimate Std. Error t value
(Intercept)  3.48308    0.03952   88.14
trt1         3.54921    0.05589   63.51
p2vsmean    -1.14774    0.04720  -24.32
p3vsmean     1.11729    0.04720   23.67
p4vsmean     3.01025    0.04720   63.77

Tốt - nhưng làm thế nào để có được ước tính lỗi tiêu chuẩn? Và không nên sử dụng mã hóa các hiệu ứng tương tác / thời gian theo cách (của bạn ) là ATE trực tiếp (sau đó với ước tính SE)? β~beta_t
tomka

@tomka, có thể, tôi không biết cách thay đổi trực tiếp ma trận tương phản của thuật ngữ tương tác trong mô hình2, sẽ thực hiện một số nghiên cứu và quay lại sau.
jujae

Suy nghĩ về câu trả lời của bạn, tôi tìm thấy điều này. Tôi nghĩ rằng mã hóa sai lệch làm những gì tôi muốn. Bạn có thể kiểm tra nó và đưa nó vào câu trả lời của bạn. ats.ucla.edu/stat/sas/webbooks/reg/ch CHƯƠNG5 / Đổi
tomka

@tomka: Đó chính xác là những gì trong tâm trí của tôi, hãy xem nhận xét ban đầu của tôi cho câu hỏi của bạn, nơi tôi đã đề cập đến mã hóa sai lệch :), tôi sẽ cố gắng thực hiện điều này và cập nhật câu trả lời sau. (Có một số rắc rối với việc thực hiện nó trong R mà không tự tạo biến giả cho mã hóa, nhưng có vẻ như đó là cách duy nhất để làm như vậy).
jujae

@tomka: xin lỗi vì sự chậm trễ, đã cập nhật phần mã sai lệch
jujae

0

Đối với câu hỏi đầu tiên, sự hiểu biết của tôi là những cách "ưa thích" chỉ cần thiết khi không rõ ràng ngay lập tức rằng việc điều trị không phụ thuộc vào kết quả tiềm năng. Trong những trường hợp này, bạn cần lập luận rằng một số khía cạnh của dữ liệu cho phép xấp xỉ chỉ định ngẫu nhiên cho điều trị, điều này đưa chúng ta đến các biến công cụ, gián đoạn hồi quy, v.v.

Trong trường hợp của bạn, các đơn vị được chỉ định ngẫu nhiên để điều trị, vì vậy có vẻ đáng tin rằng việc điều trị là độc lập với kết quả tiềm năng. Sau đó, chúng ta chỉ có thể giữ mọi thứ đơn giản: ước lượng mô hình 1 với bình phương tối thiểu thông thường và bạn có ước tính ATE nhất quán. Vì các đơn vị được chỉ định ngẫu nhiên để điều trị, đây là một trong số ít trường hợp giả định hiệu ứng ngẫu nhiên là đáng tin cậy.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.