Tôi đã thực hiện một thí nghiệm nơi tôi nuôi các gia đình khác nhau đến từ hai quần thể nguồn khác nhau. Mỗi gia đình được chỉ định một trong hai phương pháp điều trị. Sau thí nghiệm tôi đã đo được một vài đặc điểm trên từng cá thể. Để kiểm tra hiệu quả của việc điều trị hoặc nguồn cũng như sự tương tác của chúng, tôi đã sử dụng mô hình hiệu ứng hỗn hợp tuyến tính với gia đình là yếu tố ngẫu nhiên, nghĩa là
lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML")
Cho đến nay rất tốt, Bây giờ tôi phải tính toán các thành phần phương sai tương đối, tức là tỷ lệ phần trăm biến thể được giải thích bằng cách xử lý hoặc nguồn cũng như tương tác.
Nếu không có hiệu ứng ngẫu nhiên, tôi có thể dễ dàng sử dụng tổng bình phương (SS) để tính toán phương sai được giải thích bởi từng yếu tố. Nhưng đối với một mô hình hỗn hợp (với ước tính ML), không có SS, do đó tôi nghĩ rằng tôi có thể sử dụng Điều trị và Nguồn làm hiệu ứng ngẫu nhiên để ước tính phương sai, nghĩa là
lme(fixed=Trait~1,random=~(Treatment*Source)|Family, method="REML")
Tuy nhiên, trong một số trường hợp, lme không hội tụ, do đó tôi đã sử dụng lmer từ gói lme4:
lmer(Trait~1+(Treatment*Source|Family),data=DATA)
Nơi tôi trích xuất các phương sai từ mô hình bằng hàm tóm tắt:
model<-lmer(Trait~1+(Treatment*Source|Family),data=regrexpdat)
results<-VarCorr(model)
variances<-results[,3]
Tôi nhận được các giá trị tương tự như với hàm VarCorr. Tôi sử dụng các giá trị này để tính tỷ lệ phần trăm biến thể thực tế lấy tổng làm biến thể tổng.
Tôi đang vật lộn với việc giải thích các kết quả từ mô hình lme ban đầu (với xử lý và nguồn là hiệu ứng cố định) và mô hình ngẫu nhiên để ước tính các thành phần phương sai (với điều trị và nguồn là hiệu ứng ngẫu nhiên). Tôi thấy trong hầu hết các trường hợp rằng tỷ lệ phương sai được giải thích bởi mỗi yếu tố không tương ứng với tầm quan trọng của hiệu ứng cố định.
Ví dụ, đối với đặc điểm HD, lme ban đầu cho thấy xu hướng tương tác cũng như ý nghĩa đối với Điều trị. Sử dụng một thủ tục lạc hậu, tôi thấy rằng Điều trị có xu hướng gần với xu hướng đáng kể. Tuy nhiên, ước tính các thành phần phương sai, tôi thấy rằng Nguồn có phương sai cao nhất, chiếm tới 26,7% tổng phương sai.
Tôi:
anova(lme(fixed=HD~as.factor(Treatment)*as.factor(Source),random=~1|as.factor(Family),method="ML",data=test),type="m")
numDF denDF F-value p-value
(Intercept) 1 426 0.044523 0.8330
as.factor(Treatment) 1 426 5.935189 0.0153
as.factor(Source) 1 11 0.042662 0.8401
as.factor(Treatment):as.factor(Source) 1 426 3.754112 0.0533
Và kẻ thua cuộc:
summary(lmer(HD~1+(as.factor(Treatment)*as.factor(Source)|Family),data=regrexpdat))
Linear mixed model fit by REML
Formula: HD ~ 1 + (as.factor(Treatment) * as.factor(Source) | Family)
Data: regrexpdat
AIC BIC logLik deviance REMLdev
-103.5 -54.43 63.75 -132.5 -127.5
Random effects:
Groups Name Variance Std.Dev. Corr
Family (Intercept) 0.0113276 0.106431
as.factor(Treatment) 0.0063710 0.079819 0.405
as.factor(Source) 0.0235294 0.153393 -0.134 -0.157
as.factor(Treatment)L:as.factor(Source) 0.0076353 0.087380 -0.578 -0.589 -0.585
Residual 0.0394610 0.198648
Number of obs: 441, groups: Family, 13
Fixed effects:
Estimate Std. Error t value
(Intercept) -0.02740 0.03237 -0.846
Do đó, câu hỏi của tôi là, nó có đúng với những gì tôi đang làm không? Hoặc tôi nên sử dụng một cách khác để ước tính lượng phương sai được giải thích theo từng yếu tố (ví dụ: Điều trị, Nguồn và tương tác của chúng). Ví dụ, kích thước hiệu ứng sẽ là một cách thích hợp hơn để đi?