Tôi đang phân tích một tập dữ liệu bằng mô hình hiệu ứng hỗn hợp với một hiệu ứng cố định (điều kiện) và hai hiệu ứng ngẫu nhiên (người tham gia do thiết kế chủ đề và cặp bên trong). Mô hình được tạo ra với lme4
gói : exp.model<-lmer(outcome~condition+(1|participant)+(1|pair),data=exp)
.
Tiếp theo, tôi đã thực hiện một thử nghiệm tỷ lệ khả năng của mô hình này so với mô hình mà không có hiệu ứng (điều kiện) cố định và có sự khác biệt đáng kể. Có 3 điều kiện trong tập dữ liệu của tôi vì vậy tôi muốn thực hiện so sánh nhiều nhưng tôi không chắc nên sử dụng phương pháp nào . Tôi đã tìm thấy một số câu hỏi tương tự trên CrossValidated và các diễn đàn khác nhưng tôi vẫn còn khá bối rối.
Từ những gì tôi thấy, mọi người đã gợi ý sử dụng
1. Các lsmeans
gói - lsmeans(exp.model,pairwise~condition)
mang đến cho tôi những kết quả sau đây:
condition lsmean SE df lower.CL upper.CL
Condition1 0.6538060 0.03272705 47.98 0.5880030 0.7196089
Condition2 0.7027413 0.03272705 47.98 0.6369384 0.7685443
Condition3 0.7580522 0.03272705 47.98 0.6922493 0.8238552
Confidence level used: 0.95
$contrasts
contrast estimate SE df t.ratio p.value
Condition1 - Condition2 -0.04893538 0.03813262 62.07 -1.283 0.4099
Condition1 - Condition3 -0.10424628 0.03813262 62.07 -2.734 0.0219
Condition2 - Condition3 -0.05531090 0.03813262 62.07 -1.450 0.3217
P value adjustment: tukey method for comparing a family of 3 estimates
2. Các multcomp
gói theo hai cách khác nhau - sử dụng mcp
glht(exp.model,mcp(condition="Tukey"))
kết quả
Simultaneous Tests for General Linear Hypotheses
Multiple Comparisons of Means: Tukey Contrasts
Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair),
data = exp, REML = FALSE)
Linear Hypotheses:
Estimate Std. Error z value Pr(>|z|)
Condition2 - Condition1 == 0 0.04894 0.03749 1.305 0.392
Condition3 - Condition1 == 0 0.10425 0.03749 2.781 0.015 *
Condition3 - Condition2 == 0 0.05531 0.03749 1.475 0.303
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)
và sử dụng lsm
glht(exp.model,lsm(pairwise~condition))
dẫn đến
Note: df set to 62
Simultaneous Tests for General Linear Hypotheses
Fit: lmer(formula = outcome ~ condition + (1 | participant) + (1 | pair),
data = exp, REML = FALSE)
Linear Hypotheses:
Estimate Std. Error t value Pr(>|t|)
Condition1 - Condition2 == 0 -0.04894 0.03749 -1.305 0.3977
Condition1 - Condition3 == 0 -0.10425 0.03749 -2.781 0.0195 *
Condition2 - Condition3 == 0 -0.05531 0.03749 -1.475 0.3098
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Adjusted p values reported -- single-step method)
Như bạn có thể thấy, các phương pháp cho kết quả khác nhau. Đây là lần đầu tiên tôi làm việc với R và số liệu thống kê nên có thể có gì đó không ổn nhưng tôi không biết ở đâu. Câu hỏi của tôi là:
Sự khác biệt giữa các phương pháp được trình bày là gì? Tôi đã đọc trong một câu trả lời cho một câu hỏi liên quan rằng đó là về mức độ tự do ( lsmeans
so với glht
).
Có một số quy tắc hoặc khuyến nghị khi sử dụng phương pháp nào, tức là phương pháp 1 phù hợp với loại tập hợp / mô hình dữ liệu này, v.v.? Tôi nên báo cáo kết quả nào? Nếu không biết rõ hơn, có lẽ tôi chỉ đi và báo cáo giá trị p cao nhất mà tôi có để chơi nó an toàn nhưng thật tuyệt khi có lý do tốt hơn. Cảm ơn