Cập nhật : Vì bây giờ tôi biết rằng vấn đề của tôi được gọi là tách hoàn toàn, tôi đã cập nhật câu hỏi để phản ánh điều này (nhờ Aaron).
Tôi có một bộ dữ liệu từ một thử nghiệm trong đó 29 người tham gia (yếu tố code
) làm việc cho một nhóm thử nghiệm và response
là 1 hoặc 0. Ngoài ra, chúng tôi đã thao tác các tài liệu để chúng tôi có ba yếu tố chéo, p.validity
(hợp lệ so với không hợp lệ), type
(khẳng định so với từ chối) và counterexamples
(vài so với nhiều):
d.binom <- read.table("http://pastebin.com/raw.php?i=0yDpEri8")
str(d.binom)
## 'data.frame': 464 obs. of 5 variables:
## $ code : Factor w/ 29 levels "A04C","A14G",..: 1 1 1 1 1 1 1 1 1 1 ...
## $ response : int 1 1 1 1 0 1 1 1 1 1 ...
## $ counterexamples: Factor w/ 2 levels "few","many": 2 2 1 1 2 2 2 2 1 1 ...
## $ type : Factor w/ 2 levels "affirmation",..: 1 2 1 2 1 2 1 2 1 2 ...
## $ p.validity : Factor w/ 2 levels "invalid","valid": 1 1 2 2 1 1 2 2 1 1 ...
Nhìn chung, chỉ có một số nhỏ 0s:
mean(d.binom$response)
## [1] 0.9504
Một giả thuyết cho rằng có một ảnh hưởng của validity
, tuy nhiên, phân tích sơ bộ cho thấy có thể có ảnh hưởng của counterexamples
. Vì tôi có dữ liệu phụ thuộc (mỗi người tham gia đã làm việc trên tất cả các thử nghiệm), tôi muốn sử dụng GLMM trên dữ liệu. Thật không may, counterexamples
tách biệt hoàn toàn dữ liệu (ít nhất là cho một cấp):
with(d.binom, table(response, counterexamples))
## counterexamples
## response few many
## 0 1 22
## 1 231 210
Điều này cũng được phản ánh trong mô hình:
require(lme4)
options(contrasts=c('contr.sum', 'contr.poly'))
m2 <- glmer(response ~ type * p.validity * counterexamples + (1|code),
data = d.binom, family = binomial)
summary(m2)
## [output truncated]
## Fixed effects:
## Estimate Std. Error z value Pr(>|z|)
## (Intercept) 9.42 831.02 0.01 0.99
## type1 -1.97 831.02 0.00 1.00
## p.validity1 1.78 831.02 0.00 1.00
## counterexamples1 7.02 831.02 0.01 0.99
## type1:p.validity1 1.97 831.02 0.00 1.00
## type1:counterexamples1 -2.16 831.02 0.00 1.00
## p.validity1:counterexamples1 2.35 831.02 0.00 1.00
## type1:p.validity1:counterexamples1 2.16 831.02 0.00 1.00
Các lỗi tiêu chuẩn cho các tham số chỉ đơn giản là điên rồ. Vì mục tiêu cuối cùng của tôi là đánh giá xem các hiệu ứng nhất định có đáng kể hay không, các lỗi tiêu chuẩn không hoàn toàn không quan trọng.
- Làm thế nào tôi có thể đối phó với sự tách biệt hoàn toàn? Điều tôi muốn là có được các ước tính từ đó tôi có thể đánh giá liệu một hiệu ứng nhất định có đáng kể hay không (ví dụ: sử dụng
PRmodcomp
từ góipkrtest
, nhưng đây là một bước khác không được mô tả ở đây).
Phương pháp tiếp cận sử dụng các gói khác cũng tốt.