Có hai cách để giải thích câu hỏi đầu tiên của bạn, được phản ánh theo hai cách bạn đã hỏi: đó là loài có liên quan đến cây chủ không? Đây là loài độc lập với cây chủ, do ảnh hưởng của mưa?
Giải thích đầu tiên tương ứng với một mô hình độc lập chung , trong đó tuyên bố rằng các loài và vật chủ phụ thuộc, nhưng cùng độc lập với việc trời có mưa hay không:
pshr=pshpr
Trong đó là xác suất quan sát rơi vào ô ( s , h , r ) trong đó s chỉ số loài, loại vật chủ h và giá trị mưa r , p s h là xác suất cận biên của ( s , h , ⋅ ) ô nơi chúng ta sụp đổ qua biến mưa và p r là xác suất cận biên của mưa.pshr(s,h,r)shrpsh(s,h,⋅)pr
Giải thích thứ hai tương ứng với một mô hình độc lập có điều kiện , trong đó tuyên bố rằng các loài và vật chủ là độc lập cho dù trời mưa:
hoặc p s h r = p s r p h r / p rpsh|r=ps|rph|rpshr=psrphr/pr
trong đó là xác suất có điều kiện của ô ( s , h , r ) , với giá trị là r .psh|r(s,h,r)r
Bạn có thể kiểm tra các mô hình này trong R ( loglin
cũng sẽ hoạt động tốt nhưng tôi quen thuộc hơn glm
):
count <- c(12,15,10,13,11,12,12,7)
species <- rep(c("a", "b"), 4)
host <- rep(c("c","c", "d", "d"), 2)
rain <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)
my.data <- as.data.frame.table(my.table)
mod0 <- glm(Freq ~ species + host + rain, data=my.data, family=poisson())
mod1 <- glm(Freq ~ species * host + rain, data=my.data, family=poisson())
mod2 <- glm(Freq ~ (species + host) * rain, data=my.data, family=poisson())
anova(mod0, mod1, test="Chi") #Test of joint independence
anova(mod0, mod2, test="Chi") #Test of conditional independence
Ở trên, mod1
tương ứng với độc lập chung và mod2
tương ứng với độc lập có điều kiện, trong khi mod0
tương ứng với mô hình độc lập lẫn nhau . Bạn có thể xem các ước tính tham số bằng cách sử dụng , v.v. Như thường lệ, bạn nên kiểm tra xem liệu các giả định mô hình có được đáp ứng hay không. Trong dữ liệu bạn cung cấp, mô hình null thực sự phù hợp đầy đủ.pshr=psphprsummary(mod2)
Một cách khác để tiếp cận câu hỏi đầu tiên của bạn là thực hiện kiểm tra chính xác của Fischer ( fisher.test(xtabs(count ~ host + species))
) trên bảng 2x2 bị sập (giải nghĩa đầu tiên) hoặc kiểm tra Mantel-Haenszel ( mantelhaen.test(xtabs(count ~ host + species + rain))
) cho các bảng 2x2 phân tầng hoặc viết một bài kiểm tra hoán vị tôn trọng sự phân tầng (diễn giải thứ hai).
Để diễn giải câu hỏi thứ hai của bạn, Mối quan hệ giữa các loài và vật chủ phụ thuộc vào việc trời có mưa không?
mod3 <- glm(Freq ~ species*host*rain - species:host:rain, data=my.data, family=poisson())
mod4 <- glm(Freq ~ species*host*rain, data=my.data, family=poisson())
anova(mod3, mod4, test=”Chi”)
pchisq(deviance(mod3), df.residual(mod3), lower=F)
Mô hình đầy đủ đã mod4
bão hòa, nhưng bạn có thể kiểm tra hiệu ứng trong câu hỏi bằng cách xem xét độ lệch mod3
như tôi đã làm ở trên.