Cách thích hợp để đối phó với bảng dự phòng 3 cấp


12

Tôi có một bảng dự phòng ba cấp độ, với dữ liệu đếm cho một số loài, cây chủ mà chúng được thu thập và liệu bộ sưu tập đó có xảy ra vào một ngày mưa hay không (điều này thực sự có vấn đề!). Sử dụng R, dữ liệu giả mạo có thể giống như thế này:

count    <- rpois(8, 10)
species  <- rep(c("a", "b"), 4)
host     <- rep(c("c","c", "d", "d"), 2)
rain     <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)


, , rain = 0

    species
host  a  b
   c 12 15
   d 10 13

, , rain = 1

    species
host  a  b
   c 11 12
   d 12  7

Bây giờ, tôi muốn biết hai điều: Loài có liên quan đến cây ký chủ không? "Mưa hay không" có ảnh hưởng đến hiệp hội này? Tôi đã sử dụng loglm()từ MASSnày:

 # Are species independent to host plants, given the effect of rain?
loglm(~species + host + rain + species*rain + host*rain, data=my.table)

 # Given any relationship between host plants and species, does rain change it?
loglm(~species + host + rain + species*host)

Đây là một chút ngoài mức độ thoải mái của tôi và tôi muốn kiểm tra xem tôi đã đặt các mô hình đúng chưa và đây là cách tốt nhất để tiếp cận những câu hỏi này.

Câu trả lời:


10

Có hai cách để giải thích câu hỏi đầu tiên của bạn, được phản ánh theo hai cách bạn đã hỏi: đó là loài có liên quan đến cây chủ không? Đây là loài độc lập với cây chủ, do ảnh hưởng của mưa?

Giải thích đầu tiên tương ứng với một mô hình độc lập chung , trong đó tuyên bố rằng các loài và vật chủ phụ thuộc, nhưng cùng độc lập với việc trời có mưa hay không:

pshr=pshpr

Trong đó là xác suất quan sát rơi vào ô ( s , h , r ) trong đó s chỉ số loài, loại vật chủ h và giá trị mưa r , p s h là xác suất cận biên của ( s , h , ) ô nơi chúng ta sụp đổ qua biến mưa và p r là xác suất cận biên của mưa.pshr(s,h,r)shrpsh(s,h,)pr

Giải thích thứ hai tương ứng với một mô hình độc lập có điều kiện , trong đó tuyên bố rằng các loài và vật chủ là độc lập cho dù trời mưa:

hoặc p s h r = p s r p h r / p rpsh|r=ps|rph|rpshr=psrphr/pr

trong đó là xác suất có điều kiện của ô ( s , h , r ) , với giá trị là r .psh|r(s,h,r)r

Bạn có thể kiểm tra các mô hình này trong R ( loglincũng sẽ hoạt động tốt nhưng tôi quen thuộc hơn glm):

count <- c(12,15,10,13,11,12,12,7)
species <- rep(c("a", "b"), 4)
host <- rep(c("c","c", "d", "d"), 2)
rain <- c(rep(0,4), rep(1,4))
my.table <- xtabs(count ~ host + species + rain)
my.data <- as.data.frame.table(my.table)
mod0 <- glm(Freq ~ species + host + rain, data=my.data, family=poisson())
mod1 <- glm(Freq ~ species * host + rain, data=my.data, family=poisson())
mod2 <- glm(Freq ~ (species + host) * rain, data=my.data, family=poisson())
anova(mod0, mod1, test="Chi") #Test of joint independence
anova(mod0, mod2, test="Chi") #Test of conditional independence

Ở trên, mod1tương ứng với độc lập chung và mod2tương ứng với độc lập có điều kiện, trong khi mod0tương ứng với mô hình độc lập lẫn nhau . Bạn có thể xem các ước tính tham số bằng cách sử dụng , v.v. Như thường lệ, bạn nên kiểm tra xem liệu các giả định mô hình có được đáp ứng hay không. Trong dữ liệu bạn cung cấp, mô hình null thực sự phù hợp đầy đủ.pshr=psphprsummary(mod2)

Một cách khác để tiếp cận câu hỏi đầu tiên của bạn là thực hiện kiểm tra chính xác của Fischer ( fisher.test(xtabs(count ~ host + species))) trên bảng 2x2 bị sập (giải nghĩa đầu tiên) hoặc kiểm tra Mantel-Haenszel ( mantelhaen.test(xtabs(count ~ host + species + rain))) cho các bảng 2x2 phân tầng hoặc viết một bài kiểm tra hoán vị tôn trọng sự phân tầng (diễn giải thứ hai).

Để diễn giải câu hỏi thứ hai của bạn, Mối quan hệ giữa các loài và vật chủ phụ thuộc vào việc trời có mưa không?

mod3 <- glm(Freq ~ species*host*rain - species:host:rain, data=my.data, family=poisson())
mod4 <- glm(Freq ~ species*host*rain, data=my.data, family=poisson())
anova(mod3, mod4, test=”Chi”)
pchisq(deviance(mod3), df.residual(mod3), lower=F)

Mô hình đầy đủ đã mod4bão hòa, nhưng bạn có thể kiểm tra hiệu ứng trong câu hỏi bằng cách xem xét độ lệch mod3như tôi đã làm ở trên.


Cảm ơn Lockoff, đặc biệt là đã giúp tôi loại bỏ suy nghĩ của riêng mình, tạo ra sự khác biệt giữa mô hình độc lập có điều kiện và chung
david w

1

hostrainhostrain

Lệnh R sẽ là:

glm (công thức = loài ~ vật chủ + mưa, gia đình = nhị thức (logit), trọng lượng = số lượng)

p


1
Hồi quy logistic có vẻ ổn, nhưng nó có các ràng buộc bổ sung của tổng hàng và cột được cố định. Đây có thể không phải là trường hợp với dữ liệu Poisson. Tôi tin rằng câu trả lời sẽ không khác nhau nhiều.
suncoolsu

1

Ban đầu tôi đề nghị thử một trong các kỹ thuật phối hợp bị ràng buộc từ vegangói, nhưng trong một suy nghĩ thứ hai tôi nghi ngờ rằng điều này sẽ hữu ích, vì bạn thực sự có 2 bảng dự phòng. Tôi hy vọng rằng phần thứ hai của ví dụ này [PDF: R Trình diễn - Phân tích phân loại] sẽ hữu ích.


Hãy nghĩ rằng liên kết bị hỏng, bạn có nghĩa là liên kết này ở đây ? Điều đó thật hữu ích, cảm ơn!
david w

Vâng, có vẻ như không gian trong URL phá vỡ nó.
ils
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.