Tôi hy vọng ai đó có thể giúp với những gì tôi nghĩ là một câu hỏi tương đối đơn giản và tôi nghĩ tôi biết câu trả lời nhưng không có xác nhận nó đã trở thành điều mà tôi không thể chắc chắn.
Tôi có một số dữ liệu đếm như một biến trả lời và tôi muốn đo xem biến đó thay đổi như thế nào với sự hiện diện theo tỷ lệ của một thứ gì đó.
Chi tiết hơn, biến phản ứng là số lượng sự hiện diện của một loài côn trùng ở một số địa điểm, vì vậy, ví dụ một địa điểm được lấy mẫu 10 lần và loài này có thể xảy ra 4 lần.
Tôi muốn xem liệu điều này có tương quan với sự hiện diện theo tỷ lệ của một nhóm các loài thực vật trong tổng thể giao tiếp của thực vật tại các địa điểm này hay không.
Điều này có nghĩa là dữ liệu của tôi trông như sau (đây chỉ là một ví dụ)
Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence
1, 5, 10, 0.5
2, 3, 10, 0.3
3, 7, 9, 0.6
4, 0, 9, 0.1
Dữ liệu cũng bao gồm một hiệu ứng ngẫu nhiên cho vị trí.
Tôi nghĩ về hai phương pháp, một phương pháp sẽ là mô hình tuyến tính ( lmer
) với các côn trùng được chuyển đổi thành tỷ lệ, ví dụ
lmer.model<-lmer(insectCount/NumberOfInsectSamples~
ProportionalPlantGroupPresence+(1|Location),data=Data)
Thứ hai sẽ là một GLMM nhị thức ( glmer
), vd
glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~
ProportionalPlantGroupPresence+(1|Location),
data=Data,family="binomial")
Tôi tin rằng ánh sáng nhị thức là phương pháp chính xác, tuy nhiên chúng tạo ra kết quả khá khác nhau. Tôi dường như không thể tìm thấy một câu trả lời dứt khoát trên mạng mà vẫn không cảm thấy hơi không chắc chắn, và muốn chắc chắn rằng tôi không phạm sai lầm.
Bất kỳ trợ giúp hoặc hiểu biết về các phương pháp thay thế về điều này sẽ được nhiều đánh giá cao.