Chiến lược phù hợp để quyết định sử dụng mô hình nào với dữ liệu đếm là gì? Tôi đã đếm dữ liệu mà tôi cần để mô hình hóa như một mô hình đa cấp và tôi được khuyến nghị (trên trang web này) rằng cách tốt nhất để làm điều này là thông qua các lỗi hoặc MCMCglmm. Tuy nhiên tôi vẫn đang cố gắng tìm hiểu về thống kê bayes và tôi nghĩ rằng trước tiên tôi nên thử điều chỉnh dữ liệu của mình dưới dạng mô hình tuyến tính tổng quát và bỏ qua cấu trúc lồng nhau của dữ liệu (để tôi có thể có một ý tưởng mơ hồ về những gì mong đợi).
Khoảng 70% dữ liệu là 0 và tỷ lệ phương sai với giá trị trung bình là 33. Vì vậy, dữ liệu khá phân tán.
Sau khi thử một số tùy chọn khác nhau (bao gồm poisson, nhị thức âm, quassi và mô hình thổi phồng bằng 0) tôi thấy rất ít sự nhất quán trong kết quả (thay đổi từ mọi thứ đều có ý nghĩa đối với không có gì đáng kể).
Làm thế nào tôi có thể đưa ra quyết định sáng suốt về việc chọn loại mô hình nào dựa trên lạm phát 0 và phân tán quá mức? Ví dụ, làm thế nào tôi có thể suy ra rằng quassi-poisson thích hợp hơn so với nhị thức âm (hay ngược lại) và làm thế nào tôi có thể biết rằng việc sử dụng hoặc đã xử lý đầy đủ (hoặc không) với các số 0 thừa? Tương tự, làm thế nào để tôi đánh giá rằng không còn phân tán quá mức nếu sử dụng mô hình bơm hơi bằng không? hoặc làm thế nào tôi nên quyết định giữa một poisson thổi phồng bằng 0 và nhị thức âm thổi phồng bằng 0?