Tôi có dữ liệu thu thập dài hạn và tôi muốn kiểm tra xem liệu số lượng động vật được thu thập có bị ảnh hưởng bởi hiệu ứng thời tiết hay không. Mô hình của tôi trông như dưới đây:
glmer(SumOfCatch ~ I(pc.act.1^2) +I(pc.act.2^2) + I(pc.may.1^2) + I(pc.may.2^2) +
SampSize + as.factor(samp.prog) + (1|year/month),
control=glmerControl(optimizer="bobyqa", optCtrl=list(maxfun=1e9,npt=5)),
family="poisson", data=a2)
Giải thích về các biến được sử dụng:
- SumOfCatch: số lượng động vật được thu thập
- pc.act.1, pc.act.2: trục của thành phần chính biểu thị điều kiện thời tiết trong quá trình lấy mẫu
- pc.may.1, pc.may.2: trục của PC biểu thị điều kiện thời tiết trong tháng 5
- SampSize: số lượng bẫy bẫy hoặc thu thập các đoạn có độ dài tiêu chuẩn
- samp.prog: phương pháp lấy mẫu
- năm: năm lấy mẫu (từ 1993 đến 2002)
- tháng: tháng lấy mẫu (từ tháng 8 đến tháng 11)
Phần dư của mô hình được trang bị cho thấy độ không đồng nhất đáng kể (độ không đồng nhất?) Khi được vẽ với các giá trị được trang bị (xem Hình 1):
Câu hỏi chính của tôi là: đây có phải là một vấn đề làm cho độ tin cậy của mô hình của tôi bị nghi ngờ không? Nếu vậy, tôi có thể làm gì để giải quyết nó?
Cho đến nay tôi đã thử các cách sau:
- kiểm soát sự quá mức bằng cách xác định các hiệu ứng ngẫu nhiên ở cấp độ quan sát, nghĩa là sử dụng một ID duy nhất cho mỗi quan sát và áp dụng biến ID này làm hiệu ứng ngẫu nhiên; mặc dù dữ liệu của tôi cho thấy sự quá mức đáng kể, nhưng điều này không giúp ích gì khi phần còn lại càng trở nên xấu xí hơn (xem hình 2)
- Tôi trang bị các mô hình mà không có hiệu ứng ngẫu nhiên, với quasi-Poisson glm và glm.nb; cũng mang lại các lô tương tự so với các lô được trang bị cho mô hình ban đầu
Theo như tôi biết, có thể có các cách để ước tính các lỗi tiêu chuẩn phù hợp không đồng nhất, nhưng tôi đã không tìm thấy bất kỳ phương pháp nào như vậy đối với các GLMM (hoặc bất kỳ loại GLMM nào khác) trong R.
Đáp lại @FlorianHartig: số lượng quan sát trong tập dữ liệu của tôi là N = 554, tôi nghĩ đây là một quan sát công bằng. số cho một mô hình như vậy, nhưng tất nhiên, càng nhiều càng tốt. Tôi đăng hai hình, đầu tiên là cốt truyện còn lại theo tỷ lệ DHARMa (được đề xuất bởi Florian) của mô hình chính.
Hình thứ hai là từ một mô hình thứ hai, trong đó sự khác biệt duy nhất là nó chứa hiệu ứng ngẫu nhiên ở mức độ quan sát (cái thứ nhất thì không).
CẬP NHẬT
Hình mối quan hệ giữa biến thời tiết (như dự đoán, tức là trục x) và thành công lấy mẫu (phản hồi):
CẬP NHẬT II.
Số liệu hiển thị giá trị dự đoán so với phần dư: