Tôi đang cố gắng mô hình hóa dữ liệu đếm trong R rõ ràng là không đủ (Thông số phân tán ~ .40). Đây có lẽ là lý do tại sao một glm
với family = poisson
hoặc một nhị thức âm ( glm.nb
mô hình) là không đáng kể. Khi tôi xem các mô tả về dữ liệu của mình, tôi không có độ lệch điển hình của dữ liệu đếm và phần dư trong hai điều kiện thử nghiệm của tôi cũng đồng nhất.
Vì vậy, câu hỏi của tôi là:
Tôi thậm chí có phải sử dụng các phân tích hồi quy đặc biệt cho dữ liệu đếm của mình không, nếu dữ liệu đếm của tôi không thực sự hoạt động như dữ liệu đếm? Đôi khi tôi phải đối mặt với sự không bình thường (thường là do sự suy yếu), nhưng tôi đã sử dụng phương pháp bootstrap phần trăm để so sánh các phương tiện được cắt xén (Wilcox, 2012) để giải thích cho tính phi quy tắc. Các phương pháp cho dữ liệu đếm có thể được thay thế bằng bất kỳ phương pháp mạnh nào được đề xuất bởi Wilcox và được hiện thực hóa trong gói WRS không?
Nếu tôi phải sử dụng các phân tích hồi quy cho dữ liệu đếm, làm thế nào để tôi tính đến sự phân tán dưới mức? Poisson và phân phối nhị thức âm tính giả định độ phân tán cao hơn, do đó không nên thích hợp, phải không? Tôi đã suy nghĩ về việc áp dụng phân phối quasi-Poisson , nhưng điều đó thường được khuyến nghị cho phân tán quá mức. Tôi đã đọc về các mô hình nhị phân beta mà dường như có thể giải thích cho sự quá mức cũng như sự thiếu sót là có sẵn trong
VGAM
gói của R. Tuy nhiên, các tác giả dường như đề xuất phân phối Poisson bị nghiêng , nhưng tôi không thể tìm thấy nó trong gói .
Bất cứ ai cũng có thể đề xuất một quy trình cho dữ liệu bị thiếu và có thể cung cấp một số mã R ví dụ cho nó?