Đối với phân phối Poisson có nghĩa là , phương sai cũng là . Trong khuôn khổ của các mô hình tuyến tính tổng quát, điều này ngụ ý rằng hàm phương sai là
cho mô hình Poisson. Giả định mô hình này có thể sai vì nhiều lý do khác nhau. Chẳng hạn, dữ liệu đếm quá mức với phương sai lớn hơn so với những gì phân phối Poisson chỉ ra là, ví dụ, thường gặp phải. μμ
V(μ)=μ
Các sai lệch so với giả định phương sai có thể trong bối cảnh hồi quy có nhiều dạng. Đơn giản nhất là hàm phương sai bằng
với một tham số phân tán . Đây là mô hình gần như Poisson. Nó sẽ đưa ra mô hình hồi quy được trang bị tương tự, nhưng suy luận thống kê (giá trị và khoảng tin cậy) được điều chỉnh cho quá mức hoặc dưới mức sử dụng tham số phân tán ước tính.
V(μ)=ψμ
ψ>0p
Hình thức chức năng của hàm phương sai cũng có thể sai. Nó có thể là một đa thức bậc hai
nói. Các ví dụ bao gồm nhị thức, nhị thức âm và mô hình gamma. Việc chọn bất kỳ mô hình nào trong số các mô hình này thay thế cho mô hình Poisson sẽ ảnh hưởng đến mô hình hồi quy được trang bị cũng như suy luận thống kê tiếp theo. Đối với phân phối nhị thức âm với tham số hình dạng , hàm phương sai là
Chúng ta có thể thấy rằng nếu chúng ta có được hàm phương sai cho phân phối Poisson.
V(μ)=aμ2+bμ+c,
λ>0V(μ)=μ(1+μλ).
λ→∞
Để xác định xem hàm phương sai cho mô hình Poisson có phù hợp với dữ liệu hay không, chúng ta có thể ước tính tham số phân tán như OP gợi ý và kiểm tra xem nó có xấp xỉ 1 không (có lẽ sử dụng thử nghiệm chính thức). Một thử nghiệm như vậy không đề xuất một giải pháp thay thế cụ thể, nhưng nó được hiểu rõ nhất trong mô hình quasi-Poisson. Để kiểm tra xem dạng chức năng của hàm phương sai có phù hợp hay không, chúng ta có thể xây dựng phép thử tỷ lệ khả năng của mô hình Poisson ( ) so với mô hình nhị thức âm ( ). Lưu ý rằng nó có phân phối không chuẩn theo giả thuyết null. Hoặc chúng ta có thể sử dụng các phương pháp dựa trên AIC nói chung để so sánh các mô hình không lồng nhau. Các thử nghiệm dựa trên hồi quy cho sự quá mức trong mô hình Poissonλ=∞λ<∞ khám phá một lớp các bài kiểm tra cho các hàm phương sai chung.
Tuy nhiên, trước tiên tôi khuyên bạn nên đề xuất các lô dư nghiên cứu, ví dụ như một biểu đồ của phần dư Pearson hoặc phần dư (hoặc giá trị bình phương của chúng) so với các giá trị được trang bị. Nếu dạng chức năng của phương sai là sai, bạn sẽ thấy đây là hình dạng phễu (hoặc xu hướng cho phần dư bình phương) trong biểu đồ dư. Nếu hình thức chức năng là chính xác, nghĩa là, không có kênh hoặc xu hướng, vẫn có thể có quá mức hoặc thiếu, nhưng điều này có thể được tính bằng cách ước tính tham số phân tán. Lợi ích của biểu đồ dư là nó gợi ý rõ ràng hơn một bài kiểm tra có gì sai với hàm phương sai nếu có bất cứ điều gì.
Trong trường hợp cụ thể của OP, không thể nói nếu 0,8 biểu thị mức độ thiếu từ thông tin đã cho. Thay vì tập trung vào các ước tính 5 và 0,8, trước hết tôi đề nghị điều tra sự phù hợp của các hàm phương sai của mô hình Poisson và mô hình nhị thức âm. Khi hình thức chức năng phù hợp nhất của hàm phương sai được xác định, có thể đưa vào một tham số phân tán, nếu cần, trong một trong hai mô hình để điều chỉnh suy luận thống kê cho bất kỳ sự thừa hoặc thiếu nào. Làm thế nào để làm điều đó một cách dễ dàng trong SAS, thật không may, không phải là thứ tôi có thể giúp đỡ.