Overdispersion và Underdispersion trong hồi quy nhị thức / Poisson âm


11

Tôi đã thực hiện hồi quy Poisson ở SAS và thấy rằng giá trị bình phương Pearson chia cho mức độ tự do là khoảng 5, cho thấy sự vượt quá đáng kể. Vì vậy, tôi phù hợp với một mô hình nhị thức âm tính với gen genod và tìm thấy giá trị bình phương Pearson chia cho các bậc tự do là 0,80. Điều này bây giờ được coi là bị đánh giá thấp? Nếu vậy, làm thế nào để đi về xử lý này? Tôi đã đọc rất nhiều về sự quá mức và tin rằng tôi biết cách xử lý việc này nhưng thông tin về cách xử lý hoặc xác định xem có thiếu sự thiếu sót hay không. Bất cứ ai có thể giúp đỡ?

Cảm ơn.


Câu trả lời:


17

Đối với phân phối Poisson có nghĩa là , phương sai cũng là . Trong khuôn khổ của các mô hình tuyến tính tổng quát, điều này ngụ ý rằng hàm phương sai là cho mô hình Poisson. Giả định mô hình này có thể sai vì nhiều lý do khác nhau. Chẳng hạn, dữ liệu đếm quá mức với phương sai lớn hơn so với những gì phân phối Poisson chỉ ra là, ví dụ, thường gặp phải. μμ

V(μ)=μ

Các sai lệch so với giả định phương sai có thể trong bối cảnh hồi quy có nhiều dạng. Đơn giản nhất là hàm phương sai bằng với một tham số phân tán . Đây là mô hình gần như Poisson. Nó sẽ đưa ra mô hình hồi quy được trang bị tương tự, nhưng suy luận thống kê (giá trị và khoảng tin cậy) được điều chỉnh cho quá mức hoặc dưới mức sử dụng tham số phân tán ước tính.

V(μ)=ψμ
ψ>0p

Hình thức chức năng của hàm phương sai cũng có thể sai. Nó có thể là một đa thức bậc hai nói. Các ví dụ bao gồm nhị thức, nhị thức âm và mô hình gamma. Việc chọn bất kỳ mô hình nào trong số các mô hình này thay thế cho mô hình Poisson sẽ ảnh hưởng đến mô hình hồi quy được trang bị cũng như suy luận thống kê tiếp theo. Đối với phân phối nhị thức âm với tham số hình dạng , hàm phương sai là Chúng ta có thể thấy rằng nếu chúng ta có được hàm phương sai cho phân phối Poisson.

V(μ)=aμ2+bμ+c,
λ>0
V(μ)=μ(1+μλ).
λ

Để xác định xem hàm phương sai cho mô hình Poisson có phù hợp với dữ liệu hay không, chúng ta có thể ước tính tham số phân tán như OP gợi ý và kiểm tra xem nó có xấp xỉ 1 không (có lẽ sử dụng thử nghiệm chính thức). Một thử nghiệm như vậy không đề xuất một giải pháp thay thế cụ thể, nhưng nó được hiểu rõ nhất trong mô hình quasi-Poisson. Để kiểm tra xem dạng chức năng của hàm phương sai có phù hợp hay không, chúng ta có thể xây dựng phép thử tỷ lệ khả năng của mô hình Poisson ( ) so với mô hình nhị thức âm ( ). Lưu ý rằng nó có phân phối không chuẩn theo giả thuyết null. Hoặc chúng ta có thể sử dụng các phương pháp dựa trên AIC nói chung để so sánh các mô hình không lồng nhau. Các thử nghiệm dựa trên hồi quy cho sự quá mức trong mô hình Poissonλ=λ< khám phá một lớp các bài kiểm tra cho các hàm phương sai chung.

Tuy nhiên, trước tiên tôi khuyên bạn nên đề xuất các lô dư nghiên cứu, ví dụ như một biểu đồ của phần dư Pearson hoặc phần dư (hoặc giá trị bình phương của chúng) so với các giá trị được trang bị. Nếu dạng chức năng của phương sai là sai, bạn sẽ thấy đây là hình dạng phễu (hoặc xu hướng cho phần dư bình phương) trong biểu đồ dư. Nếu hình thức chức năng là chính xác, nghĩa là, không có kênh hoặc xu hướng, vẫn có thể có quá mức hoặc thiếu, nhưng điều này có thể được tính bằng cách ước tính tham số phân tán. Lợi ích của biểu đồ dư là nó gợi ý rõ ràng hơn một bài kiểm tra có gì sai với hàm phương sai nếu có bất cứ điều gì.

Trong trường hợp cụ thể của OP, không thể nói nếu 0,8 biểu thị mức độ thiếu từ thông tin đã cho. Thay vì tập trung vào các ước tính 5 và 0,8, trước hết tôi đề nghị điều tra sự phù hợp của các hàm phương sai của mô hình Poisson và mô hình nhị thức âm. Khi hình thức chức năng phù hợp nhất của hàm phương sai được xác định, có thể đưa vào một tham số phân tán, nếu cần, trong một trong hai mô hình để điều chỉnh suy luận thống kê cho bất kỳ sự thừa hoặc thiếu nào. Làm thế nào để làm điều đó một cách dễ dàng trong SAS, thật không may, không phải là thứ tôi có thể giúp đỡ.


2
+1, đây là thông tin chung tốt. Nó có thể hữu ích hơn cho OP nếu bạn giải quyết cụ thể các câu hỏi rõ ràng của OP: (1) là .8 được đánh giá thấp; & (2) nếu vậy, làm thế nào để đối phó với điều đó.
gung - Phục hồi Monica

@gung, mình đã chỉnh sửa câu trả lời để cho lời khuyên cụ thể hơn. Bạn không thể xác định nếu 0,8 nhỏ hơn đáng kể so với 1 từ thông tin có sẵn và IMHO tập trung vào việc tham số phân tán có phải là 1 hay không. Chỉnh sửa của tôi giải thích những gì tôi nghĩ OP nên tập trung vào thay thế.
NRH
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.