Mô hình tham số phương sai của dữ liệu đếm


12

Tôi đang tìm cách mô hình hóa một số dữ liệu, nhưng tôi không chắc tôi có thể sử dụng loại mô hình nào. Tôi có dữ liệu đếm và tôi muốn một mô hình sẽ đưa ra các ước tính tham số về cả giá trị trung bình và phương sai của dữ liệu. Đó là, tôi có nhiều yếu tố dự đoán khác nhau và tôi muốn xác định xem liệu có bất kỳ yếu tố nào ảnh hưởng đến phương sai không (không chỉ ý nghĩa của nhóm).

Tôi biết rằng hồi quy Poisson sẽ không hoạt động vì phương sai bằng giá trị trung bình; giả định này không hợp lệ trong trường hợp của tôi, vì vậy tôi biết có sự quá mức. Tuy nhiên, một mô hình nhị thức âm chỉ tạo ra một tham số quá mức duy nhất, không phải là một chức năng của các yếu tố dự đoán trong mô hình. Mô hình nào có thể làm điều này?

Ngoài ra, một tham chiếu đến một cuốn sách hoặc một bài báo thảo luận về mô hình và / hoặc gói R thực hiện mô hình sẽ được đánh giá cao.


1
Làm thế nào để bạn biết có sự quá mức mà không thực hiện hồi quy Poisson trước? Xét cho cùng, việc so sánh phương sai của các giá trị thô (phản hồi) với giá trị trung bình của chúng không phù hợp: điều quan trọng là sự phù hợp của mô hình Poisson (đây là sự tương tự của việc đánh giá phân phối phần dư trong mô hình tuyến tính so với đánh giá sự phân bố của biến trả lời). Một cách khác để đặt điều này là liên kết giữa các biến độc lập và phản hồi có thể tạo ra sự xuất hiện của sự quá mức ngay cả trong một mô hình Poisson chính xác tuyệt đẹp.
whuber

2
@whuber Đó là một điểm công bằng. Đối với một công cụ dự đoán phân loại duy nhất nhìn vào phương sai và giá trị trung bình của các nhóm phụ sẽ đủ để phát hiện sự quá mức, nhưng đối với hồi quy Poisson đa biến, thì không. Để tranh luận, hãy giả sử cả hồi quy nhị phân Poisson và nhị phân âm đã được thực hiện và nhị thức âm cho thấy sự phù hợp tốt hơn thông qua so sánh mô hình anova. Điều đó sẽ chỉ ra sự quá mức. Cho rằng, làm thế nào phương sai / quá mức có thể được mô hình hóa theo tham số chứ không phải là một hằng số?
Brian Diggs

1
Tôi nghĩ rằng có một chương trong McCullagh và Nelder, các mô hình tuyến tính tổng quát, phiên bản 2 , bao gồm điều này (nhưng bản sao của tôi đang hoạt động) ... sẽ không có khả năng thực sự, nhưng bạn có thể sử dụng khả năng gần đúng, và vì vậy có thể là tiêu đề của chương. Bạn áp dụng các bình phương tối thiểu lặp lại mặc dù không có mô hình xác suất tương ứng.
Karl

Chương 10 của McCullagh và Nelder thảo luận về Mô hình chung về Ý nghĩa và Phân tán, tức là tham số hóa cả giá trị trung bình và phương sai. Khả năng mở rộng gần như là công cụ chính, nhưng trong một số tình huống có thể có mối quan tâm về phương pháp đó
khách

Câu trả lời:


9

Bạn có thể mô hình chính tham số phân tán nhị thức âm như là một hàm của các biến và tham số bằng cách sử dụng gói gamlss trong R. Tôi cung cấp một đoạn trích từ phần giới thiệu về nó:

Tại sao tôi nên sử dụng GAMLSS

Nếu biến phản hồi của bạn là dữ liệu đếm (rời rạc) thì rất có thể phân phối Poisson sẽ không phù hợp. GAMLSS cung cấp nhiều bản phân phối riêng biệt (bao gồm cả nhị thức âm) mà bạn có thể thử. Tham số phân tán cũng có thể được mô hình hóa như là một hàm của các biến giải thích.

Trang web www.gamlss.org có tài liệu và liên kết đến một số bài viết về các phương pháp được sử dụng trong gói.


Cả hai trả lời đều hữu ích và cung cấp tài liệu tham khảo tốt. Tôi đang thưởng tiền thưởng cho cái này bởi vì (a) nó đi trước người kia bốn phút và (b) giải pháp gamlss là mới đối với tôi (tôi quen thuộc với nbreg). Nhưng ngả mũ với @timbp vì đã trả lời tốt; Tôi hy vọng bạn sẽ tiếp tục đóng góp cho trang web của chúng tôi.
whuber

2
@whuber, tôi cũng không muốn chấp nhận câu trả lời là "câu trả lời" vì cả hai đều rất hữu ích. Tôi đã đi với cái này vì nó bao gồm một tham chiếu gói R mà tôi có thể sử dụng; tài liệu tham khảo trong câu trả lời khác đã được đọc tốt và không nên được giảm giá. Cảm ơn bạn đã cung cấp tiền thưởng đã thúc đẩy hai câu trả lời tốt.
Brian Diggs

9

Stata cung cấp lệnh -gnbreg-, cho phép bạn mô hình hóa tham số phân tán. Bạn có thể xem trợ giúp của Stata cho lệnh tại http://www.stata.com/help.cgi?nbreg

Stata gọi đây là mô hình nhị thức âm tổng quát. Joseph Hilbe đã thảo luận về nó trong cuốn sách "Hồi quy nhị thức âm", phần 10,4, như "NB-H: Hồi quy nhị thức âm không đồng nhất".

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.