Khi nào nên sử dụng Poisson so với GLM nhị phân âm học cho dữ liệu đếm?


21

Tôi đang cố gắng tự bố trí khi thích hợp sử dụng loại hồi quy nào (hình học, Poisson, nhị thức âm) với dữ liệu đếm, trong khung GLM (chỉ có 3 trong số 8 phân phối GLM được sử dụng cho dữ liệu đếm, mặc dù hầu hết những gì Tôi đã đọc các trung tâm xung quanh các phân phối nhị thức và Poisson âm).

Khi nào nên sử dụng Poisson so với GLM nhị phân âm học cho dữ liệu đếm?


Cho đến nay tôi có logic sau: Nó có đếm dữ liệu không? Nếu có, giá trị trung bình và phương sai không bằng nhau? Nếu có, hồi quy nhị thức âm. Nếu không, hồi quy Poisson. Có lạm phát bằng không? Nếu có, Poisson bằng 0 được thổi phồng hoặc nhị phân âm thổi phồng bằng không.

Câu hỏi 1 Dường như không có dấu hiệu rõ ràng nên sử dụng khi nào. Có điều gì để thông báo quyết định đó? Theo những gì tôi hiểu, một khi bạn chuyển sang ZIP, phương sai trung bình là giả định bằng nhau sẽ được nới lỏng để nó khá giống với NB một lần nữa.

Câu hỏi 2 Gia đình hình học phù hợp với vấn đề này ở đâu hoặc loại câu hỏi nào tôi nên hỏi về dữ liệu khi quyết định có nên sử dụng một gia đình hình học trong hồi quy của mình không?

Câu hỏi 3 Tôi thấy mọi người hoán đổi các phân phối nhị thức và Poisson âm mọi lúc nhưng không phải hình học, vì vậy tôi đoán có điều gì đó khác biệt rõ ràng khi sử dụng nó. Nếu vậy, nó là cái gì?

PS Tôi đã tạo một sơ đồ (có thể là đơn giản hóa, từ các bình luận) ( có thể chỉnh sửa ) theo cách hiểu hiện tại của tôi nếu mọi người muốn bình luận / điều chỉnh nó để thảo luận. Đếm dữ liệu: Cây quyết định GLM


Tôi chỉ quen thuộc với lập trình R, nhưng hy vọng điều này sẽ giúp ... stats.stackexchange.com/questions/60643/ dọa
RYO

@RYOENG, tôi đã thấy điều đó và tôi đã đặt ra sự khác biệt được mô tả trong câu hỏi của tôi với cây logic. Tôi đặc biệt quan tâm đến một dist ít thảo luận, cụ thể là dist hình học.
timothy.s.lau

(UPDATE) @Nick Cox 's trả lời ở đây: stats.stackexchange.com/questions/67547/when-to-use-gamma-glms dường như đầu hàng tình cảm tôi đã nhìn thấy vậy, đến nay việc tìm kiếm "Thật khó để pin xuống khá khi để sử dụng nó ngoài câu trả lời trống rỗng bất cứ khi nào nó hoạt động tốt nhất "
timothy.s.lau

@Glen_b bắt tốt, tôi cập nhật logic.
timothy.s.lau

Có lẽ bạn cũng an toàn khi xóa đoạn văn về việc bị mod bởi các mod.
Glen_b -Reinstate Monica

Câu trả lời:


12

μ+1/θμ2μθα= =1/θθ= =θ= =1

θ

Tất nhiên, cũng có vô số phân phối dữ liệu đếm đơn hoặc đa tham số khác (bao gồm cả hợp chất Poisson mà bạn đã đề cập) đôi khi có thể hoặc không thể dẫn đến sự phù hợp tốt hơn đáng kể.

Đối với các số 0 thừa: Hai chiến lược tiêu chuẩn là sử dụng phân phối dữ liệu đếm bằng 0 hoặc mô hình rào cản bao gồm mô hình nhị phân cho 0 hoặc lớn hơn cộng với mô hình dữ liệu đếm không bị cắt ngắn. Như bạn đã đề cập đến các số 0 dư thừa và quá mức có thể bị nhầm lẫn nhưng thường thì quá mức đáng kể vẫn còn ngay cả sau khi điều chỉnh mô hình cho các số 0 dư. Một lần nữa, trong trường hợp nghi ngờ, tôi khuyên bạn nên sử dụng mô hình lạm phát hoặc vượt rào dựa trên NB theo logic tương tự như trên.

Disclaimer: Đây là một tổng quan rất ngắn gọn và đơn giản. Khi áp dụng các mô hình trong thực tế, tôi khuyên bạn nên tham khảo sách giáo khoa về chủ đề này. Cá nhân, tôi thích những cuốn sách dữ liệu đếm của Winkelmann và của Cameron & Trivingi. Nhưng có những cái tốt khác là tốt. Đối với một cuộc thảo luận dựa trên R, bạn cũng có thể thích bài viết của chúng tôi trong JSS ( http://www.jstatsoft.org/v27/i08/ ).


4
μ+μ2>μ

3
μ

3
Như bạn có thể nói từ những bình luận trước đây của tôi: Tôi không phải là người hâm mộ của sơ đồ đơn giản như vậy. Để chọn một mô hình tốt, người ta cần hiểu các kết nối giữa các mô hình và mối quan hệ của chúng với ứng dụng thực tế. Việc bạn có thể quan tâm đến hình học hay không phụ thuộc vào trường hợp ứng dụng bạn có. Tương tự, đối với lạm phát bằng 0 so với vượt rào (mà bạn đã bỏ qua khỏi biểu đồ của mình). Cuối cùng, thứ tự của các câu hỏi không nhất thiết giống nhau cho tất cả các ứng dụng, v.v.
Achim Zeileis

2
Tôi nhận được rằng bản phác thảo của tôi có vẻ hơi quá. Nhưng đối với sinh viên ngành khoa học, không có gì lạ khi bắt đầu với lược đồ khá đơn giản, nếu bạn đã tham gia các lớp vật lý mà bạn quen thuộc với tần suất họ thay đổi và phá vỡ "quy tắc" mà bạn đã học trước đây, đó là nền tảng của sau này chuyên gia và hiểu sắc thái. Vì vậy, để học hỏi, tôi là một sinh viên tốt nghiệp, tôi chỉ đơn giản là cố gắng hiểu một cách "chính xác" hơn về những điều cơ bản mà tôi có thể xây dựng sau này, ví dụ như những trở ngại, v.v ... Cảm ơn các tài liệu tham khảo BTW, tôi sẽ điều tra sách giáo khoa bạn đã đề cập cũng như giấy của bạn.
timothy.s.lau

1
đăng nhập(μtôi)= =xtôiβ
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.