Biến phụ thuộc phân số: Tại sao không sử dụng hồi quy Poisson?


7

Trong nhiều cài đặt, chúng tôi quan tâm đến việc ước tính một mô hình với biến phụ thuộc phân đoạn. Ví dụ, Papke & Wooldrige (1996) http://faculty.smu.edu/millimet/classes/eco6375/papers/papke%20wooldridge%201996.pdf xem xét 401 tỷ lệ tham gia kế hoạch (k), nơi tỷ lệ được định nghĩa là . Các tác giả sau đó phát triển một phương pháp GLM để ước tính các mô hình như vậy. Nhìn vào tài liệu dữ liệu đếm, tôi tự hỏi người ta không nên chạy hồi quy Poisson trên cùng một bộ hồi quy và như một bù . Điều này có khả năng phụ thuộc vào số lượng tuyệt đối không?PRATE=accountsemplyeesaccountsemployeesaccounts

Điều này khác với một bản sao được đề xuất, Mô hình hồi quy nào là phù hợp nhất để sử dụng với dữ liệu đếm? như câu hỏi của tôi thảo luận về vị trí chính xác của phần bù / mẫu số.


... dưới dạng nhật ký bù (nhân viên) ;-) (nếu được sử dụng liên kết nhật ký)! imho ... bạn đã có kết quả tương tự, nhưng bạn (không theo quy mô nào) ... bạn sẽ không giải thích nó? - chỉ là vấn đề về hương vị ...
Ivan Kshnyasev


Tôi không nghĩ vậy. Tôi đang hỏi về dữ liệu đếm với biến số phơi sáng / phơi sáng rất rõ ràng và khi nào mô hình hóa một cái gì đó là tỷ lệ hoặc số đếm.
Felix H

Bạn phải sử dụng nhật ký (nhân viên) làm phần bù. Bạn có thể cho biết thêm chi tiết về ứng dụng của bạn? Một cuộc thảo luận rất chi tiết về Làm thế nào / Tại sao bù lại được thống kê.stackexchange.com/questions/142338/ , bạn cũng có thể xem số liệu thống kê.stackexchange.com/questions/307369/ Lỗi (Cả hai đều được nhân đôi tốt hơn so với đề xuất ở trên)
kjetil b halvorsen

Câu trả lời:


1

Một lý do để không sử dụng hồi quy Poisson ở đây là vì mỗi nhân viên có thể có nhiều nhất một tài khoản, số lượng tài khoản bị giới hạn bởi số lượng nhân viên. Một bản phân phối Poisson sẽ cho phép xác suất khác không cho số lượng tài khoản vượt quá số lượng nhân viên. Sự hiểu biết của tôi là mặc dù hồi quy Poisson rất mạnh đối với nhiều hành vi vi phạm các giả định, nhưng ít nhất bạn sẽ bị mất hiệu quả từ việc sử dụng hồi quy Poisson so với điều gì đó phù hợp hơn.

Câu hỏi sau đó nên là: liệu hồi quy nhị thức có phù hợp hơn không? (Giả sử cùng một tỷ lệ tham gia cho mỗi nhân viên, số lượng kế hoạch nên được phân phối là trong đó là số lượng nhân viên.) IIRC, lý do hồi quy nhị thức không thể được sử dụng trong trường hợp này là số lượng nhân viên không được biết đến; chỉ có tỷ lệ tham gia chính nó được biết đến. Điều đó loại trừ hồi quy nhị thức --- và cũng sẽ loại trừ hồi quy Poisson với phần bù, ngay cả khi nó phù hợp.pyBinomial(n,p)n


Cảm ơn bạn vì câu trả lời! Tuy nhiên, điều gì sẽ xảy ra nếu chúng ta biết số lượng nhân viên và mỗi nhân viên chỉ có thể có 0 hoặc một tài khoản?
Felix H

Đó là trường hợp hồi quy nhị thức.
The Laconic

Chắc chắn, nhưng sau đó những gì nên được ưa thích? Binomial hay tính với một số bù?
Felix H

Nhị thức. Một phần bù không làm gì để giữ phân phối giới hạn ở trên; về nguyên tắc, số lượng quan sát không thể đến từ phân phối Poisson. Mặt khác, nếu mỗi nhân viên có thể có 0 hoặc một tài khoản và xác suất có tài khoản là như nhau cho mỗi nhân viên trong một nhóm nhân viên, thì tổng số tài khoản được phân phối theo nghĩa đen là Binomial (n, p ). pn
The Laconic
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.