Hồi quy Poisson bằng 0


14

Giả sử là độc lập vàY=(Y1,,Yn)

Yi=0with probability pi+(1pi)eλiYi=kwith probability (1pi)eλiλik/k!

Giả sử các thông số p = ( p 1 , ... , p n ) thỏa mãnλ=(λ1,,λn)p=(p1,,pn)

log(λ)=Bβlogit(p)=log(p/(1p))=Gλ.

Nếu các đồng biến tương tự ảnh hưởng đến p sao cho B = G , thì tại sao hồi quy Poisson bằng 0 lại cần nhiều gấp đôi tham số so với hồi quy Poisson?λpB=G


2
Bạn vẫn phải ước lượng λ . BG là ma trận thiết kế (dữ liệu), vì vậy những ma trận bằng nhau không làm giảm kích thước của không gian tham số. βλBG
Macro

@Macro: Nếu là một cột của các cột, thì tại sao chúng ta cần thêm 1 tham số để ước tính hơn hồi quy poisson? G
Damien

bạn cũng cần ước tính ("chặn" trong phần logistic của mô hình) và λ i ("chặn" trong phần Poisson của mô hình) để có 2 tham số thay vì 1.piλi
Macro

1
@Rulk, để giảm số lượng tham số bạn phải thực hiện một số ràng buộc. Ví dụ, , mặc dù không có lý do gì để nghĩ rằng điều này làm cho tinh thần - đặc biệt là kể từ khi chức năng liên kết khác nhau. λ=β
Macro

3
@MichaelCécick - nó được gọi là Poisson bằng 0 vì về cơ bản bạn đang "thổi phồng" xác suất nhìn thấy số 0 từ một phân phối Poisson trong khi vẫn duy trì xác suất tương đối giống nhau khi thấy giá trị khác không như Poisson.
jbowman

Câu trả lời:


2

Trong trường hợp Poisson zero-thổi phồng, nếu , sau đó βλ cả hai đều có cùng độ dài, đó là số cột của B hoặc G . Vì vậy, số lượng tham số gấp đôi số cột của ma trận thiết kế, tức là gấp đôi số lượng các biến giải thích bao gồm cả chặn (và bất cứ điều gì cần mã hóa giả).B=GβλBG

Trong một hồi quy Poisson thẳng, không có vector để lo lắng về, không cần phải ước lượng λ . Vì vậy, số lượng tham số chỉ là độ dài của β tức là một nửa số lượng tham số trong trường hợp không tăng.pλβ

Bây giờ, không có lý do cụ thể tại sao phải bằng G , nhưng nói chung nó có ý nghĩa. Tuy nhiên, người ta có thể tưởng tượng một quá trình tạo dữ liệu mà cơ hội của việc có bất kỳ sự kiện nào cả được tạo ra bởi một quá trình G λ và một quá trình hoàn toàn khác nhau B β ổ đĩa có bao nhiêu sự kiện có, được đưa ra phi zero sự kiện. Để làm ví dụ, tôi chọn các lớp học dựa trên điểm thi Lịch sử của họ để chơi một số trò chơi không liên quan, và sau đó quan sát số lượng mục tiêu họ ghi được. Trong trường hợp này B có thể là khá khác nhau để G (nếu những điều lái xe điểm thi Lịch sử là khác nhau đối với những khả năng vận hành trong game) và βλBGGλBβBGβλcó thể có độ dài khác nhau. có thể có nhiều cột hơn B hoặc ít hơn. Vì vậy, mô hình Poisson bằng 0 trong trường hợp đó sẽ có nhiều tham số hơn mô hình Poisson đơn giản.GB

Trong thực tế phổ biến tôi nghĩ hầu hết thời gian.G=B

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.