Hồi quy Poisson so với hồi quy bình phương nhỏ nhất log-Count?


21

Hồi quy Poisson là GLM với chức năng liên kết nhật ký.

Một cách khác để mô hình hóa dữ liệu đếm không được phân phối thông thường là tiền xử lý bằng cách lấy nhật ký (hay đúng hơn là nhật ký (đếm 1 +) để xử lý 0 '). Nếu bạn thực hiện hồi quy bình phương nhỏ nhất trên các phản hồi đếm log, điều đó có liên quan đến hồi quy Poisson không? Nó có thể xử lý các hiện tượng tương tự?


6
Làm thế nào để bạn có kế hoạch lấy logarit của bất kỳ số nào bằng không?
whuber

3
Chắc chắn không tương đương. Một cách dễ dàng để thấy điều này là xem xét điều gì sẽ xảy ra nếu bạn quan sát thấy số không. (Nhận xét được tạo trước khi xem bình luận của @ whuber. Rõ ràng trang này không được làm mới một cách thích hợp trên trình duyệt của tôi.)
Hồng y

OK, tôi rõ ràng nên nói, đăng nhập (đếm 1 +). Rõ ràng là không tương đương, nhưng tự hỏi nếu có một mối quan hệ, hoặc nếu họ có thể xử lý các hiện tượng tương tự.
Brendan OConnor

1
Có một cuộc thảo luận hữu ích về vấn đề này tại đây: blog.stata.com/2011/08/22/ Khăn
Michael Giám mục

Câu trả lời:


22

Một mặt, trong hồi quy Poisson, phía bên trái của phương trình mô hình là logarit của số đếm dự kiến: .log(E[Y|x])

Mặt khác, trong mô hình tuyến tính "tiêu chuẩn", phía bên trái là giá trị mong đợi của biến phản ứng bình thường: . Trong đó, chức năng liên kết là chức năng nhận dạng.E[Y|x]

Bây giờ, chúng ta hãy nói là một biến Poisson và rằng bạn có ý định bình thường hóa nó bằng cách tham gia các log: Y ' = log ( Y ) . Bởi vì Y ' được coi là bình thường bạn có kế hoạch để phù hợp với mô hình tuyến tính tiêu chuẩn mà phía bên trái tay là E [ Y ' | x ] = E [ log ( Y ) | x ] . Nhưng, nói chung, E [ log ( Y ) | x ] log ( EYY=log(Y)YE[Y|x]=E[log(Y)|x] . Kết quả là, hai phương pháp mô hình hóa này là khác nhau.E[log(Y)|x]log(E[Y|x])


6
Trên thực tế, bao giờ trừ khi P ( Y = f ( X ) | X ) = 1 đối với một số σ ( X ) -measurable chức năng f , tức là Y là hoàn toàn xác định bằng X . E(log(Y)|X)log(E(Y|X)) P(Y=f(X)|X)=1σ(X)fYX
Đức Hồng Y

@ thẻ. Rất tốt đặt.
suncoolsu

9

Tôi thấy hai sự khác biệt quan trọng.

Đầu tiên, các giá trị dự đoán (trên thang đo ban đầu) hành xử khác nhau; trong các bình phương nhỏ nhất loglinear chúng đại diện cho các phương tiện hình học có điều kiện; trong mô hình log-poisson đại diện cho các phương tiện có điều kiện. Vì dữ liệu trong loại phân tích này thường bị lệch phải, nên trung bình hình học có điều kiện sẽ đánh giá thấp giá trị trung bình có điều kiện.

Một sự khác biệt thứ hai là phân phối ngụ ý: lognatural so với poisson. Điều này liên quan đến cấu trúc không đồng nhất của phần dư: phương sai dư tỷ lệ với giá trị mong đợi bình phương (lognatural) so với phương sai dư tỷ lệ với giá trị dự kiến ​​(Poisson).


-1

Một sự khác biệt rõ ràng là hồi quy Poisson sẽ mang lại số nguyên dưới dạng dự đoán điểm trong khi hồi quy tuyến tính đếm log có thể mang lại số nguyên không.


12
Làm thế nào mà làm việc? Không dự toán GLM mong đợi , mà không nhất thiết không thể thiếu?
whuber

1
Điều này là sai sự thật. Về mặt cơ học, hồi quy poisson hoàn toàn có thể xử lý các số nguyên. Các lỗi tiêu chuẩn sẽ không được phân phối, nhưng thay vào đó, bạn chỉ có thể sử dụng các lỗi tiêu chuẩn mạnh mẽ.
Matthew
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.