Sử dụng hồi quy poisson cho dữ liệu liên tục?


11

Phân phối poisson có thể được sử dụng để phân tích dữ liệu liên tục cũng như dữ liệu rời rạc không?

Tôi có một vài tập dữ liệu trong đó các biến trả lời là liên tục, nhưng giống với phân phối poisson hơn là phân phối bình thường. Tuy nhiên, phân phối poisson là một phân phối rời rạc và thường liên quan đến số hoặc số đếm.


Làm thế nào để phân phối theo kinh nghiệm của bạn khác với Gamma variates, sau đó?
whuber

1
Tôi đã sử dụng phân phối gamma cho các dữ liệu này. Nếu bạn sử dụng phân phối gamma với một liên kết nhật ký, bạn sẽ nhận được gần như chính xác kết quả bạn nhận được từ một mô hình poisson phân tán quá mức. Tuy nhiên, trong hầu hết các gói thống kê tôi quen thuộc với hồi quy poisson đơn giản và linh hoạt hơn nhiều.
dùng3136

Sẽ không có các bản phân phối khác tốt hơn, ví dụ như đề xuất gamma của người dùng?
Peter Flom - Tái lập Monica

1
@PeterFlom - Tôi tự hỏi liệu vấn đề này có xuất hiện nhiều không vì gói glmnet trong R không hỗ trợ họ Gamma hoặc họ Gaussian có chức năng liên kết nhật ký. Tuy nhiên, vì glmnet được sử dụng như một gói mô hình dự đoán (do đó người dùng chỉ quan tâm đến các hệ số mô hình, chứ không phải các lỗi hệ số) và do Poisson dbn tạo ra coeff nhất quán. ước tính cho các mô hình có dạng ln [E (y)] = beta0 + beta * X với các phản hồi liên tục bất kể phân phối, tôi đoán các tác giả của glmnet đã không bận tâm bao gồm các gia đình bổ sung này.
RobertF

Câu trả lời:


12

Giả định chính của một mô hình tuyến tính tổng quát có liên quan ở đây là mối quan hệ giữa phương sai và giá trị trung bình của đáp ứng, dựa trên các giá trị của các yếu tố dự đoán. Khi bạn chỉ định phân phối Poisson, điều này có nghĩa là bạn đang giả sử phương sai điều kiện bằng với giá trị trung bình có điều kiện. * Hình dạng thực tế của phân phối không quan trọng bằng: đó có thể là Poisson, hoặc gamma hoặc bình thường, hoặc bất cứ điều gì khác miễn là mối quan hệ phương sai trung bình đó nắm giữ.

* Bạn có thể nới lỏng giả định rằng phương sai bằng trung bình với một tỷ lệ, và vẫn thường nhận được kết quả tốt.


9

Nếu bạn đang nói về việc sử dụng phản hồi Poisson trong mô hình tuyến tính tổng quát, thì có, nếu bạn sẵn sàng đưa ra giả định rằng phương sai của mỗi quan sát bằng với giá trị trung bình của nó.

Nếu bạn không muốn làm điều đó, một cách khác có thể là chuyển đổi phản hồi (ví dụ: ghi nhật ký).


Tôi nghĩ, ngoài quan điểm của bạn, ngay cả khi @ user3136 không sẵn sàng đưa ra giả định về mean = phương sai, anh ấy / cô ấy có thể sử dụng quasipoissongia đình glm.
suncoolsu

2
Nhưng vấn đề của tôi là tại sao bạn muốn chuyển đổi dữ liệu liên tục thành rời rạc. Đó là mất thông tin về cơ bản. Ngoài ra khi một logbiến đổi đơn giản sẽ hoạt động, tại sao lại làm mất dữ liệu của bạn? Sử dụng glmcác tác phẩm, nhưng mọi kết quả đều dựa trên tiệm cận (có thể có hoặc không giữ được)
suncoolsu

@suncoolsu: 1) quasipoisson làm cho giả định trung bình tỷ lệ thuận với phương sai. 2) Tôi không có nghĩa là biến đổi thành rời rạc, tôi có nghĩa là biến đổi (duy trì tính liên tục) để bạn có thể sử dụng một mô hình khác.
Simon Byrne

yeah - tôi hiểu đồng ý với bạn. Xin lỗi, tôi đã nói về câu hỏi. Quasi-poisson, có tính đến quá mức phải không? (nếu tôi nhớ chính xác, cf Faraway 2006)
suncoolsu

Trong trường hợp cụ thể này, tôi không hài lòng rằng bất kỳ phép chuyển đổi nào tôi đã thử (log, sqrt, box-cox) đã đưa ra một xấp xỉ tốt cho tính quy tắc. Ngẫu nhiên, nếu tôi sử dụng phương pháp chuyển đổi điểm số bình thường thì tôi có thể chuyển đổi hầu hết dữ liệu thành quy tắc gần như đẹp, nhưng tôi không thấy phép chuyển đổi này được sử dụng rộng rãi nên tôi cho rằng có một nhược điểm (rất khó để chuyển đổi ngược).
dùng3136
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.