Chọn lựa chọn thay thế cho hồi quy Poisson cho dữ liệu đếm quá mức


12

Tôi hiện đang phân tích dữ liệu từ một loạt các thử nghiệm hành vi mà tất cả đều sử dụng biện pháp sau. Những người tham gia thí nghiệm này được yêu cầu chọn các manh mối mà người khác có thể sử dụng để giúp giải quyết một loạt 10 đảo chữ. Những người tham gia được dẫn đến tin rằng những người khác này sẽ được hoặc mất tiền, tùy thuộc vào hiệu suất của họ trong việc giải quyết đảo chữ. Các manh mối khác nhau về mức độ hữu ích của chúng. Ví dụ: đối với đảo chữ NUNGRIN, đảo chữ CHẠY, ba manh mối có thể là:

  1. Di chuyển nhanh chóng (không có ích)
  2. Những gì bạn làm trong một cuộc đua marathon (hữu ích)
  3. Không phải lúc nào cũng là một sở thích lành mạnh (không có ích)

Để hình thành biện pháp, tôi đếm số lần (trong số 10) một người tham gia chọn một đầu mối không có ích cho người khác. Trong các thí nghiệm, tôi đang sử dụng nhiều thao tác khác nhau để ảnh hưởng đến sự hữu ích của các manh mối mà mọi người chọn.

Bởi vì biện pháp hữu ích / không hữu ích bị sai lệch khá tích cực (một tỷ lệ lớn mọi người luôn chọn 10 đầu mối hữu ích nhất) và vì biện pháp này là biến số đếm, tôi đã sử dụng Mô hình tuyến tính tổng quát Poisson để phân tích các dữ liệu này. Tuy nhiên, khi tôi đọc thêm về hồi quy Poisson, tôi phát hiện ra rằng vì hồi quy Poisson không ước tính độc lập giá trị trung bình và phương sai của phân phối, nó thường đánh giá thấp phương sai trong một tập hợp dữ liệu. Tôi bắt đầu nghiên cứu các lựa chọn thay thế cho hồi quy Poisson, chẳng hạn như hồi quy quasipoisson hoặc hồi quy nhị thức âm. Tuy nhiên, tôi thừa nhận rằng tôi khá mới đối với các loại mô hình này, vì vậy tôi đến đây để được tư vấn.

Có ai có bất kỳ khuyến nghị nào về việc sử dụng mô hình nào cho loại dữ liệu này không? Có bất kỳ cân nhắc nào khác mà tôi nên biết (ví dụ, một mô hình cụ thể có mạnh hơn mô hình khác không?)? Tôi nên xem xét loại chẩn đoán nào để xác định xem mô hình tôi chọn có xử lý dữ liệu của tôi một cách thích hợp không?


Điều gì về một công cụ ước lượng phương sai / hiệp phương sai mạnh mẽ để làm giảm giả định rằng phương sai bằng với giá trị trung bình?
boscovich

2
Vì chúng là dữ liệu đếm và không âm, vậy còn quassi-poisson hoặc mô hình hồi quy nhị thức âm, có phải là sự phân tán?
Arun

1
Tôi đã nghĩ về việc sử dụng mô hình nhị phân hoặc nhị phân âm, nhưng điều tôi không hiểu là loại đường chéo nào cần xem xét để đảm bảo rằng tôi đang mô hình hóa dữ liệu của mình một cách thích hợp. Vì có một số lựa chọn thay thế (mô hình nhị phân, nhị thức âm và mô hình "không tăng cường"), tôi cũng tự hỏi liệu có cách nào tốt để lựa chọn giữa các lựa chọn thay thế này không. Ví dụ, một phương pháp thường mạnh hơn các phương pháp khác?
Patrick S. Forscher

1
Điều đó phụ thuộc vào dữ liệu. Tại sao không phù hợp với tất cả chúng với dữ liệu của bạn (Poisson, nhị thức âm, Poisson bằng 0 và mô hình nhị phân âm, các mô hình rào cản cho những người trong câu hỏi) và so sánh chúng qua AIC hoặc BIC? Xem cran.r-project.org/web/packages/pscl/vignettes/countreg.pdf Sau đó chọn một cái phù hợp nhất cho dữ liệu của bạn. Bạn cũng có thể sử dụng các mô hình gần giống, nhưng đó là vấn đề của hương vị, tôi không thích chúng nhiều lắm.
Momo

1
Để kiểm tra phân phối nào có thể là mô hình tốt cho phản hồi của bạn, bạn có thể sử dụng hàm vcd :: distplot.
Momo

Câu trả lời:


12

Kết quả của bạn là số đầu mối hữu ích trong số 10, là biến ngẫu nhiên nhị thức. Vì vậy, bạn nên phân tích nó với một số loại hồi quy nhị thức, có thể là bán nhị phân để cho phép vượt quá. Lưu ý rằng Poisson và phân phối nhị thức âm được đặt tên sai là phù hợp với dữ liệu đếm không bị ràng buộc.


2
Tôi đã đề cập đến nhị thức âm bởi vì nó là một thay thế quá mức cho Poisson mà trình tạo đề xuất ban đầu. Vì mỗi người trả lời có x / 10 manh mối, nó có thể là nhị thức, nhưng đối với mỗi trong số 10 đầu mối, có một xác suất cố định cho người trả lời thứ i và các lần xuất hiện là độc lập. Đó có thể là trường hợp.
Michael R. Chernick

2
beta-binomial là một khả năng khác (beta-binomial là nhị thức là nhị thức âm đối với Poisson). betabintrong aodgói sẽ làm điều đó.
Ben Bolker

5

Tôi cũng khuyên bạn nên xem xét nhị thức âm nếu kết quả có thể là vô hạn như đối với Poisson. Bạn có thể muốn tham khảo một trong những cuốn sách của Joe Hilbe. Anh ta có một trên GEE và một về hồi quy nhị thức âm mà anh ta tương phản với hồi quy Poisson. Nhưng như Aniko đã chỉ ra, chỉ có 10 manh mối nên mỗi người được hỏi chỉ có thể có 0, 1, 2, 3, ..., 10 và do đó, cả Poisson và âm mũ đều không phù hợp.


4

Điểm tốt của @Aniko. Một lựa chọn khác là hồi quy Beta. Có một bài báo với tiêu đề "A Lemon Lemon Squeezer" đã cung cấp rất nhiều thông tin về phương pháp này.


2
Nhưng beta sẽ được sử dụng để mô hình hóa tỷ lệ và không phải là biến đếm trên tập hợp số nguyên hữu hạn.
Michael R. Chernick

Nó có công dụng rộng hơn, @MichaelCécick, xem bài viết, khá tốt.
Peter Flom - Tái lập Monica

@PeterFlom Nó cũng không thể xử lý dữ liệu trong khoảng [0,1], chỉ (0,1).
colin
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.