Tôi đã gặp một số câu hỏi thực tế khi mô hình hóa dữ liệu đếm từ nghiên cứu thử nghiệm bằng cách sử dụng thử nghiệm bên trong chủ đề. Tôi mô tả ngắn gọn về thí nghiệm, dữ liệu và những gì tôi đã làm cho đến nay, tiếp theo là các câu hỏi của tôi.
Bốn bộ phim khác nhau đã được trình chiếu cho một mẫu người trả lời theo trình tự. Sau mỗi bộ phim, một cuộc phỏng vấn được thực hiện trong đó chúng tôi đã đếm số lần xuất hiện của một số tuyên bố nhất định được quan tâm cho RQ (biến đếm dự đoán). Chúng tôi cũng ghi lại số lần xuất hiện tối đa có thể xảy ra (đơn vị mã hóa; biến bù). Ngoài ra, một số tính năng của các bộ phim được đo lường trên quy mô liên tục, trong đó đối với chúng tôi có một giả thuyết nguyên nhân về hiệu ứng của tính năng phim đối với số lượng báo cáo trong khi các yếu tố khác là kiểm soát (dự đoán).
Chiến lược mô hình được áp dụng cho đến nay là như sau:
Ước tính một mô hình Poisson hiệu ứng ngẫu nhiên, trong đó biến nhân quả được sử dụng làm hiệp phương sai và các biến khác làm biến số điều khiển. Mô hình này có độ lệch bằng 'log (đơn vị)' (đơn vị mã hóa). Hiệu ứng ngẫu nhiên được thực hiện trên các đối tượng (số lượng phim cụ thể được lồng trong các đối tượng). Chúng tôi tìm thấy giả thuyết nguyên nhân được xác nhận (sig. Hệ số của biến nhân quả). Trong ước tính, chúng tôi đã sử dụng gói lme4 trong R, đặc biệt là hàm glmer.
Bây giờ tôi có những câu hỏi sau đây. Một vấn đề phổ biến trong hồi quy Poisson là quá mức. Tôi biết rằng điều này có thể được kiểm tra bằng cách sử dụng hồi quy nhị thức âm và đánh giá xem tham số phân tán của nó có cải thiện mô hình phù hợp với mô hình Poisson đơn giản hay không. Tuy nhiên, tôi không biết làm thế nào trong bối cảnh hiệu ứng ngẫu nhiên.
- Làm thế nào tôi nên kiểm tra sự quá mức trong tình huống của tôi? Tôi đã thử nghiệm quá mức trong một hồi quy nhị thức Poisson / âm đơn giản (không có hiệu ứng ngẫu nhiên) mà tôi biết làm thế nào để phù hợp. Các thử nghiệm cho thấy sự hiện diện của quá mức. Tuy nhiên vì các mô hình này không tính đến việc phân cụm nên tôi cho rằng thử nghiệm này không chính xác. Ngoài ra tôi không chắc chắn về vai trò của phần bù cho các bài kiểm tra quá mức.
- Có một cái gì đó giống như một mô hình hồi quy hiệu ứng ngẫu nhiên nhị thức âm và làm thế nào tôi nên phù hợp với nó trong R?
- Bạn có đề xuất cho các mô hình thay thế mà tôi nên thử trên dữ liệu, nghĩa là lấy cấu trúc đo lặp lại, đếm biến và phơi sáng (đơn vị mã hóa) không?