Một đồng nghiệp đang phân tích một số dữ liệu sinh học cho luận án của cô với một số Heteroscedasticity khó chịu (hình dưới). Cô ấy đang phân tích nó với một mô hình hỗn hợp nhưng vẫn gặp rắc rối với phần dư.
Chuyển đổi log các biến trả lời sẽ dọn sạch mọi thứ và dựa trên phản hồi cho câu hỏi này đây có vẻ là một cách tiếp cận phù hợp. Tuy nhiên, ban đầu, chúng tôi đã nghĩ rằng có vấn đề trong việc sử dụng các biến được chuyển đổi với các mô hình hỗn hợp. Hóa ra là chúng tôi đã giải thích sai một tuyên bố trong Littell & Milliken (2006) cho các mô hình hỗn hợp đã chỉ ra lý do tại sao không phù hợp để chuyển đổi dữ liệu đếm và sau đó phân tích nó bằng mô hình hỗn hợp tuyến tính bình thường (trích dẫn đầy đủ bên dưới) .
Một cách tiếp cận cũng cải thiện phần dư là sử dụng mô hình tuyến tính tổng quát với phân phối Poisson. Tôi đã đọc rằng phân phối Poisson có thể được sử dụng để mô hình hóa dữ liệu liên tục (ví dụ như được thảo luận trong bài đăng này ) và các gói thống kê cho phép điều đó, nhưng tôi không hiểu điều gì sẽ xảy ra khi mô hình phù hợp.
Với mục đích hiểu cách thực hiện các phép tính cơ bản, các câu hỏi của tôi là: Khi bạn khớp phân phối Poisson với dữ liệu liên tục, 1) dữ liệu có được làm tròn đến số nguyên 2 gần nhất không ) dẫn đến việc mất thông tin và 3) Khi nào, nếu có, có thích hợp sử dụng mô hình Poisson cho dữ liệu liên tục không?
Littel & Milliken 2006, pg 529 "chuyển đổi dữ liệu [đếm] có thể phản tác dụng. Ví dụ, một phép biến đổi có thể làm sai lệch sự phân phối các hiệu ứng mô hình ngẫu nhiên hoặc độ tuyến tính của mô hình. Quan trọng hơn, việc chuyển đổi dữ liệu vẫn để ngỏ khả năng Do đó, số lượng dự đoán tiêu cực. Do đó, suy luận từ một mô hình hỗn hợp sử dụng dữ liệu biến đổi là rất đáng ngờ. "