Sử dụng GEE khi bạn quan tâm đến việc phát hiện ra hiệu ứng trung bình dân số của hiệp phương sai so với hiệu ứng cụ thể riêng lẻ. Hai điều này chỉ tương đương trong các mô hình tuyến tính, nhưng không phải là phi tuyến tính (ví dụ logistic). Để thấy điều này, ví dụ, mô hình logistic hiệu ứng ngẫu nhiên của quan sát thứ của chủ đề thứ , ;jiYij
log(pij1−pij)=μ+ηi
trong đó là hiệu ứng ngẫu nhiên cho chủ đề và .ηi∼N(0,σ2)ipij=P(Yij=1|ηi)
Nếu bạn đã sử dụng một mô hình hiệu ứng ngẫu nhiên trên các dữ liệu này, thì bạn sẽ có được ước tính tính đến thực tế rằng một nhiễu loạn phân phối bằng 0 thông thường được áp dụng cho từng cá nhân, làm cho nó trở nên cụ thể.μ
Nếu bạn đã sử dụng GEE trên các dữ liệu này, bạn sẽ ước tính tỷ lệ cược nhật ký trung bình dân số. Trong trường hợp này đó sẽ là
ν=log⎛⎝⎜Eη(11+e−μ−ηi)1−Eη(11+e−μ−ηi)⎞⎠⎟
ν≠μ , nói chung. Ví dụ: nếu và , thì . Mặc dù các hiệu ứng ngẫu nhiên có nghĩa là 0 trên thang đo được chuyển đổi (hoặc được liên kết ), nhưng hiệu ứng của chúng không có nghĩa là 0 trên thang đo ban đầu của dữ liệu. Hãy thử mô phỏng một số dữ liệu từ mô hình hồi quy logistic hiệu ứng hỗn hợp và so sánh mức trung bình dân số với logit nghịch đảo của phần chặn và bạn sẽ thấy rằng chúng không bằng nhau, như trong ví dụ này. Sự khác biệt này trong việc giải thích các hệ số là sự khác biệt cơ bản giữa các mô hình hiệu ứng ngẫu nhiên và GEE .μ=1σ2=1ν≈.83
Chỉnh sửa: Nói chung, một mô hình hiệu ứng hỗn hợp không có dự đoán có thể được viết là
ψ(E(Yij|ηi))=μ+ηi
trong đó là một hàm liên kết. Bất cứ khi nàoψ
ψ(Eη(ψ−1(E(Yij|ηi))))≠Eη(E(Yij|ηi))
sẽ có sự khác biệt giữa các hệ số trung bình dân số (GEE) và các hệ số cụ thể riêng lẻ (mô hình hiệu ứng ngẫu nhiên). Nghĩa là, trung bình thay đổi bằng cách chuyển đổi dữ liệu, tích hợp các hiệu ứng ngẫu nhiên trên thang đo được chuyển đổi, và sau đó chuyển đổi trở lại. Lưu ý rằng trong mô hình tuyến tính, (nghĩa là ), đẳng thức giữ, vì vậy chúng là tương đương.ψ(x)=x
Chỉnh sửa 2: Điều đáng chú ý là các lỗi tiêu chuẩn kiểu bánh sandwich "mạnh mẽ" do mô hình GEE tạo ra cung cấp khoảng tin cậy tiệm cận hợp lệ (ví dụ: chúng thực sự chiếm 95% thời gian) ngay cả khi cấu trúc tương quan được chỉ định trong mô hình không chính xác.
Chỉnh sửa 3: Nếu bạn quan tâm đến việc hiểu cấu trúc liên kết trong dữ liệu, ước tính GEE của các hiệp hội nổi tiếng là không hiệu quả (và đôi khi không nhất quán). Tôi đã thấy một tài liệu tham khảo cho điều này nhưng không thể đặt nó ngay bây giờ.