Sự khác biệt giữa GLM và GEE là gì?


9

Có gì khác biệt giữa mô hình GLM (hồi quy logistic) với biến phản ứng nhị phân bao gồm chủ đề và thời gian là đồng biến và mô hình GEE tương tự có tính đến tương quan giữa các phép đo ở nhiều thời điểm?

GLM của tôi trông như:

Y(binary) ~ A + B1X1(subject id) + B2X2(time) 
              + B3X3(interesting continuous covariate)

với chức năng liên kết logit.

Tôi đang tìm kiếm một lời giải thích đơn giản (nhắm vào nhà khoa học xã hội) về cách thức và lý do thời gian được đối xử khác nhau trong hai mô hình và ý nghĩa của việc giải thích.


6
Tôi tìm thấy những câu trả lời cho những câu hỏi liên quan ( sự khác biệt giữa phương trình ước tính tổng quát và GLMM là gì? , Khi nào cần sử dụng tổng quát phương trình ước tính so với các hiệu ứng hỗn hợp mô hình? ) Rất toàn diện, mặc dù họ là về GLM với các hiệu ứng ngẫu nhiên vs GEE.
chl

1
Bạn có thực sự muốn phù hợp với id chủ đề như một hiệp phương sai liên tục không? Có vẻ lạ khi có biến trả lời là hàm tăng hoặc giảm của id.
khách

Hiệu ứng trung bình dân số so với hiệu ứng cụ thể của chủ đề.
Sẽ

đây là một liên kết đến một bài viết thảo luận về sự khác biệt giữa hai. aje.oxfordjournals.org/content/147/7/694.full.pdf+html
Sẽ

1
Ngoài các câu hỏi @chl liên kết đến ở trên, câu hỏi này cũng thảo luận về các ý tưởng sau: Sự khác biệt giữa các mô hình tuyến tính tổng quát và mô hình hỗn hợp tuyến tính tổng quát trong SPSS .
gung - Phục hồi Monica

Câu trả lời:


12

Có thể có một câu trả lời tốt hơn và chi tiết hơn ngoài kia, nhưng tôi có thể cung cấp cho bạn một số suy nghĩ đơn giản, nhanh chóng. Có vẻ như bạn đang nói về việc sử dụng Mô hình tuyến tính tổng quát (ví dụ: hồi quy logistic điển hình) để phù hợp với dữ liệu được thu thập từ một số đối tượng tại nhiều thời điểm. Lúc đầu, tôi thấy hai vấn đề rõ ràng với cách tiếp cận này.

Đầu tiên, mô hình này giả định rằng dữ liệu của bạn là độc lập với các hiệp phương sai (nghĩa là sau khi đã tính mã giả cho từng đối tượng, gần giống với thuật ngữ chặn riêng lẻ và xu hướng thời gian tuyến tính tương đương với mọi người). Điều này là cực kỳ khó có thể là sự thật. Thay vào đó, gần như chắc chắn sẽ có sự tự tương quan, ví dụ, hai quan sát của cùng một cá nhân gần hơn về thời gian sẽ giống nhau hơn hai quan sát cách xa nhau về thời gian, ngay cả khi đã tính đến thời gian . (Mặc dù chúng có thể độc lập nếu bạn cũng bao gồm một subject ID x timetương tác - tức là xu hướng thời gian duy nhất cho mọi người - nhưng điều này sẽ làm trầm trọng thêm vấn đề tiếp theo.)

Thứ hai, bạn sẽ đốt cháy một số lượng lớn các mức độ tự do ước tính một tham số cho mỗi người tham gia. Bạn có thể có tương đối ít mức độ tự do để cố gắng ước tính chính xác các thông số quan tâm của bạn (tất nhiên, điều này phụ thuộc vào số lượng đo bạn có trên mỗi người).

Trớ trêu thay, vấn đề đầu tiên có nghĩa là khoảng tin cậy của bạn quá hẹp, trong khi vấn đề thứ hai có nghĩa là các TCTD của bạn sẽ rộng hơn nhiều so với trước đây nếu bạn lãng phí hầu hết mức độ tự do của mình. Tuy nhiên, tôi sẽ không dựa vào hai điều này để cân bằng nhau. Đối với những gì nó có giá trị, tôi tin rằng ước tính tham số của bạn sẽ không thiên vị (mặc dù tôi có thể sai ở đây).

Sử dụng các phương trình ước tính tổng quát là thích hợp trong trường hợp này. Khi bạn điều chỉnh mô hình bằng GEE, bạn chỉ định cấu trúc tương quan (chẳng hạn như AR (1)) và có thể khá hợp lý khi dữ liệu của bạn có điều kiện độc lập trên cả hiệp phương sai ma trận tương quan bạn đã chỉ định. Ngoài ra, GEE ước tính hiệp hội có nghĩa là dân số, vì vậy bạn không cần phải đốt cháy một mức độ tự do cho mỗi người tham gia - về bản chất bạn đang tính trung bình đối với họ.

Đối với cách giải thích, theo như tôi biết, nó sẽ giống nhau trong cả hai trường hợp: do các yếu tố khác không đổi, thay đổi một đơn vị trong X3 có liên quan đến thay đổi B3 về tỷ lệ đăng nhập 'thành công' .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.