Làm cách nào tôi có thể đánh giá mô hình GEE / logistic phù hợp khi hiệp phương sai có một số dữ liệu bị thiếu?


9

Tôi đã kết hợp hai mô hình phương trình ước lượng tổng quát (GEE) với dữ liệu của mình:

1) Mô hình 1: Kết quả là theo chiều dọc Có / Không biến (A) (năm 1,2,3,4,5) với yếu tố dự đoán liên tục theo chiều dọc (B) trong các năm 1,2,3,4,5.

2) Mô hình 2: Kết quả là cùng một biến Có / Không (A) theo chiều dọc, nhưng bây giờ với công cụ dự đoán của tôi đã cố định ở giá trị năm 1 của nó, tức là buộc phải bất biến thời gian (B).

Do các phép đo bị thiếu trong công cụ dự đoán theo chiều dọc của tôi tại một số điểm thời gian cho các trường hợp khác nhau, số lượng điểm dữ liệu trong mô hình 2 cao hơn trong mô hình 1.

Tôi muốn biết về những so sánh nào tôi có thể thực hiện hợp lệ giữa các tỷ lệ tỷ lệ cược, giá trị p và sự phù hợp của hai mô hình, ví dụ:

  • Nếu OR cho yếu tố dự đoán B lớn hơn trong mô hình 1, tôi có thể nói một cách hợp lệ rằng sự liên kết giữa A và B mạnh hơn trong mô hình 1 không?

  • Làm cách nào tôi có thể đánh giá đâu là mô hình tốt hơn cho dữ liệu của mình. Tôi có đúng không khi nghĩ rằng các bình phương R giả QIC / AIC không nên được so sánh giữa các mô hình nếu số lượng quan sát không giống nhau?

Mọi sự trợ giúp sẽ rất được trân trọng.


Vì Mô hình 2 không thực sự được coi là "lồng nhau" từ Mô hình 1, tôi không biết sử dụng QIC hợp lệ như thế nào để đánh giá sự phù hợp so sánh sẽ như thế nào. Tôi nghĩ rằng tôi đã sử dụng nhiều kỹ thuật cắt bỏ để cân bằng số lượng quan sát, và sau đó người ta có thể so sánh các giá trị QIC cho các mô hình đó. Tuy nhiên, một số tài liệu, ví dụ "Phân tích dữ liệu theo chiều dọc ứng dụng cho dịch tễ học" của Twisk, cho thấy kết quả thực sự không nhất quán bằng cách sử dụng các kỹ thuật MI trên các mô hình có các biến phản ứng nhị phân. Tôi ước tôi có thể giúp nhiều hơn.
Iris Tsui

1
Tại sao các giá trị bị thiếu? Sự thiếu sót của họ có hệ thống theo cách làm cho các giá trị thiếu về cơ bản khác với các giá trị không thiếu?
Macro

Câu trả lời:


1

Tôi chắc chắn sẽ thử nhiều lần cắt cụt (ví dụ với chuột hoặc Amelia trong R), có thể bằng một số phương pháp thay thế để áp đặt các giá trị bị thiếu.

Trong trường hợp xấu nhất bạn có thể coi đó là một phân tích độ nhạy.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.