Tôi sẽ phân biệt các phân tích bằng cách sử dụng các lỗi tiêu chuẩn dựa trên mô hình và mạnh mẽ bằng cách gọi cái sau là "GEE", thực tế là một định nghĩa có thể trao đổi. Ngoài lời giải thích tuyệt vời của Scortchi:
GEE có thể được "thiên vị" trong các mẫu nhỏ, ví dụ 10-50 đối tượng: (Lipsitz, Laird, và Harrington, 1990; Emrich và Piedmonte, 1992; Sharples và Breslow, 1992; Lipsitz et al., 1994; Qu, Piedmonte, và Williams, 1994; Gunscar, Getchell, và Chinchilli, 1995; Sherman và le Cessie, 1997.) , tùy thuộc vào giá trị phù hợp nào thể hiện hành vi này và mức độ phù hợp của chúng với xu hướng chung của mô hình hồi quy.
Nói chung, khi mô hình tham số được chỉ định chính xác, bạn vẫn nhận được ước tính lỗi chuẩn chính xác từ các TCTD dựa trên mô hình, nhưng toàn bộ quan điểm sử dụng GEE là để phù hợp với "nếu" rất lớn đó. GEE cho phép nhà thống kê chỉ xác định mô hình xác suất làm việc cho dữ liệu và các tham số (thay vì được giải thích trong khung tham số nghiêm ngặt) được coi là một loại "sàng" có thể tạo ra các giá trị có thể lặp lại bất kể việc tạo dữ liệu không xác định bên dưới cơ chế. Đây là trái tim và linh hồn của phân tích bán tham số, mà một GEE là một ví dụ về.
GEE cũng xử lý các nguồn cộng hưởng không được đo lường trong dữ liệu, ngay cả với đặc điểm kỹ thuật của ma trận tương quan độc lập. Điều này là do việc sử dụng ma trận hiệp phương sai dựa trên mô hình chứ không phải mô hình. Ví dụ, trong mô hình Poisson, bạn có thể quan tâm đến tỷ lệ sinh sản của cá hồi được lấy mẫu từ nhiều dòng khác nhau. Loài ova được thu hoạch từ cá cái có thể có phân bố Poisson cơ bản, nhưng biến thể di truyền bao gồm khả năng di truyền chung và các nguồn tài nguyên có sẵn trong các luồng cụ thể có thể khiến cá trong các luồng đó giống nhau hơn so với các luồng khác. GEE sẽ đưa ra các ước tính lỗi tiêu chuẩn dân số chính xác miễn là tỷ lệ lấy mẫu phù hợp với tỷ lệ dân số của họ (hoặc theo các cách khác được phân tầng).