Từ câu hỏi trước của bạn, bạn đã học được rằng GLM được mô tả theo phân phối xác suất, bộ dự báo tuyến tính và hàm liên kết g và được mô tả làηg
ηE( Y| X)= Xβ= Μ = g- 1( η)
Trong đó là hàm liên kết logit và Y được giả sử tuân theo phân phối BernoulligY
YTôi∼ B( μTôi)
mỗi sau phân phối với Bernoulli bình riêng của nó μ i có nghĩa là có điều kiện trên X . Chúng tôi không giả định rằng mỗi Y i đến từ cùng một phân phối, với cùng một giá trị trung bình (đây sẽ là mô hình chỉ đánh chặn Y i = g - 1 ( μ ) ), nhưng tất cả chúng đều có các phương tiện khác nhau. Chúng tôi giả định rằng Y i là độc lập , tức là chúng tôi không phải lo lắng về những điều như tự động tương quan giữa các giá trị Y i tiếp theo, v.v.YTôi μTôiXYTôiYTôi= g- 1( μ )YTôiYTôi
Các iid giả định có liên quan đến sai sót trong hồi quy tuyến tính (tức là Gaussian GLM), nơi mà các mô hình là
yTôi= = β0+β1xTôi+ εTôi= = μTôi+ εTôi
nơi , vì vậy chúng tôi có iid tiếng ồn xung quanh μ i . Đây là lý do tại sao quan tâm đến chẩn đoán dư và chú ý đến phần dư so với âm mưu được trang bị . Bây giờ, trong trường hợp hồi quy logistic của GLM, điều đó không đơn giản vì không có thuật ngữ nhiễu phụ gia như với mô hình Gaussian (xem tại đây , đây và đâyεTôi~ N( 0 , σ2)μTôi). Chúng tôi vẫn muốn số dư là "ngẫu nhiên" quanh 0 và chúng tôi không muốn thấy bất kỳ xu hướng nào trong chúng vì chúng sẽ gợi ý rằng có một số hiệu ứng không được tính trong mô hình, nhưng chúng tôi không cho rằng chúng là bình thường và / hoặc iid . Xem thêm về tầm quan trọng của giả định iid trong chủ đề học thống kê .
Là một sidenote, lưu ý rằng chúng ta thậm chí có thể loại bỏ giả định rằng mỗi đến từ cùng một loại phân phối. Có (không GLM) mô hình đó cho rằng khác nhau Y i 's có thể có các bản phân phối khác nhau với các thông số khác nhau, tức là dữ liệu của bạn xuất phát từ một hỗn hợp của các bản phân phối khác nhau . Trong trường hợp như vậy, chúng tôi cũng cho rằng các giá trị Y i là độc lập , vì các giá trị phụ thuộc, đến từ các phân phối khác nhau với các tham số khác nhau (tức là dữ liệu trong thế giới thực điển hình) là điều mà trong hầu hết các trường hợp sẽ quá phức tạp để mô hình hóa (thường là không thể) .YTôiYTôiYTôi