Giả định của mô hình tuyến tính tổng quát


9

Trên trang 232 của "Một người bạn đồng hành R với hồi quy được áp dụng" Fox và Weisberg lưu ý

Chỉ họ Gaussian có phương sai không đổi và trong tất cả các GLM khác, phương sai có điều kiện của y tại phụ thuộc vào μ ( x )xμ(x)

Trước đó, họ lưu ý rằng phương sai có điều kiện của Poisson là và của nhị thức là .μ ( 1 - μ )μμ(1μ)N

Đối với Gaussian, đây là một giả định quen thuộc và thường được kiểm tra (homoscedasticity). Tương tự, tôi thường thấy phương sai có điều kiện của Poisson được thảo luận như là một giả định của hồi quy Poisson, cùng với các biện pháp khắc phục cho các trường hợp khi nó bị vi phạm (ví dụ nhị thức âm, không thổi phồng, v.v.). Tuy nhiên, tôi không bao giờ thấy phương sai có điều kiện cho nhị thức được thảo luận như một giả định trong hồi quy logistic. Một chút Googling đã không tìm thấy bất kỳ đề cập đến nó.

Tôi đang thiếu gì ở đây?

EDIT sau bình luận của @whuber:

Theo đề xuất, tôi đang xem qua Hosmer & Lemeshow. Điều đó thật thú vị và tôi nghĩ nó cho thấy tại sao tôi (và có lẽ những người khác) bối rối. Ví dụ: từ "giả định" không có trong chỉ mục của cuốn sách. Ngoài ra, chúng ta có điều này (trang 175)

Trong hồi quy logistic, chúng ta phải dựa chủ yếu vào đánh giá trực quan, vì phân phối chẩn đoán theo giả thuyết rằng mô hình phù hợp chỉ được biết đến trong một số cài đặt giới hạn nhất định

Họ cho thấy khá nhiều âm mưu, nhưng tập trung vào các biểu đồ phân tán của các phần dư khác nhau so với xác suất ước tính. Các ô này (ngay cả đối với một mô hình tốt, không có đặc tính mẫu "blobby" của các ô tương tự trong hồi quy OLS, và do đó khó đánh giá hơn. Ngoài ra, chúng không có gì giống với các ô lượng tử.

Trong R, plot.lm cung cấp một tập hợp các ô mặc định đẹp để đánh giá các mô hình; Tôi không biết về một tương đương cho hồi quy logistic, mặc dù nó có thể nằm trong một số gói. Điều này có thể là do các lô khác nhau sẽ cần cho từng loại mô hình. SAS cung cấp một số lô trong PROC LOGISTIC.

Đây chắc chắn là một khu vực của sự nhầm lẫn tiềm năng!


3
Nếu bạn có một bản sao của Hosmer & Lemeshow, Hồi quy logistic ứng dụng, thì hãy xem chương "Đánh giá sự phù hợp của mô hình": phương sai có điều kiện của Binomial xuất hiện ở mọi nơi và được tính toán rõ ràng trong hầu hết các bài kiểm tra của GoF.
whuber

1
Tôi nghĩ rằng giả định nhị thức được áp đặt bởi thử nghiệm thực tế: các phản hồi là độc lập 0/1 nên phân phối nhị thức là mô hình duy nhất mô hình thử nghiệm thực. Ngược lại, giả định phân phối Poisson cho số lượng là không thực tế.
Stéphane Laurent

1
Cảm ơn @whuber. Tôi có cuốn sách đó và sẽ xem nó
Peter Flom

... nhưng chức năng liên kết không tự nhiên và nó xác định phương sai có điều kiện ... vì vậy nhận xét trên của tôi không hợp lý lắm
Stéphane Laurent

Câu trả lời:


3

Các ô này (ngay cả đối với một mô hình tốt, không có đặc tính mẫu "blobby" của các ô tương tự trong hồi quy OLS, và do đó khó đánh giá hơn. Ngoài ra, chúng không có gì giống với các ô lượng tử.

Gói DHARMa R giải quyết vấn đề này bằng cách mô phỏng từ mô hình được trang bị để biến đổi phần dư của bất kỳ GL (M) M nào thành không gian chuẩn. Một khi điều này được thực hiện, tất cả các phương pháp thông thường để đánh giá trực quan và chính thức các vấn đề còn lại (ví dụ như lô qq, quá mức, không đồng nhất, tự tương quan) có thể được áp dụng. Xem các họa tiết gói cho các ví dụ thông qua.

Về nhận xét của @Otto_K: nếu quá mức đồng nhất là vấn đề duy nhất, có lẽ đơn giản hơn là sử dụng hiệu ứng ngẫu nhiên ở cấp độ quan sát, có thể được thực hiện với GLMM nhị thức tiêu chuẩn. Tuy nhiên, tôi nghĩ rằng @PeterFlom cũng quan tâm đến tính không đồng nhất, nghĩa là thay đổi tham số phân tán với một số dự đoán hoặc dự đoán mô hình. Điều này sẽ không được chọn / sửa chữa bằng các kiểm tra / sửa lỗi quá mức tiêu chuẩn, nhưng bạn có thể thấy nó trong các lô dư của DHARMa. Để sửa nó, mô hình hóa sự phân tán như là một chức năng của một thứ khác trong JAGS hoặc STAN có lẽ là cách duy nhất tại thời điểm này.


1

Chủ đề bạn giải thích thường được gọi là quá mức . Trong công việc của tôi, tôi thấy một giải pháp khả thi cho chủ đề đó:

Sử dụng phương pháp Bayes và ước tính phân phối Beta-Binomial. Điều này có lợi thế lớn cho các phân phối khác (gây ra bởi các linh mục khác), để có một giải pháp dạng đóng.

Người giới thiệu:

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.