Giải thích một âm mưu còn sót lại trong hồi quy logistic


8

Tôi đang thực hiện một hồi quy logistic với biến độc lập và quan sát. Tôi đang đánh giá mức độ phù hợp của mô hình để xác định xem dữ liệu có đáp ứng các giả định của mô hình hay không và đã tạo ra biểu đồ dư còn lại sau đây bằng cách sử dụng gói:123 , 99624123,996arm R

nhập mô tả hình ảnh ở đây

Rõ ràng có một số dấu hiệu xấu trong âm mưu này: nhiều điểm nằm ngoài các dải tin cậy và có một mô hình đặc biệt cho phần dư. Câu hỏi của tôi là - tôi có thể gắn các vấn đề này với các giả định cụ thể của mô hình hồi quy logistic không? Chẳng hạn, tôi có thể nói rằng có bằng chứng về sự không tuyến tính trong các biến độc lập hoặc không đồng nhất không? Nếu không, có những chẩn đoán nào khác mà tôi có thể tạo ra để giúp xác định vấn đề nằm ở đâu không?


Dựa trên câu trả lời của Daniel, có vẻ như vấn đề chính là tôi đã sử dụng số dư trên thang đo logit nhưng giá trị dự kiến ​​trên thang đo phản hồi. Nếu tôi tái tạo cốt truyện với phần dư cũng theo thang đo phản hồi thì nó trông như thế này:

nhập mô tả hình ảnh ở đây

đó là đáng tin hơn nhiều.


1
Hãy mô tả lý thuyết thống kê ngụ ý rằng một âm mưu còn lại như vậy là hữu ích.
Frank Harrell

@FrankHarrell Xem thảo luận về Hình 17 trong Gelman et al (2000) "Kiểm tra chẩn đoán cho các mô hình hồi quy dữ liệu rời rạc bằng mô phỏng dự báo sau" - có sẵn tại đây: stat.columbia.edu/~gelman/research/published/dogs.pdf . Cũng trang 97 của Andrew Gelman và Jennifer Hill, Phân tích dữ liệu bằng mô hình hồi quy và đa cấp / phân cấp, Nhà xuất bản Đại học Cambridge
M. Berk

Bạn có thể tóm tắt chính xác những gì bạn đang cố gắng làm với các lô như vậy? Đối với hồi quy logistic nhị phân, không có giả định phân phối và đối với các giả định hồi quy, tốt nhất là chỉ cần phù hợp với mô hình một cách linh hoạt (spline hồi quy, v.v.) hoặc sử dụng các ô dư một phần truyền thống.
Frank Harrell

@FrankHarrell Tôi đã chỉnh sửa câu hỏi để làm rõ rằng tôi đang cố gắng đánh giá liệu dữ liệu có đáp ứng các giả định của mô hình hay không. Cảm ơn đã giới thiệu về các lô còn lại một phần, tôi nghĩ rằng đây chính xác là những gì tôi đang tìm kiếm.
M. Berk

Câu trả lời:


4

Hoặc tôi đang hiểu sai cốt truyện của bạn hoặc có một số vấn đề. Việc bạn có số dư âm cho gần 0 giá trị dự kiến ​​ngụ ý rằng mô hình của bạn đang dự đoán giá trị âm. Điều này không thể xảy ra đối với các mô hình hồi quy logistic chỉ dự đoán trong khoảng (0, 1), trừ khi bạn đang sử dụng đầu ra tỷ lệ cược log của mô hình trong đó không xác định được lỗi dư. Vì hồi quy logistic là một phương pháp phân loại, nên sẽ hữu ích hơn khi xem xét ma trận nhầm lẫn trước tiên. Bạn cũng nên xác định xem biểu đồ dựa trên dữ liệu tàu hoặc một bộ kiểm tra riêng.


Tôi tin rằng bạn đã xác định chính xác vấn đề. Tôi đã có phần dư trên thang đo logit và các giá trị được trang bị trên thang phản hồi (nghĩa là từ 0 đến 1). Tôi đã tái tạo cốt truyện với phần dư trên thang đo phản hồi và nó có vẻ đáng tin hơn nhiều.
M. Berk
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.