Hosmer-Lemeshow vs AIC cho hồi quy logistic


12

Nếu Hosmer-Lemeshow cho thấy sự thiếu phù hợp nhưng AIC là thấp nhất trong số tất cả các mô hình .... bạn có nên sử dụng mô hình không?

Nếu tôi xóa một biến, thống kê của Hosmer-Lemeshow là không đáng kể (có nghĩa là không có sự thiếu phù hợp thô). Nhưng AIC tăng.

Chỉnh sửa : Tôi nghĩ nói chung, nếu AIC của các mô hình khác nhau gần nhau (tức là ) với nhau thì về cơ bản chúng giống nhau. Nhưng AIC thì khác nhiều. Điều này dường như chỉ ra rằng người có AIC thấp nhất là người tôi nên sử dụng mặc dù bài kiểm tra Hosmer-Lemeshow chỉ ra điều khác.<2

Ngoài ra có thể thử nghiệm HL chỉ áp dụng cho các mẫu lớn? Nó có công suất thấp cho các cỡ mẫu nhỏ (cỡ mẫu của tôi là ~ 300). Nhưng nếu tôi nhận được một kết quả quan trọng ... Điều này có nghĩa là ngay cả với sức mạnh thấp tôi cũng bị từ chối.

Nó có làm nên sự khác biệt nếu tôi sử dụng AICc so với AIC không? Làm thế nào để bạn có được AICc trong SAS? Tôi biết có thể có vấn đề với bội số. Nhưng một tiên nghiệm tôi đưa ra giả thuyết rằng các biến có ảnh hưởng đến kết quả.

Có ý kiến ​​gì không?

Edit2 : Tôi nghĩ rằng tôi nên sử dụng mô hình với một biến ít hơn và AIC cao hơn với HL không đáng kể. Lý do là bởi vì hai trong số các biến có tương quan với nhau. Vì vậy, loại bỏ một trong những ý nghĩa.


Hãy xem xét rằng tất cả các mô hình của bạn có thể là rác.

@mbq: Làm thế nào để giúp đỡ này?
Thomas

2
Chà, ngay cả trong một nhóm các mô hình không quan trọng cũng có một mô hình có AIC tốt nhất. Dù sao, xin vui lòng không sử dụng câu trả lời để mở rộng câu hỏi của bạn.

Câu trả lời:


12

Thử nghiệm Hosmer-Lemeshow ở một mức độ nào đó đã lỗi thời bởi vì nó đòi hỏi phải tự ý xử lý các xác suất dự đoán và không có sức mạnh tuyệt vời để phát hiện thiếu hiệu chuẩn. Nó cũng không hoàn toàn bị phạt vì quá mức quá mức của mô hình. Các phương pháp tốt hơn có sẵn như Hosmer, DW; Ôm, T.; le Cessie, S. & Lemeshow, S. Một so sánh các thử nghiệm về độ phù hợp cho mô hình hồi quy logistic. Thống kê trong Y học , 1997, 16 , 965-980. Biện pháp mới của họ được thực hiện trong RrmsR2c


Vì vậy, sử dụng thử nghiệm tỷ lệ khả năng sẽ tốt hơn để đánh giá mức độ phù hợp của mô hình với AIC thấp nhất? Bởi vì thử nghiệm này cho thấy rằng không thiếu sự phù hợp.
Thomas

Nhìn vào AIC của hơn 2 mô hình sẽ dẫn đến một số sai lệch lựa chọn / quá mức. AIC không đánh giá rõ ràng mức độ phù hợp ngoại trừ trong bối cảnh tôi đã đưa ra ở trên. Cách tốt nhất để đánh giá sự phù hợp là chứng minh hiệu chuẩn tốt bằng cách sử dụng biểu đồ hiệu chuẩn không đối xứng mịn liên tục và hiển thị ít bằng chứng cho các thành phần phức tạp hơn có thể giúp mô hình dự đoán tốt hơn.
Frank Harrell

Giả sử tôi không có quyền truy cập vào bất kỳ công cụ nào. Mô hình A có thử nghiệm HL không đáng kể cũng có một biến ít hơn so với Mô hình B có thử nghiệm HL đáng kể. Tôi chỉ so sánh hai mô hình này. Mô hình A có AIC thấp nhất và mô hình B có AIC cao hơn nhiều.
Thomas

Ý tôi là Model B có AIC thấp nhất và Model A có AIC cao hơn nhiều.
Thomas

2
rmsP
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.