Giải thích đường cong hiệu chuẩn


7

Tôi có một mô hình hồi quy logistic nhị phân có nguồn gốc từng bước. Tôi đã sử dụng calibrate(, bw=200, bw=TRUE)hàm trong rmsgói trong R để ước tính hiệu chuẩn trong tương lai của nó. Đầu ra được đưa ra dưới đây và nó cho thấy ước tính đường chuẩn hiệu chỉnh quá mức bootstrap cho mô hình logistic bước xuống. Tuy nhiên, tôi không chắc làm thế nào để giải thích nó.

nhập mô tả hình ảnh ở đây

Tôi hiểu rằng hiệu chuẩn đề cập đến việc xác suất dự đoán trong tương lai có đồng ý với xác suất quan sát được hay không. Các mô hình dự đoán chịu đựng rằng các dự đoán cho các đối tượng mới là quá cực đoan (nghĩa là xác suất quan sát được của kết quả cao hơn dự đoán cho các đối tượng có nguy cơ thấp và thấp hơn dự đoán cho các đối tượng có nguy cơ cao). Điều này được nhìn thấy bằng cách truy tìm đường cong chấm cao hơn mức lý tưởng (nét đứt) đối với nhóm có nguy cơ thấp và thấp hơn lý tưởng cho nhóm có nguy cơ cao.

Sử dụng cùng một lý do, đường cong điều chỉnh sai lệch dường như tồi tệ hơn, theo nghĩa là nó tạo ra xác suất cực đoan hơn. Là giải thích của tôi chính xác?


1
bw=200nên đọcbw=TRUE
Frank Harrell

Câu trả lời:


2

Đường cong được dán nhãn bias-correcteddường như "quá tự tin": dự đoán của nó Predicted P(Class=1)<0.5quá thấp và dự đoán của nó Predicted P(Class=1)>0.5quá cao so với Actual probability.

Đây cũng là trường hợp cho đường cong được dán nhãn apparent, ngoại trừ tại các điểm cực trị (đại khái: x <= 0,28 hoặc x> = 0,9) dường như thực sự làtôieSS tự tin.

Tôi không chắc chắn về các chi tiết của phương pháp sửa lỗi thiên vị rms, nhưng tôi không nghĩ rằng kết quả nhất thiết là "tệ hơn"; Với sự điều chỉnh, các ước tính xác suất là song song với lý tưởng. Nói cách khác, mặc dù người ta biết rằng mô hình hơi quá tự tin, chúng ta có thể nói rằng sự khác biệt giữa dự đoán trung bình của nó đối với dân số có P (class) = 0,2 là một nửa dự đoán trung bình của nó đối với dân số có P (class) = 0,4 , đó không phải là trường hợp trước đây và có lẽ là những gì người ta sẽ hy vọng.


1
Tôi sẽ không nhấn mạnh vào đoạn cuối, nếu không thì câu trả lời hay @ user99889. Đường cong hiệu chuẩn quá mức bootstrap cho thấy có quá mức và sự phù hợp rõ ràng là tốt về mặt lạc quan. Các đường cong được điều chỉnh bootstrap hầu như luôn ở xa đường 45 độ so với các đường cong rõ ràng. Nhìn chung, tôi muốn nói rằng quá mức vừa phải là hiện tại và kết quả có thể không được chấp nhận để sử dụng tại hiện trường, nếu cần ước tính rủi ro.
Frank Harrell
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.