Một cách đơn giản để hiệu chỉnh các mô hình sống sót Cox là sử dụng calibrate
chức năng được cung cấp bởi rms
gói trong R, như trong trang mà bạn đã liên kết . Gói này cung cấp một cph
phương thức cho các mô hình Cox được thiết kế để hoạt động với các phương thức hiệu chuẩn và xác nhận mà nó cung cấp cho một số loại mô hình hồi quy.
Trích dẫn từ trang thủ công: "[ calibrate
u] Ses bootstrapping hoặc xác thực chéo để có được ước tính điều chỉnh sai lệch (quá mức-sửa chữa) của các giá trị dự đoán so với quan sát." Tuy nhiên, thay vì sử dụng các ước tính Kaplan-Meier đã được đánh dấu để cung cấp các giá trị "được quan sát", tuy nhiên, cmethod="hare"
cài đặt mặc định calibrate
cho cph
các mô hình sử dụng các ước tính nội suy hồi quy-spline cho phép các rủi ro không theo tỷ lệ và phi tuyến tính trong khi kiểm duyệt. Mô hình thích ứng này của dữ liệu được quan sát cho phép vẽ đồ thị hiệu chuẩn liên tục trong thời gian tồn tại cụ thể. Phác thảo này cung cấp chi tiết hơn về phương pháp HARE, với một tham chiếu đến bài báo gốc. (Nếu bạn đặt cmethod="KM"
trong cuộc gọi đến, calibrate
bạn sẽ có được sự so sánh với các ước tính của Kaplan-Meier.
Trước khi bạn thực hiện việc này, hãy đảm bảo đọc các trang thủ công để đảm bảo rằng bạn tạo cph
mô hình với các cài đặt chính xác cho phép sử dụng các chức năng này và polspline
gói được cài đặt để cung cấp hare
chức năng.
Frank Harrell, tác giả của rms
gói, so sánh cách tiếp cận HARE của Kaplan-Meier và HARE liên tục ở các trang 506-9 của Regression Modelling Stratgies , ấn bản thứ hai, và (mật mã hơn) trong các ghi chú khóa học liên quan của anh ta , chương 17, trang 18-19 .
Chuyện gì đang xảy ra "dưới mui xe"
Vấn đề hiệu chuẩn cho phân tích sinh tồn là các quan sát là các sự kiện trong khi chúng tôi đang cố gắng hiệu chỉnh xác suất của các sự kiện. Vì vậy, một số loại nội suy là cần thiết. Đối với các mô hình Cox, thời gian tồn tại cụ thể được lấy để phân tích.
Xem xét hiệu chuẩn KM đã đánh dấu. Bạn bắt đầu bằng cách nhóm các trường hợp lại với nhau theo xác suất dự đoán, sau đó với từng nhóm xác suất dự đoán tương tự, bạn vẽ đường cong sinh tồn KM và nội suy giữa một vài trường hợp tại thời điểm sống sót được chọn để có xác suất sống sót "được quan sát" cho nhóm đó.
Theo cách tiếp cận được sử dụng calibrate
cho cph
các mô hình, thay vào đó, trước tiên bạn nội suy mối nguy trong số tất cả các trường hợp dưới dạng hàm chung của các biến dự báo và thời gian. Chức năng chung này, như được cung cấp bởihare
, cho phép mỗi biến dự báo và thời gian được mô hình hóa thành một spline tuyến tính và cho phép tương tác cặp giữa các biến (bao gồm cả thời gian như một biến). Bộ sưu tập các spline và tương tác cung cấp một tập hợp các hàm cơ bản, mỗi hàm là một hàm của các biến dự báo và thời gian. Sau đó, bạn tìm kiếm sự kết hợp của các hàm cơ sở phù hợp nhất với dữ liệu sinh tồn, với các hệ số trọng số của các hàm cơ sở được ước tính bằng cách tối đa hóa khả năng một phần, tương tự như cách mô hình Cox tìm ra hệ số cho chính các biến dự đoán. Độ phức tạp của mô hình (ví dụ: các hàm cơ bản bao gồm, số lượng nút thắt) được chọn theo quy trình xóa và bổ sung từng bước được giải thích độc đáo trong đề cương đã nêu ở trên.
Kết quả của hare
quá trình là một hàm duy nhất cung cấp mối nguy hiểm như là một hàm của tất cả các biến dự báo và thời gian, ở dạng thường sẽ phức tạp hơn nhiều so với mô hình Cox có nguy cơ theo tỷ lệ. Tôi muốn nghĩ về điều này như bắt đầu bằng một phép nội suy trong tất cả các trường hợp mọi lúc, cùng với các giá trị liên quan của các biến dự đoán, thay vì nội suy đến một thời điểm cụ thể cho một tập hợp các trường hợp được sử dụng trong sơ đồ hiệu chỉnh KM đã được xử lý.
Với chức năng nguy hiểm được cung cấp bởi hare
, giờ đây bạn có thể lấy bất kỳ tổ hợp giá trị biến dự báo nào và so sánh xác suất sống sót Cox "dự đoán" tại một thời điểm cụ thể so với ước tính xác suất sống sót được quan sát được cung cấp bởi hare
. (Lưu ý rằng, về nguyên tắc, bạn không bị giới hạn trong các trường hợp có sẵn để so sánh này; có thể kiểm tra bất kỳ sự kết hợp hợp lý nào của các giá trị biến dự báo.) Đường cong hiệu chuẩn sau đó là một biểu đồ được làm mịn bằng xác suất sống "được quan sát" so với "dự đoán" , tại thời điểm mong muốn, trong số tất cả các trường hợp. Các calibrate
phương pháp trong rms
lặp đi lặp lại quá trình này cho nhiều mẫu bootstrapped từ các trường hợp để đánh giá kết quả sẽ khái quát với dân số mà từ đó các trường hợp đã được rút ra như thế nào.
Nếu bạn không chỉ muốn nhìn vào mui xe mà còn giải mã động cơ, điều đó thật dễ dàng trong R. Khi rms
gói được tải, hãy gõ rms:::calibrate.cph
vào dấu nhắc lệnh để lấy mã cho calibrate
phương thức này . Trình bao bọc hare
có sẵn bằng cách gõ hare
tại dấu nhắc khi polspline
gói được tải; phần lớn công việc được thực hiện bởi các hàm được biên dịch có mã nguồn có sẵn từ CRAN .