Làm thế nào để thực hiện âm mưu hiệu chuẩn cho dữ liệu sinh tồn mà không cần dữ liệu binning?

Để lập sơ đồ hiệu chuẩn cho xác suất sống sót được ước tính từ mô hình Cox, người ta có thể chia rủi ro ước tính thành các nhóm, tính toán rủi ro trung bình trong một nhóm và sau đó so sánh với ước tính Kaplan-Meier. Phương pháp thay thế không yêu cầu binning là gì? Các bước cụ thể cần thiết để thực hiện một kỹ thuật như vậy là gì, và logic đằng sau nó là gì? Một số thảo luận có mặt trong câu hỏi này .

survival regression-strategies calibration

— tháng sáu
nguồn

Một cách đơn giản để hiệu chỉnh các mô hình sống sót Cox là sử dụng calibratechức năng được cung cấp bởi rmsgói trong R, như trong trang mà bạn đã liên kết . Gói này cung cấp một cphphương thức cho các mô hình Cox được thiết kế để hoạt động với các phương thức hiệu chuẩn và xác nhận mà nó cung cấp cho một số loại mô hình hồi quy.

Trích dẫn từ trang thủ công: "[ calibrateu] Ses bootstrapping hoặc xác thực chéo để có được ước tính điều chỉnh sai lệch (quá mức-sửa chữa) của các giá trị dự đoán so với quan sát." Tuy nhiên, thay vì sử dụng các ước tính Kaplan-Meier đã được đánh dấu để cung cấp các giá trị "được quan sát", tuy nhiên, cmethod="hare"cài đặt mặc định calibratecho cphcác mô hình sử dụng các ước tính nội suy hồi quy-spline cho phép các rủi ro không theo tỷ lệ và phi tuyến tính trong khi kiểm duyệt. Mô hình thích ứng này của dữ liệu được quan sát cho phép vẽ đồ thị hiệu chuẩn liên tục trong thời gian tồn tại cụ thể. Phác thảo này cung cấp chi tiết hơn về phương pháp HARE, với một tham chiếu đến bài báo gốc. (Nếu bạn đặt cmethod="KM"trong cuộc gọi đến, calibratebạn sẽ có được sự so sánh với các ước tính của Kaplan-Meier.

Trước khi bạn thực hiện việc này, hãy đảm bảo đọc các trang thủ công để đảm bảo rằng bạn tạo cphmô hình với các cài đặt chính xác cho phép sử dụng các chức năng này và polsplinegói được cài đặt để cung cấp harechức năng.

Frank Harrell, tác giả của rmsgói, so sánh cách tiếp cận HARE của Kaplan-Meier và HARE liên tục ở các trang 506-9 của Regression Modelling Stratgies , ấn bản thứ hai, và (mật mã hơn) trong các ghi chú khóa học liên quan của anh ta , chương 17, trang 18-19 .

Chuyện gì đang xảy ra "dưới mui xe"

Vấn đề hiệu chuẩn cho phân tích sinh tồn là các quan sát là các sự kiện trong khi chúng tôi đang cố gắng hiệu chỉnh xác suất của các sự kiện. Vì vậy, một số loại nội suy là cần thiết. Đối với các mô hình Cox, thời gian tồn tại cụ thể được lấy để phân tích.

Xem xét hiệu chuẩn KM đã đánh dấu. Bạn bắt đầu bằng cách nhóm các trường hợp lại với nhau theo xác suất dự đoán, sau đó với từng nhóm xác suất dự đoán tương tự, bạn vẽ đường cong sinh tồn KM và nội suy giữa một vài trường hợp tại thời điểm sống sót được chọn để có xác suất sống sót "được quan sát" cho nhóm đó.

Theo cách tiếp cận được sử dụng calibratecho cphcác mô hình, thay vào đó, trước tiên bạn nội suy mối nguy trong số tất cả các trường hợp dưới dạng hàm chung của các biến dự báo và thời gian. Chức năng chung này, như được cung cấp bởihare, cho phép mỗi biến dự báo và thời gian được mô hình hóa thành một spline tuyến tính và cho phép tương tác cặp giữa các biến (bao gồm cả thời gian như một biến). Bộ sưu tập các spline và tương tác cung cấp một tập hợp các hàm cơ bản, mỗi hàm là một hàm của các biến dự báo và thời gian. Sau đó, bạn tìm kiếm sự kết hợp của các hàm cơ sở phù hợp nhất với dữ liệu sinh tồn, với các hệ số trọng số của các hàm cơ sở được ước tính bằng cách tối đa hóa khả năng một phần, tương tự như cách mô hình Cox tìm ra hệ số cho chính các biến dự đoán. Độ phức tạp của mô hình (ví dụ: các hàm cơ bản bao gồm, số lượng nút thắt) được chọn theo quy trình xóa và bổ sung từng bước được giải thích độc đáo trong đề cương đã nêu ở trên.

Kết quả của harequá trình là một hàm duy nhất cung cấp mối nguy hiểm như là một hàm của tất cả các biến dự báo và thời gian, ở dạng thường sẽ phức tạp hơn nhiều so với mô hình Cox có nguy cơ theo tỷ lệ. Tôi muốn nghĩ về điều này như bắt đầu bằng một phép nội suy trong tất cả các trường hợp mọi lúc, cùng với các giá trị liên quan của các biến dự đoán, thay vì nội suy đến một thời điểm cụ thể cho một tập hợp các trường hợp được sử dụng trong sơ đồ hiệu chỉnh KM đã được xử lý.

Với chức năng nguy hiểm được cung cấp bởi hare, giờ đây bạn có thể lấy bất kỳ tổ hợp giá trị biến dự báo nào và so sánh xác suất sống sót Cox "dự đoán" tại một thời điểm cụ thể so với ước tính xác suất sống sót được quan sát được cung cấp bởi hare. (Lưu ý rằng, về nguyên tắc, bạn không bị giới hạn trong các trường hợp có sẵn để so sánh này; có thể kiểm tra bất kỳ sự kết hợp hợp lý nào của các giá trị biến dự báo.) Đường cong hiệu chuẩn sau đó là một biểu đồ được làm mịn bằng xác suất sống "được quan sát" so với "dự đoán" , tại thời điểm mong muốn, trong số tất cả các trường hợp. Các calibratephương pháp trong rmslặp đi lặp lại quá trình này cho nhiều mẫu bootstrapped từ các trường hợp để đánh giá kết quả sẽ khái quát với dân số mà từ đó các trường hợp đã được rút ra như thế nào.

Nếu bạn không chỉ muốn nhìn vào mui xe mà còn giải mã động cơ, điều đó thật dễ dàng trong R. Khi rmsgói được tải, hãy gõ rms:::calibrate.cphvào dấu nhắc lệnh để lấy mã cho calibratephương thức này . Trình bao bọc harecó sẵn bằng cách gõ haretại dấu nhắc khi polsplinegói được tải; phần lớn công việc được thực hiện bởi các hàm được biên dịch có mã nguồn có sẵn từ CRAN .

— EdM
nguồn

Cảm ơn. Nếu có thể, bạn có thể giải thích logic về việc sử dụng phương pháp 'thỏ' không. Tôi thấy các lợi ích được liệt kê, nhưng tôi không hiểu điều gì đang xảy ra 'dưới mui xe'.

— julieth

@julieth, tôi đã cố gắng mở mui xe cho bạn ngoài câu trả lời của tôi.

— EdM