Phân tích tỷ lệ sống trong R với dữ liệu cắt ngắn

8

Tôi đang làm một phân tích sinh tồn trong R với survivalgói. Tôi nghĩ rằng tôi đang làm việc với dữ liệu bị cắt ngắn, nhưng tôi không hoàn toàn chắc chắn làm thế nào để xử lý nó.

Tôi có một nhóm bệnh nhân được chẩn đoán từ năm 1990 đến 2012. Tất cả các bệnh nhân đều có thời gian chẩn đoán xác định rõ (thời gian nhập viện). Tuy nhiên, kết quả của sự quan tâm (bệnh ngày càng trầm trọng) chỉ được ghi nhận từ năm 2000 trở đi. Đối với những bệnh nhân được chẩn đoán trước năm 2000, do đó không biết liệu kết quả có xảy ra trước thời điểm đó hay không - chỉ sau đó.

Suy nghĩ đầu tiên của tôi là tôi cần hạn chế phân tích trong khoảng thời gian từ năm 2000, chỉ bao gồm các bệnh nhân được chẩn đoán sau thời điểm đó. Sau khi đọc, dường như không cần thiết phải loại trừ bệnh nhân được chẩn đoán trước năm 2000. Điều này dường như là cắt ngắn và có thể được xử lý khi coxphsử dụng Surv(time1, time2, event), trong đó time1 là thời gian cắt ngắn (thời gian từ khi chẩn đoán đến khi bắt đầu tài liệu kết quả) và lần 2 là thời gian xảy ra sự kiện (tính từ thời điểm chẩn đoán).

Đây là hai ví dụ về bệnh nhân trong tập dữ liệu của tôi:

Bệnh nhân # 1: Được chẩn đoán vào năm 1999. Kết quả quan sát được vào năm 2001. Thời gian cắt ngắn: 1 năm (đến 2000). Thời gian đến sự kiện: 2 năm.

Bệnh nhân # 2: Được chẩn đoán vào năm 2001. Kết quả quan sát được vào năm 2005. Thời gian cắt ngắn: 0 năm. Thời gian đến sự kiện: 4 năm.

Đối với những bệnh nhân này, tôi cho rằng thời gian sống sót của họ (tính bằng năm) trong đối tượng sống sót sẽ là (tương ứng):

Surv(time1 = c(1,0), time2 = c(2,4), event = c(1,1))

Đây có phải là một ví dụ về dữ liệu cắt ngắn? Nếu vậy, đây có phải là cách chính xác để xử lý nó?

r survival cox-model truncation

— người dùng3766836
nguồn

3

Tôi giả sử rằng thời gian từ chẩn đoán là biến thời gian cơ bản của bạn. Để đơn giản tôi cũng cho rằng sự kiện chỉ có thể xảy ra một lần.

Bạn có thể coi dữ liệu của mình là bị kiểm duyệt trái. Điều này khác với việc bị cắt ngắn, tuy nhiên.

Đối với dữ liệu cắt ngắn, chúng tôi chỉ đưa vào nghiên cứu bệnh nhân có điều kiện họ không trải qua sự kiện tại thời điểm đưa vào. Điều này sẽ trong trường hợp của bạn để loại bỏ các bệnh nhân đã có sự kiện trước năm 2000. Vì vậy, chúng tôi đang mô hình hóa điều kiện sống sót dựa trên sự sống còn cho đến khi đưa vào.

Điều này khác với kiểm duyệt trái. Kiểm duyệt trái xảy ra khi chúng ta chỉ biết giới hạn trên của thời gian của một sự kiện. Đây chính xác là những gì bạn đề xuất cho mình, nếu tôi hiểu bạn chính xác. Trong trường hợp này, chúng tôi bao gồm tất cả các cá nhân bất kể thời gian sống sót của họ, nhưng đối với một số cá nhân, chúng tôi chỉ biết giới hạn trên của thời gian sống sót của họ.

Chương III của các mô hình thống kê dựa trên các quy trình đếm của PK Andersen và cộng sự. cung cấp một lời giải thích tốt về những điều trên cùng với một số ví dụ của cả hai trường hợp.

— swmo
nguồn

2

Bạn có khả năng chạy afoul của thiên vị thời gian bất tử , điều đó có nghĩa là đoàn hệ được chẩn đoán trước năm 2000 là bất tử thực sự, cho đến sau năm 2000 khi kết quả có thể xảy ra. Per Rothman và Greenland, cách tiếp cận chính xác thực sự là loại trừ (cắt ngắn) 2000 năm quan sát trước khi phân tích, hoặc nếu không có nguy cơ sai lệch giữa các ước tính đoàn hệ đối với giả thuyết không có sự khác biệt về nguy cơ.

Các survivallệnh Survdường như không làm theo cú pháp bạn sử dụng. Điều gì về việc tạo một biến mới trong đó giá trị 0 tương ứng với Thời gian bắt đầu (Nghiên cứu) (ví dụ: năm = 2000?), 1 tương ứng với 1 đơn vị thời gian, v.v?

Bạn sẽ muốn đọc lên: Rothman, KJ và Greenland, S. (1998). Dịch tễ học hiện đại , chương Nghiên cứu đoàn hệ Thời gian người bất tử. Lippincott-Raven, phiên bản 2.

— Alexis
nguồn

Tôi thấy thiên vị thời gian bất tử rất quan trọng, ví dụ, trong các thử nghiệm thuốc nơi bệnh nhân nhận thuốc được đảm bảo sống một thời gian nhất định bằng thiết kế nghiên cứu trong khi nhóm đối chứng thì không, dẫn đến kết quả dương tính (sai) của thuốc. Tuy nhiên, trong trường hợp của tôi, sự thiếu hụt trong dữ liệu kết quả là bằng nhau cho tất cả các bệnh nhân, bất kể phơi nhiễm. Bỏ qua tất cả các bệnh nhân được chẩn đoán trước năm 2000, sẽ dẫn đến việc thiếu sức mạnh thống kê nghiêm trọng, vì nhiều người trong số họ sẽ trải qua kết quả sau năm 2000. Tôi nghĩ rằng phải có cách để kiểm soát sự thiên vị có thể xảy ra mà không bỏ sót những bệnh nhân này.

— dùng3766836

Ah tôi hiểu rồi, điều đó không rõ ràng. Mặt khác: có lẽ dữ liệu của bạn đơn giản là không hỗ trợ phân tích bạn muốn thực hiện.

— Alexis