Tôi đang làm một phân tích sinh tồn trong R với survival
gói. Tôi nghĩ rằng tôi đang làm việc với dữ liệu bị cắt ngắn, nhưng tôi không hoàn toàn chắc chắn làm thế nào để xử lý nó.
Tôi có một nhóm bệnh nhân được chẩn đoán từ năm 1990 đến 2012. Tất cả các bệnh nhân đều có thời gian chẩn đoán xác định rõ (thời gian nhập viện). Tuy nhiên, kết quả của sự quan tâm (bệnh ngày càng trầm trọng) chỉ được ghi nhận từ năm 2000 trở đi. Đối với những bệnh nhân được chẩn đoán trước năm 2000, do đó không biết liệu kết quả có xảy ra trước thời điểm đó hay không - chỉ sau đó.
Suy nghĩ đầu tiên của tôi là tôi cần hạn chế phân tích trong khoảng thời gian từ năm 2000, chỉ bao gồm các bệnh nhân được chẩn đoán sau thời điểm đó. Sau khi đọc, dường như không cần thiết phải loại trừ bệnh nhân được chẩn đoán trước năm 2000. Điều này dường như là cắt ngắn và có thể được xử lý khi coxph
sử dụng Surv(time1, time2, event)
, trong đó time1 là thời gian cắt ngắn (thời gian từ khi chẩn đoán đến khi bắt đầu tài liệu kết quả) và lần 2 là thời gian xảy ra sự kiện (tính từ thời điểm chẩn đoán).
Đây là hai ví dụ về bệnh nhân trong tập dữ liệu của tôi:
Bệnh nhân # 1: Được chẩn đoán vào năm 1999. Kết quả quan sát được vào năm 2001. Thời gian cắt ngắn: 1 năm (đến 2000). Thời gian đến sự kiện: 2 năm.
Bệnh nhân # 2: Được chẩn đoán vào năm 2001. Kết quả quan sát được vào năm 2005. Thời gian cắt ngắn: 0 năm. Thời gian đến sự kiện: 4 năm.
Đối với những bệnh nhân này, tôi cho rằng thời gian sống sót của họ (tính bằng năm) trong đối tượng sống sót sẽ là (tương ứng):
Surv(time1 = c(1,0), time2 = c(2,4), event = c(1,1))
Đây có phải là một ví dụ về dữ liệu cắt ngắn? Nếu vậy, đây có phải là cách chính xác để xử lý nó?