Cấu trúc dữ liệu và hàm gọi cho dữ liệu sự kiện lặp lại với các biến phụ thuộc thời gian


9

Tôi đang cố gắng ước tính ảnh hưởng của 2 loại thuốc ( drug1, drug2) đến khả năng bệnh nhân ngã ( event). Các bệnh nhân có thể ngã nhiều lần và có thể được đưa vào hoặc lấy ra khỏi thuốc bất cứ lúc nào.

Câu hỏi của tôi là làm thế nào dữ liệu nên được cấu trúc liên quan đến khoảng thời gian (ngày), cụ thể là có cần phải chồng chéo giữa các ngày không. Có hai lý do tại sao tôi nghĩ rằng cấu trúc của tôi là sai, đầu tiên là dường như không chính xác N. Tôi cũng nhận được một số lỗi mà khoảng thời gian là một ngày duy nhất (ví dụ time1=4, time2=4) và không chắc chắn cách này nên được mã hóa. Thời gian bắt đầu của các mục tiếp theo có nên là thời gian dừng của mục trước không? Tôi đã thử cả hai cách (có và không có chồng chéo), và trong khi có sự chồng chéo sẽ thoát khỏi cảnh báo, điều đó Nvẫn không chính xác.

Warning message:
In Surv(time = c(0, 2, 7, 15, 20, 0, 18, 27, 32, 35, 39, 46, 53,  :
  Stop time must be > start time, NA created

Ngay bây giờ tôi có dữ liệu được thiết lập trong đó bắt đầu của mục tiếp theo là ngày tiếp theo. Bệnh nhân duy nhất được xác định bởi họ chart numbers.

Time1    Time2    Drug1    Drug2   Event    ChartNo
    0        2        1        0       0        123
    3       10        1        1       1        123
   11       14        1        1       1        123
    0       11        0        1       0        345
    0       19        1        0       1        678
    0        4        0        1       0        900
    5       18        1        1       0        900

Bệnh nhân 123 đã dùng thuốc1 khi bắt đầu đến ngày thứ 2, sau đó họ đã thêm thuốc2. Họ đã đi từ ngày thứ 3 đến ngày thứ 10 trên cả hai loại thuốc trước khi ngã lần đầu tiên, sau đó giảm lần thứ hai vào ngày 14 trong khi vẫn sử dụng cả hai loại thuốc này. Bệnh nhân 345 đã dùng thuốc 2 ngày mà không ngã (sau đó được kiểm duyệt), v.v.

Ước tính thực tế trông như thế này:

S <- Srv(time=time1, time2=time2, event=event)
cox.rms <- cph(S ~ Drug1 + Drug2 + cluster(ChartNo), surv=T)

Mối quan tâm chính ncủa tôi là phân tích của tôi được báo cáo là 2017(số lượng hàng trong dữ liệu), trong khi thực tế tôi chỉ có 314các bệnh nhân duy nhất. Tôi không chắc chắn nếu điều này là bình thường hoặc kết quả của một số lỗi tôi đã thực hiện trên đường đi.

> cox.rms$n
Status
No Event    Event 
    1884      133 

Điều tương tự cũng đúng khi sử dụng coxph()từ gói sinh tồn.

 n= 2017, number of events= 133

Số lượng các sự kiện là chính xác tuy nhiên.

Bài đăng này dường như được thiết lập với 'chồng chéo' mà tôi đã mô tả, nhưng tôi không chắc chắn về điều đó Nvà dường như chúng không được nhóm lại ID.


Các +cluster(ChartNo)hạn nên chăm sóc của các quan sát lo ngại lặp lại. Một cách tiếp cận khác sẽ là thêm + (1|subject)vào phân tích coxme :: coxme.
DWin

Câu trả lời:


1

Định dạng dữ liệu của bạn là chính xác.

Bạn có nhiều hồ sơ cho mỗi bệnh nhân do các sự kiện tái phát và sự phức tạp thêm của thuốc là một hiệp biến thời gian khác nhau. Đầu ra bạn in sử dụng headrất hữu ích để hiểu những dữ liệu này.

Cách tiếp cận điển hình để phân tích các sự kiện lặp lại cũng như các biến số thời gian khác nhau, là định dạng dữ liệu ở định dạng "dài" trong đó mỗi hàng biểu thị một khoảng thời gian quan sát đồng biến rủi ro. Chẳng hạn, chúng tôi thấy bệnh nhân 123 chỉ dùng thuốc1 từ lần 0 đến lần 2, sau đó thay đổi dùng cả Thuốc 1 và Thuốc 2 từ lúc 3. Lúc đó, họ không bị ngã, vì vậy họ quan sát từ 0-2 bị kiểm duyệt tại thời điểm đó bởi vì chúng tôi không biết mùa thu của họ sẽ kéo dài bao lâu nếu họ tiếp tục dùng Thuốc 1 một mình. Tại thời điểm 3, họ được nhập lại vào đoàn hệ được mã hóa là một bệnh nhân dùng cả hai loại thuốc trong 7 đơn vị thời gian sau đó họ trải qua lần ngã đầu tiên. Họ trải qua một lần rơi thứ hai trên cùng một tổ hợp Thuốc chỉ sau 4 đơn vị thời gian.

Số lượng hồ sơ không phải là một bản tóm tắt hữu ích của dữ liệu đoàn hệ. Không có gì đáng ngạc nhiên khi số lượng hàng lớn hơn nhiều so với số lượng bệnh nhân. Thay vào đó, hãy tính tổng số lần từ lúc bắt đầu đến khi dừng và ghi lại nó dưới dạng số lần gặp rủi ro. Mẫu số đoàn hệ rất hữu ích để hiểu tỷ lệ mắc bệnh. Cũng rất hữu ích khi tóm tắt số lượng bệnh nhân thô, nhưng hãy nhớ rằng dữ liệu có định dạng "dài" để ít hơn số lượng hàng trong tập dữ liệu của bạn.

Đối với lỗi, tôi nghĩ bạn có thể cần thêm 1 đơn vị vào ngày "dừng". Nếu bệnh nhân 123 dùng thuốc 1 trong các ngày 0, 1 và 2 và sau đó bắt đầu dùng thuốc 2 vào ngày 3, thì họ đã trải qua 3 ngày có nguy cơ rơi vào thuốc 1. Tuy nhiên, 2-0 = 2 và đó không phải là chính xác mẫu số.

Đối số "cụm" làm gì (thường) là áp đặt một điểm yếu, đây là một loại đánh chặn ngẫu nhiên chiếm tỷ lệ rủi ro có thể là do sự khác biệt có thể quy cho một số yếu tố rủi ro không được đo lường. Tôi không thường xuyên tiến hành phân tích với các yếu tố. Bạn có thể bỏ qua lệnh "cụm" và diễn giải các kết quả dưới dạng tỷ lệ mới mắc. Bạn có thể luân phiên điều chỉnh mô hình cox trong thời gian cho đến khi lần đầu tiên rơi vào tất cả các bệnh nhân và diễn giải các tỷ lệ nguy hiểm là tỷ lệ rủi ro. Tôi nghĩ rằng kết quả yếu đuối sẽ rơi vào đâu đó giữa hai điều này và tôi chưa bao giờ rõ ràng về việc giải thích nên là gì.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.