Cách sử dụng đồng biến phụ thuộc thời gian với hồi quy cox trong R


7

Tôi không biết cách tạo đồng biến phụ thuộc thời gian trong R để sử dụng hồi quy cox.

Tôi biết bạn cần sắp xếp lại tập dữ liệu của mình thành các khoảng thời gian giữa các lần sự kiện. Điều này tôi tin rằng tôi có thể làm với các hướng dẫn nổi xung quanh. Sau đó, mặc dù tôi bị mắc kẹt. Giờ thì sao? Đối với mỗi đồng biến bây giờ tôi cần tính giá trị của nó tại mỗi khoảng thời gian cụ thể? Làm thế nào tôi có thể làm điều đó? Tôi có cần quay lại cơ sở dữ liệu và lấy ngày ghi, tốc độ xung đã được ghi lại, sau đó cập nhật giá trị xung cho phù hợp dựa trên ngày không?

Tôi chỉ muốn xác nhận rằng khi thực hiện đồng biến phụ thuộc thời gian, bạn thường phải quay lại và trích xuất thêm thông tin ngày / giờ từ cơ sở dữ liệu và cập nhật tất cả thông tin đồng biến. Về cơ bản, các hướng dẫn giúp chuyển đổi tập dữ liệu của bạn sang định dạng "dài" không phải là điều duy nhất tôi cần làm, phải không?

Câu trả lời:


8

Thật khó khăn khi không nhìn thấy dữ liệu của bạn, vì vậy tôi sẽ thử làm cho nó chung chung. Trước hết, hai cách chính mà khung dữ liệu sẽ trông giống như việc sử dụng trong survivalgói:

Bộ xương trần

  • ID - một biến duy nhất để xác định từng đơn vị phân tích (ví dụ: bệnh nhân, quốc gia, tổ chức)
  • Sự kiện - một biến nhị phân để chỉ sự xuất hiện của sự kiện được thử nghiệm (ví dụ: cái chết, cuộc cách mạng, sự phá sản)
  • Thời gian - Thời gian cho đến khi sự kiện hoặc cho đến khi thông tin kết thúc ( kiểm duyệt phải ). Mô hình Cox được sử dụng tốt nhất với thời gian liên tục, nhưng khi nghiên cứu kết thúc trong nhiều năm (đặc biệt là liên quan đến các quốc gia) thì phép thuật hàng tháng có thể làm được.
  • ( Thường xuyên ) Một số đồng biến

Cho phép sử dụng một mô hình trang điểm cố gắng tìm kiếm mối nguy hiểm cho các quốc gia rơi vào nội chiến ( eventhơn) trong mười năm (bằng các phép thuật hàng tháng). Sử dụng một đồng biến ( previousCivilWar) không phụ thuộc vào thời gian:

# the first country was censored before an event and the second 
# experienced the event after 8 years
id time event prevCivilWar 
 1  120     0   0 
 2   96     1   1 

Thêm đồng biến phụ thuộc thời gian: Phương pháp 1

  • Covariate - Trong trường hợp này, bạn cần biết giá trị ban đầu, và liệu nó có thay đổi hay không và nếu có, khi nào (ở chính tả nào).
  • Thay đổi biến thời gian thành bắt đầu và kết thúc - khi cần thiết để chỉ ra thời gian thay đổi cho (bất kỳ) biến số nào

Ở đây chúng tôi sẽ thêm biến nhị phân để biểu thị mức nghèo> 40% is40pov:

id time1 time2 event prevCivilWar is40pov
 1    0    80   0               0       0
 1   80   120   0               0       1
 2    0    24   0               1       0
 2   24    60   0               1       1
 2   60    96   1               1       1

Khi sử dụng các đồng biến phụ thuộc thời gian, chúng ta cần chỉ định khung thời gian chính xác cho đến khi có bất kỳ thay đổi nào trong bất kỳ hiệp phương sai nào xảy ra. Lưu ý rằng thời gian cần phải chồng chéo. Nếu một chủ đề nhất định không có thay đổi trong bất kỳ hiệp phương sai nào, thì hơn một hàng là đủ.

Phương pháp 2 - tốt nhất để liên tục thay đổi đồng biến Điều này sẽ bao gồm hàng trên mỗi ID duy nhất vì có phép thuật ( hàng nếu bị kiểm duyệt hoặc ít hơn nếu sự kiện xảy ra trước đó). Vì vậy, nếu bạn có một cơ sở dữ liệu với thông tin về khung thời gian nhất định được nghiên cứu, hãy quyết định độ dài chính tả có ý nghĩa với bạn (điều này có ý nghĩa về mặt lý thuyết): Nếu các đồng biến thay đổi theo từng giờ - hãy làm cho nó hàng giờ, v.v. . Một khi bạn đã quyết định độ dài chính tả (ví dụ: tháng) và tổng thời gian (ví dụ: mười năm) so với mỗi ID sẽ có <= phép.kk120

Nếu bạn cần, hãy tạo tập dữ liệu theo chiều dọc với dữ liệu trống ( NA, 0hoặc bất cứ thứ gì) cho các hiệp phương thức phụ thuộc thời gian và tạo hai cột tiện ích bổ sung cho ngày / lần của mỗi phép. Sau đó, bạn có thể truy cập cơ sở dữ liệu và tìm nạp các giá trị cụ thể cho hiệp phương sai của mình vào những ngày / thời gian đó và điền vào. Sẽ ổn nếu các hàng nhất định không có thay đổi nào trong hiệp phương sai. Bạn sẽ kết thúc với một cái gì đó như:

# The variable pov is the poverty percent of population and measured monthly
id time1 time2 event prevCivilWar pov
 1    0     1   0               0   0.34
 1    1     2   0               0   0.34
 ...
 1   79    80   0               0   0.43
 ...
 1  119   120   1               0   0.41
 2    0     1   0               1   0.25
 ...
 2   23    24   0               1   0.42
 ...
 2   95    96   1               1   0.58 

Để biết thêm thông tin về các hệ số và hệ số phụ thuộc vào thời gian, hãy xem Vignette 2016 của Therneau, Crowson và Atkinson .


Bạn có bất kỳ mã hoặc chức năng nào làm điều đó trong R không?
Guilherme Parreira
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.