Thật khó khăn khi không nhìn thấy dữ liệu của bạn, vì vậy tôi sẽ thử làm cho nó chung chung. Trước hết, hai cách chính mà khung dữ liệu sẽ trông giống như việc sử dụng trong survival
gói:
Bộ xương trần
- ID - một biến duy nhất để xác định từng đơn vị phân tích (ví dụ: bệnh nhân, quốc gia, tổ chức)
- Sự kiện - một biến nhị phân để chỉ sự xuất hiện của sự kiện được thử nghiệm (ví dụ: cái chết, cuộc cách mạng, sự phá sản)
- Thời gian - Thời gian cho đến khi sự kiện hoặc cho đến khi thông tin kết thúc ( kiểm duyệt phải ). Mô hình Cox được sử dụng tốt nhất với thời gian liên tục, nhưng khi nghiên cứu kết thúc trong nhiều năm (đặc biệt là liên quan đến các quốc gia) thì phép thuật hàng tháng có thể làm được.
- ( Thường xuyên ) Một số đồng biến
Cho phép sử dụng một mô hình trang điểm cố gắng tìm kiếm mối nguy hiểm cho các quốc gia rơi vào nội chiến ( event
hơn) trong mười năm (bằng các phép thuật hàng tháng). Sử dụng một đồng biến ( previousCivilWar
) không phụ thuộc vào thời gian:
# the first country was censored before an event and the second
# experienced the event after 8 years
id time event prevCivilWar
1 120 0 0
2 96 1 1
Thêm đồng biến phụ thuộc thời gian: Phương pháp 1
- Covariate - Trong trường hợp này, bạn cần biết giá trị ban đầu, và liệu nó có thay đổi hay không và nếu có, khi nào (ở chính tả nào).
- Thay đổi biến thời gian thành bắt đầu và kết thúc - khi cần thiết để chỉ ra thời gian thay đổi cho (bất kỳ) biến số nào
Ở đây chúng tôi sẽ thêm biến nhị phân để biểu thị mức nghèo> 40% is40pov
:
id time1 time2 event prevCivilWar is40pov
1 0 80 0 0 0
1 80 120 0 0 1
2 0 24 0 1 0
2 24 60 0 1 1
2 60 96 1 1 1
Khi sử dụng các đồng biến phụ thuộc thời gian, chúng ta cần chỉ định khung thời gian chính xác cho đến khi có bất kỳ thay đổi nào trong bất kỳ hiệp phương sai nào xảy ra. Lưu ý rằng thời gian cần phải chồng chéo. Nếu một chủ đề nhất định không có thay đổi trong bất kỳ hiệp phương sai nào, thì hơn một hàng là đủ.
Phương pháp 2 - tốt nhất để liên tục thay đổi đồng biến
Điều này sẽ bao gồm hàng trên mỗi ID duy nhất vì có phép thuật ( hàng nếu bị kiểm duyệt hoặc ít hơn nếu sự kiện xảy ra trước đó). Vì vậy, nếu bạn có một cơ sở dữ liệu với thông tin về khung thời gian nhất định được nghiên cứu, hãy quyết định độ dài chính tả có ý nghĩa với bạn (điều này có ý nghĩa về mặt lý thuyết): Nếu các đồng biến thay đổi theo từng giờ - hãy làm cho nó hàng giờ, v.v. . Một khi bạn đã quyết định độ dài chính tả (ví dụ: tháng) và tổng thời gian (ví dụ: mười năm) so với mỗi ID sẽ có <= phép.kk120
Nếu bạn cần, hãy tạo tập dữ liệu theo chiều dọc với dữ liệu trống ( NA
, 0
hoặc bất cứ thứ gì) cho các hiệp phương thức phụ thuộc thời gian và tạo hai cột tiện ích bổ sung cho ngày / lần của mỗi phép. Sau đó, bạn có thể truy cập cơ sở dữ liệu và tìm nạp các giá trị cụ thể cho hiệp phương sai của mình vào những ngày / thời gian đó và điền vào. Sẽ ổn nếu các hàng nhất định không có thay đổi nào trong hiệp phương sai. Bạn sẽ kết thúc với một cái gì đó như:
# The variable pov is the poverty percent of population and measured monthly
id time1 time2 event prevCivilWar pov
1 0 1 0 0 0.34
1 1 2 0 0 0.34
...
1 79 80 0 0 0.43
...
1 119 120 1 0 0.41
2 0 1 0 1 0.25
...
2 23 24 0 1 0.42
...
2 95 96 1 1 0.58
Để biết thêm thông tin về các hệ số và hệ số phụ thuộc vào thời gian, hãy xem Vignette 2016 của Therneau, Crowson và Atkinson .