Phân tích tỷ lệ sống: liên tục và thời gian rời rạc


20

Tôi bối rối về cách quyết định nên coi thời gian là liên tục hay rời rạc trong phân tích sinh tồn. Cụ thể, tôi muốn sử dụng phân tích sinh tồn để xác định các biến số ở cấp độ trẻ em và hộ gia đình có sự khác biệt lớn nhất về tác động của chúng đối với sự sống còn của trẻ em trai và trẻ em gái (đến 5 tuổi). Tôi có một bộ dữ liệu về độ tuổi của trẻ em (tính theo tháng) cùng với một chỉ số cho biết liệu đứa trẻ còn sống, tuổi chết (tính theo tháng) và các biến số khác ở cấp độ trẻ em và hộ gia đình.

Vì thời gian được ghi lại bằng tháng và tất cả trẻ em dưới 5 tuổi, có nhiều thời gian sống sót bị ràng buộc (thường là trong khoảng thời gian nửa năm: 0mos, 6mos, 12mos, v.v.). Dựa trên những gì tôi đã đọc về phân tích sinh tồn, việc có nhiều thời gian sống sót bị ràng buộc khiến tôi nghĩ rằng tôi nên coi thời gian là rời rạc. Tuy nhiên, tôi đã đọc một số nghiên cứu khác trong đó thời gian tồn tại, ví dụ, năm người (và do đó chắc chắn có thời gian tồn tại gắn liền) và phương pháp thời gian liên tục như mối nguy theo tỷ lệ Cox được sử dụng.

Các tiêu chí tôi nên sử dụng để quyết định nên coi thời gian là liên tục hay rời rạc? Đối với dữ liệu và câu hỏi của tôi, sử dụng một số mô hình thời gian liên tục (Cox, Weibull, v.v.) có ý nghĩa trực quan với tôi, nhưng tính chất rời rạc của dữ liệu của tôi và thời gian tồn tại bị ràng buộc dường như đề xuất khác.

Câu trả lời:


10

Việc lựa chọn mô hình sinh tồn cần được hướng dẫn bởi hiện tượng cơ bản. Trong trường hợp này, nó dường như là liên tục, ngay cả khi dữ liệu được thu thập theo cách hơi rời rạc. Nghị quyết một tháng sẽ ổn trong khoảng thời gian 5 năm. Tuy nhiên, số lượng lớn các mối quan hệ sau 6 và 12 tháng khiến người ta tự hỏi rằng bạn thực sự có độ chính xác 1 tháng (dự kiến ​​các mối quan hệ ở mức 0 - đó là một giá trị đặc biệt khi thực sự có rất nhiều cái chết xảy ra). Tôi không chắc chắn những gì bạn có thể làm về điều đó vì điều này rất có thể phản ánh việc làm tròn thực tế hơn là kiểm duyệt giữa chừng.


2
Theo nguyên tắc chung, nếu dữ liệu rời rạc có thể được chia thành mười phần trở lên, thì nó có thể được coi là liên tục, ngay cả khi nó thực sự rời rạc (lấy mẫu mỗi tháng một lần trong sáu tháng rất khác so với lấy mẫu hàng tuần trong sáu tháng hoặc mỗi tháng một lần trong hai năm). Bài viết sau đây cũng đưa ra một số hiểu biết sâu sắc bổ sung vào điều trị dữ liệu rời rạc như liên tục: theanalysisfactor.com/count-data-considered-continuous
Tavrock

4

Tôi nghi ngờ nếu bạn sử dụng các mô hình thời gian liên tục, bạn sẽ muốn sử dụng kiểm duyệt khoảng thời gian, phản ánh thực tế rằng bạn không biết chính xác thời gian thất bại, chỉ là một khoảng thời gian trong đó thất bại xảy ra. Nếu bạn phù hợp với các mô hình hồi quy tham số với kiểm duyệt khoảng thời gian bằng cách sử dụng tối đa thời gian tồn tại bị ràng buộc không phải là vấn đề IIRC.


4

Sẽ có thời gian tồn tại gắn liền trong hầu hết các phân tích, nhưng các mối quan hệ lớn, rõ ràng trong các sự kiện cụ thể là rắc rối. Tôi sẽ suy nghĩ lâu dài về bản thân nghiên cứu, cách thu thập dữ liệu của nó, v.v.

Bởi vì, bên ngoài một số phương pháp cần sử dụng một loại thời gian này hay loại khác, cách bạn mô hình hóa sự sống còn nên phụ thuộc vào việc quá trình cơ bản là rời rạc hay liên tục trên thế giới.


1

Nếu bạn có các biến số thay đổi theo thời gian đối với một số cá nhân (ví dụ thu nhập gia đình có thể thay đổi trong ví dụ của bạn trong suốt cuộc đời của một đứa trẻ), các mô hình sinh tồn (mô hình tham số và mô hình cox) yêu cầu bạn chia dữ liệu thành các khoảng rời rạc được xác định bởi các đồng biến khác nhau.

Tôi thấy bản pdf này của bài giảng của Đức Rodriguez hữu ích.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.