Phân tích sinh tồn để dự đoán sự kiện


9

Đối với mỗi bản ghi trong bộ dữ liệu của tôi, tôi có các thông tin sau

(X1 , ,Xm ,δ ,T )

Trong đó là các tính năng, là 1 nếu sự kiện đích xảy ra và 0 nếu không và là dấu thời gian của sự kiện đã xảy ra. Cụ thể, có thể bị thiếu nếu không có sự kiện hoặc được đặt theo thời gian kết thúc quá trình theo dõi.XiδTT

Tôi muốn tính toán một chỉ số rủi ro cho mỗi bản ghi trong tập dữ liệu của tôi.

Tôi đã suy nghĩ để đi đến một mô hình phân loại sử dụng các tính năng để dự đoán lớp . Tuy nhiên, rất quan trọng: nếu sự kiện có khả năng xảy ra sớm thì rủi ro sẽ cao hơn.XiδTδ

Đó là lý do tại sao một phân tích sinh tồn nên phù hợp cho vấn đề này. Tôi không cần ước tính đầy đủ của mà chỉ cần một chỉ số duy nhất biểu thị rủi ro cho một bản ghi.S(t)=P(T>t)

Thời gian sống trung bình, có thể được tính cho mỗi bản ghi, dường như là một chỉ số rủi ro tốt - rủi ro càng thấp.

Câu hỏi của tôi là:

  1. Là phân tích sinh tồn phù hợp với mục đích của tôi?
  2. Làm thế nào tôi có thể đánh giá hiệu suất của mô hình của tôi?

Về câu hỏi (2): Tôi rất muốn sử dụng -index của Mitchell chẳng hạn, nhưng tôi không chắc chắn về kết quả dự đoán nào được sử dụng để tính toán nó. Từ cuốn sách Chiến lược mô hình hồi quy của trangellell trang 247:c

Các chỉ số [...] được tính bằng cách lấy tất cả các cặp có thể của đối tượng mà một đối tượng phản ứng và còn lại thì không. Chỉ số là tỷ lệ của các cặp như vậy với người phản hồi có xác suất dự đoán phản ứng cao hơn so với người không phản hồi.c

Nếu phân tích sinh tồn hóa ra là một lựa chọn đúng đắn, tôi nghĩ rằng thật dễ dàng để sử dụng một số phương pháp tiêu chuẩn để giới thiệu các biến số thời gian khác nhau .Xi(t)

Câu trả lời:


3

Là phân tích sinh tồn phù hợp với mục đích của tôi?

Điều duy nhất làm cho điều này dường như ít áp dụng cho phân tích sinh tồn là:

TT

Bạn sẽ cần phải biết giai đoạn cuối cùng mà cá nhân được quan sát là còn sống cho hầu hết các mô hình. Mặt khác, nó nên đơn giản và áp dụng để sử dụng phân tích sinh tồn. Ví dụ: Cox tỷ lệ rủi ro với survival::coxphtrong R hoặc một mô hình tham số với survival::survreg.

Thời gian sống trung bình, có thể được tính cho mỗi bản ghi, dường như là một chỉ số rủi ro tốt - rủi ro càng thấp.

Có, bạn có thể sử dụng thời gian tồn tại trung bình hoặc chỉ là công cụ dự đoán tuyến tính cho hai mô hình (lớp) được đề cập trước đây.

Làm thế nào tôi có thể đánh giá hiệu suất của mô hình của tôi?

cHmisc::rcorr.cens

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.