Tôi đang cố gắng thực hiện một phân tích tồn tại thời gian riêng biệt bằng mô hình hồi quy logistic và tôi không chắc mình hoàn toàn hiểu được quy trình. Tôi sẽ đánh giá rất cao sự giúp đỡ với một vài câu hỏi cơ bản.
Đây là thiết lập:
Tôi đang xem xét thành viên trong một nhóm trong một cửa sổ năm năm. Mỗi thành viên có một hồ sơ thành viên hàng tháng cho mỗi tháng thành viên đó trong nhóm. Tôi đang xem xét tất cả các thành viên có tư cách thành viên bắt đầu trong cửa sổ năm năm (để tránh các vấn đề "kiểm duyệt trái" với các thành viên đã tham gia trước đó). Mỗi bản ghi sẽ được lập chỉ mục theo thời gian, với thời gian một là thành viên tham gia. Vì vậy, một thành viên ở lại trong hai năm rưỡi sẽ có ba mươi hồ sơ hàng tháng, được đánh số từ một đến ba mươi. Mỗi bản ghi cũng sẽ được cung cấp một biến nhị phân, sẽ có giá trị là một cho tháng cuối cùng của thành viên và bằng không; một giá trị của một cho biến nhị phân đánh dấu sự kiện mà thành viên đã rời khỏi nhóm. Đối với mỗi thành viên có thành viên tiếp tục vượt quá cửa sổ phân tích năm năm,
Vì vậy, mô hình hồi quy logistic được xây dựng để dự đoán các giá trị của biến sự kiện nhị phân. Càng xa càng tốt. Một trong những cách điển hình để đánh giá mô hình dự đoán nhị phân là đo mức nâng trên mẫu giữ. Đối với mô hình hồi quy logistic mà tôi đã xây dựng để dự đoán sự kiện kết thúc thành viên, tôi đã tính toán mức tăng trên tập dữ liệu giữ với tỷ lệ năm đến một sự kiện cho các sự kiện. Tôi xếp các giá trị dự đoán thành deciles. Các decile với các giá trị dự đoán cao nhất chứa bảy mươi phần trăm, một thang máy hơn bốn. Hai deciles đầu tiên kết hợp chứa sáu mươi lăm phần trăm của tất cả những cái trong phần giữ. Trong một số bối cảnh nhất định, đây sẽ được coi là một mô hình dự đoán khá tốt, nhưng tôi tự hỏi liệu nó có đủ tốt để thực hiện một phân tích sinh tồn hay không.
Đặt là hàm nguy hiểm cho cá nhân trong tháng và để là xác suất để cá nhân sống sót qua tháng .j k S [ j , k ] j k
Đây là những câu hỏi cơ bản của tôi:
Là chức năng nguy hiểm riêng biệt, , xác suất có điều kiện không sống sót (rời khỏi nhóm) trong mỗi tháng?
Là các giá trị dự đoán từ các ước tính mô hình hồi quy logistic của hàm nguy hiểm? (nghĩa là bằng với giá trị dự đoán của mô hình cho từng trong tháng , hoặc có cần phải thực hiện thêm điều gì để có được ước tính hàm nguy hiểm không?)j k
Là xác suất sống sót đến tháng q đối với cá nhân bằng với sản phẩm của một trừ đi chức năng nguy hiểm từ tháng thứ nhất đến , nghĩa là, ?q S [ j , q ] = ( 1 - h [ j , 1 ] ) ⋅ ( 1 - h [ j , 2 ] ) ⋅ ... ⋅ ( 1 - h [ j , q ] )
Giá trị trung bình của trên tất cả các cá nhân cho mỗi lần có phải là ước tính hợp lý của xác suất sống trung bình của toàn bộ dân số không?j k
Một lô của dân số có nghĩa là xác suất sống sót theo tháng giống với đồ thị Kaplan-Meier hàng tháng?
Nếu câu trả lời cho bất kỳ câu hỏi nào là không, thì tôi có một sự hiểu lầm nghiêm trọng và thực sự có thể sử dụng một số trợ giúp / giải thích. Ngoài ra, có bất kỳ quy tắc nào cho việc mô hình dự đoán nhị phân cần phải tốt như thế nào để tạo ra một hồ sơ sinh tồn chính xác?