Có phương pháp nào để điều chỉnh sai lệch trong mô hình nguy cơ theo tỷ lệ Cox gây ra bởi mẫu không được chọn ngẫu nhiên (một cái gì đó giống như hiệu chỉnh của Heckman) không?
Bối cảnh :
Hãy nói rằng tình huống có vẻ như sau:
- Trong hai năm đầu tiên, tất cả khách hàng đều được chấp nhận.
- Sau hai năm, một mô hình Cox PH được xây dựng. Mô hình dự đoán khách hàng sẽ sử dụng dịch vụ của chúng tôi trong bao lâu.
- Do chính sách của công ty kể từ bây giờ, chỉ những khách hàng có xác suất sống sót sau 3 tháng lớn hơn 0,5 mới được chấp nhận, những người khác bị từ chối.
- Sau hai năm nữa, một mô hình mới cần được xây dựng. Vấn đề là chúng tôi chỉ nhắm mục tiêu cho các khách hàng được chấp nhận và chỉ sử dụng những khách hàng này có thể gây ra một số sai lệch nghiêm trọng.