Tôi hiện đang làm việc với một bộ lớn dữ liệu yêu cầu bảo hiểm y tế bao gồm một số yêu cầu về phòng thí nghiệm và dược phẩm. Tuy nhiên, thông tin phù hợp nhất trong bộ dữ liệu được tạo thành từ chẩn đoán (ICD-9CM) và mã thủ tục (CPT, HCSPCS, ICD-9CM).
Mục tiêu của tôi là:
- Xác định các điều kiện tiền thân có ảnh hưởng nhất (bệnh đi kèm) cho một tình trạng y tế như bệnh thận mãn tính;
- Xác định khả năng (hoặc xác suất) rằng bệnh nhân sẽ phát triển một tình trạng y tế dựa trên các điều kiện họ đã có trong quá khứ;
- Làm tương tự như 1 và 2, nhưng với các thủ tục và / hoặc chẩn đoán.
- Tốt hơn là, kết quả sẽ được bác sĩ giải thích
Tôi đã xem xét những thứ như các bài báo về Giải thưởng Sức khỏe Di sản và đã học được rất nhiều từ chúng, nhưng chúng tập trung vào việc dự đoán nhập viện.
Vì vậy, đây là câu hỏi của tôi: Bạn nghĩ phương pháp nào hiệu quả cho các vấn đề như thế này? Và, tài nguyên nào sẽ hữu ích nhất cho việc tìm hiểu về các ứng dụng và phương pháp khoa học dữ liệu liên quan đến chăm sóc sức khỏe và y học lâm sàng?
EDIT # 2 để thêm bảng văn bản gốc:
CKD là tình trạng mục tiêu, "bệnh thận mãn tính", ".any" biểu thị rằng họ đã mắc phải tình trạng đó bất cứ lúc nào, ".vd Before.ckd" có nghĩa là họ có tình trạng đó trước khi chẩn đoán CKD đầu tiên. Các chữ viết tắt khác tương ứng với các điều kiện khác được xác định bởi các nhóm mã ICD-9CM. Nhóm này xảy ra trong SQL trong quá trình nhập. Mỗi biến, ngoại trừ BN_age, là nhị phân.