Tôi tự hỏi nếu có bất kỳ gói cho python có khả năng thực hiện phân tích sinh tồn. Tôi đã sử dụng gói sinh tồn trong R nhưng muốn chuyển công việc của mình sang python.
survival
Gói của R đang được xem xét kỹ lưỡng bởi một cộng đồng lớn.
Tôi tự hỏi nếu có bất kỳ gói cho python có khả năng thực hiện phân tích sinh tồn. Tôi đã sử dụng gói sinh tồn trong R nhưng muốn chuyển công việc của mình sang python.
survival
Gói của R đang được xem xét kỹ lưỡng bởi một cộng đồng lớn.
Câu trả lời:
AFAIK, không có bất kỳ gói phân tích sinh tồn nào trong trăn. Như mbq bình luận ở trên, con đường duy nhất có sẵn sẽ là Rpy .
Ngay cả khi có sẵn một gói python thuần túy, tôi sẽ rất cẩn thận trong việc sử dụng nó, đặc biệt tôi sẽ xem xét:
Một trong những lợi ích của R, là các gói tiêu chuẩn này nhận được một lượng lớn thử nghiệm và phản hồi của người dùng. Khi xử lý dữ liệu thực, các trường hợp cạnh không mong muốn có thể chui vào.
Kiểm tra các dây an toàn dự án ¹ cho việc thực hiện đơn giản và sạch sẽ của các mô hình tồn tại trong Python, bao gồm
Những lợi ích:
Tài liệu có sẵn ở đây: tài liệu và ví dụ
Ví dụ sử dụng:
from lifelines import KaplanMeierFitter
survival_times = np.array([0., 3., 4.5, 10., 1.])
events = np.array([False, True, True, False, True])
kmf = KaplanMeierFitter()
kmf.fit(survival_times, event_observed=events)
print(kmf.survival_function_)
print(kmf.median_)
kmf.plot()
Các ô mẫu từ thư viện vẽ đồ thị tích hợp:
python-asurv là một nỗ lực để chuyển phần mềm asurv cho các phương pháp sinh tồn trong thiên văn học. Có thể đáng để theo dõi, nhưng cgillespie nói đúng về những điều cần chú ý: nó còn một chặng đường dài và sự phát triển dường như không hoạt động. (AFAICT chỉ có một phương thức tồn tại và thậm chí đã hoàn thành, gói có thể thiếu đối với các nhà sinh học.)
Có lẽ bạn nên sử dụng gói sinh tồn trong R từ Python thông qua một cái gì đó như RPy hoặc PypeR . Tôi đã không có bất kỳ vấn đề làm điều này bản thân mình.
PyIMSL chứa một số thói quen cho các phân tích sinh tồn. Nó là miễn phí như trong bia cho sử dụng phi thương mại, được hỗ trợ đầy đủ khác. Từ tài liệu trong Hướng dẫn sử dụng thống kê ...
Tính toán các ước tính của Kaplan-Meier về các xác suất sống sót: kaplanMeierEstimates ()
Phân tích dữ liệu sinh tồn và độ tin cậy bằng mô hình mối nguy theo tỷ lệ của Cox: propHazardsGenLin ()
Phân tích dữ liệu sinh tồn bằng mô hình tuyến tính tổng quát: survivalGlm ()
Ước tính sử dụng các chế độ tham số khác nhau: survivalEstimates ()
Ước tính hàm nguy hiểm độ tin cậy bằng cách sử dụng phương pháp không theo tỷ lệ: nonparamHazardRate ()
Tạo các bảng dân số và đoàn hệ: lifeTables ()
Bây giờ bạn có thể sử dụng R từ bên trong IPython , vì vậy bạn có thể muốn xem xét sử dụng IPython với tiện ích mở rộng R.
rpy2
). Tôi cũng rất thích xem một ví dụ nhanh chóng. (Theo hiểu biết của tôi rằng các mô hình sinh tồn chưa có sẵn đầy đủ trong thống kê .)
Tôi cũng muốn đề cập đến scikit-survival , cung cấp các mô hình để phân tích sinh tồn có thể dễ dàng kết hợp với các công cụ từ scikit-learn (ví dụ: xác thực chéo KFold).
Theo văn bản này, scikit-survival bao gồm triển khai
Ngoài việc sử dụng R
thông qua RPy
hoặc tương đương có một số thói quen phân tích tồn tại trong statsmodels (trước đây sicpy.statsmodel
) thư viện python. Mặc dù vậy, chúng nằm trong gói "hộp cát", có nghĩa là chúng không phải sẵn sàng để sản xuất ngay bây giờ.
Ví dụ, bạn có mô hình Cox về nguy cơ tỷ lệ được mã hóa ở đây .