Tôi biết rằng mô hình thống kê truyền thống như Cox tỉ lệ nguy hại hồi quy & một số mô hình Kaplan-Meier có thể được sử dụng để dự đoán ngày cho đến khi xuất hiện tiếp theo của một thất bại nói sự kiện, vv tức là phân tích Survival
Câu hỏi
- Làm thế nào có thể sử dụng phiên bản hồi quy của các mô hình học máy như GBM, mạng thần kinh, vv để dự đoán ngày cho đến khi xảy ra sự kiện?
- Tôi tin rằng chỉ cần sử dụng ngày cho đến khi xuất hiện làm biến mục tiêu và chỉ đơn giản là chạy mô hình hồi quy sẽ không hoạt động? Tại sao nó không hoạt động và làm thế nào nó có thể được sửa chữa?
- Chúng ta có thể chuyển đổi vấn đề phân tích sinh tồn sang phân loại và sau đó có được xác suất sống sót không? Nếu sau đó làm thế nào để tạo biến mục tiêu nhị phân?
- Những ưu và nhược điểm của phương pháp học máy so với hồi quy Cox Proportional Hazards & mô hình Kaplan-Meier, v.v?
Hãy tưởng tượng dữ liệu đầu vào mẫu có định dạng dưới đây
Ghi chú:
- Cảm biến sẽ ping dữ liệu trong khoảng thời gian 10 phút nhưng đôi khi dữ liệu có thể bị thiếu do sự cố mạng, v.v. được biểu thị bằng hàng với NA.
- var1, var2, var3 là các yếu tố dự đoán, biến giải thích.
- fail_flag cho biết máy có bị lỗi hay không.
- Chúng tôi có dữ liệu 6 tháng qua ở mỗi khoảng thời gian 10 phút cho mỗi id máy
BIÊN TẬP:
Dự đoán đầu ra dự kiến nên ở định dạng dưới đây
Lưu ý: Tôi muốn dự đoán xác suất thất bại cho mỗi máy trong 30 ngày tiếp theo ở cấp độ hàng ngày.
failure_flag
.