Tôi thường xây dựng một mô hình (phân loại hoặc hồi quy) trong đó tôi có một số biến dự đoán là các chuỗi và tôi đã cố gắng tìm các đề xuất kỹ thuật để tóm tắt chúng theo cách tốt nhất có thể để đưa vào làm dự đoán trong mô hình.
Ví dụ cụ thể, giả sử một mô hình đang được xây dựng để dự đoán liệu khách hàng sẽ rời công ty trong 90 ngày tới (bất kỳ lúc nào giữa t và t + 90; do đó, kết quả nhị phân). Một trong những yếu tố dự đoán khả dụng là mức cân đối tài chính của khách hàng trong khoảng thời gian từ t_0 đến t-1. Có thể điều này đại diện cho các quan sát hàng tháng trong 12 tháng trước (tức là 12 phép đo).
Tôi đang tìm cách để xây dựng các tính năng từ loạt bài này. Tôi sử dụng các mô tả của từng chuỗi khách hàng như giá trị trung bình, cao, thấp, tiêu chuẩn, phù hợp với hồi quy OLS để có được xu hướng. Là các phương pháp tính toán khác của họ? Các biện pháp thay đổi hay biến động khác?
THÊM VÀO:
Như đã đề cập trong phản hồi bên dưới, tôi cũng đã xem xét (nhưng quên thêm ở đây) bằng cách sử dụng Độ cong thời gian động (DTW) và sau đó phân cụm theo ma trận khoảng cách kết quả - tạo một số cụm và sau đó sử dụng thành viên cụm làm tính năng. Ghi điểm dữ liệu thử nghiệm có thể sẽ phải tuân theo một quy trình trong đó DTW được thực hiện trên các trường hợp mới và các tâm khối cụm - khớp chuỗi dữ liệu mới với các trọng tâm gần nhất của chúng ...