Tôi sẽ không coi DTW là lỗi thời cả. Năm 2006, Xi và cộng sự. cho thấy rằng
[...] Nhiều thuật toán đã được đề xuất cho vấn đề phân loại chuỗi thời gian. Tuy nhiên, rõ ràng là một người hàng xóm gần nhất với khoảng cách cong thời gian động (DTW) đặc biệt khó đánh bại.
Kết quả của bài viết này được tóm tắt trong cuốn sách "Khai thác dữ liệu tạm thời" của Theophano Mitsa như sau:
- Trong [Che05a], cách tiếp cận tối đa hóa tối thiểu hóa tĩnh mang lại sai số tối đa là 7,2%. Với 1NN-DTW, lỗi là 0,33% với cùng một tập dữ liệu như trong bài viết gốc.
- Trong [Che05b], cách tiếp cận biểu đồ đa biến mang lại sai số tối đa là 6%. Với 1NN-DTW, lỗi (trên cùng một tập dữ liệu) là 0,33%.
- Trong [Ead05], thuật toán trích xuất tính năng hướng dẫn ngữ pháp mang lại sai số tối đa là 13,22%. Với 1NN-DTW, sai số là 9,09%.
- Trong [Hay05], chuỗi thời gian được nhúng trong không gian chiều thấp hơn bằng cách sử dụng sơ đồ riêng của Laplacian và khoảng cách DTW. Các tác giả đã đạt được độ chính xác 100% ấn tượng; tuy nhiên, 1NN-DTW cũng đạt được độ chính xác 100%.
- Trong [Kim04], Mô hình Markov ẩn đạt độ chính xác 98%, trong khi 1NN-DTW đạt độ chính xác 100%.
- Trong [Nan01], mạng nơ ron perceptron đa lớp đạt được hiệu suất tốt nhất với tỷ lệ lỗi 1,9%. Trên cùng một tập dữ liệu, tỷ lệ của 1NN-DTW là 0,33%.
- Trong [Rod00], logic thứ nhất với việc tăng tốc cho tỷ lệ lỗi 3,6%. Trên cùng một tập dữ liệu, tỷ lệ lỗi của 1NN-DTW là 0,33%.
- Trong [Rod04], cây quyết định dựa trên DTW cho tỷ lệ lỗi là 4,9%. Trên cùng một tập dữ liệu, 1NN-DTW cho lỗi 0,0%. • Trong [Wu04], bộ hợp hạch siêu nhân cho tỷ lệ lỗi là 0,79%, trong khi trên cùng một bộ dữ liệu, 1NN-DTW cho 0,33%.
Xin vui lòng xem cuốn sách gốc cho một danh sách các tài liệu tham khảo được đề cập.
Một điều quan trọng cần lưu ý ở đây là thực tế là Xi et al. thậm chí đã xoay sở để đánh bại hiệu suất của MLP trở lại vào năm 2006. Mặc dù ngày nay tình hình có thể hơi khác một chút (vì chúng tôi có các thuật toán Deep learning tốt hơn và nhanh hơn), tôi vẫn coi DTW là một lựa chọn hợp lệ để xem xét khi nào nói đến phân loại tín hiệu.
Cập nhật
Tôi cũng muốn thêm một liên kết đến một bài báo gần đây hơn có tên "Phân loại chuỗi thời gian tuyệt vời: Đánh giá thử nghiệm các thuật toán được đề xuất gần đây" từ năm 2016. Trong bài báo này, các tác giả "đã thực hiện 18 thuật toán được đề xuất gần đây Khung công tác Java và so sánh chúng với hai phân loại chuẩn chuẩn (và lẫn nhau) ". Các trích dẫn sau đây từ căng thẳng giấy rằng DTW là (hoặc ít nhất là vào năm 2016) thực sự vẫn còn liên quan:
- Thực tế, nhiều thuật toán không tốt hơn hai phân loại điểm chuẩn của chúng tôi, 1-NN DTW và Rotation Forest.
- Đối với những người đang tìm cách xây dựng một mô hình dự đoán cho một vấn đề mới, chúng tôi khuyên bạn nên bắt đầu với DTW, RandF và RotF như một kiểm tra và điểm chuẩn cơ bản.
- Nhận được sự khôn ngoan là DTW rất khó để đánh bại.