Dynamic Time Warping đã lỗi thời?


7

Tại http://www.speech.zone/exercises/dtw-in-python/ nó nói

Mặc dù nó không thực sự được sử dụng nữa, nhưng Dynamic Time Warping (DTW) là một giới thiệu hay về khái niệm chính của Lập trình động.

Tôi đang sử dụng DTW để xử lý tín hiệu và hơi ngạc nhiên: Cái gì được sử dụng thay thế?


Trong nhận dạng giọng nói thông qua học tập sâu, CTC được sử dụng thay thế.
Emre

Câu trả lời:


6

Tôi sẽ không coi DTW là lỗi thời cả. Năm 2006, Xi và cộng sự. cho thấy rằng

[...] Nhiều thuật toán đã được đề xuất cho vấn đề phân loại chuỗi thời gian. Tuy nhiên, rõ ràng là một người hàng xóm gần nhất với khoảng cách cong thời gian động (DTW) đặc biệt khó đánh bại.

Kết quả của bài viết này được tóm tắt trong cuốn sách "Khai thác dữ liệu tạm thời" của Theophano Mitsa như sau:

  • Trong [Che05a], cách tiếp cận tối đa hóa tối thiểu hóa tĩnh mang lại sai số tối đa là 7,2%. Với 1NN-DTW, lỗi là 0,33% với cùng một tập dữ liệu như trong bài viết gốc.
  • Trong [Che05b], cách tiếp cận biểu đồ đa biến mang lại sai số tối đa là 6%. Với 1NN-DTW, lỗi (trên cùng một tập dữ liệu) là 0,33%.
  • Trong [Ead05], thuật toán trích xuất tính năng hướng dẫn ngữ pháp mang lại sai số tối đa là 13,22%. Với 1NN-DTW, sai số là 9,09%.
  • Trong [Hay05], chuỗi thời gian được nhúng trong không gian chiều thấp hơn bằng cách sử dụng sơ đồ riêng của Laplacian và khoảng cách DTW. Các tác giả đã đạt được độ chính xác 100% ấn tượng; tuy nhiên, 1NN-DTW cũng đạt được độ chính xác 100%.
  • Trong [Kim04], Mô hình Markov ẩn đạt độ chính xác 98%, trong khi 1NN-DTW đạt độ chính xác 100%.
  • Trong [Nan01], mạng nơ ron perceptron đa lớp đạt được hiệu suất tốt nhất với tỷ lệ lỗi 1,9%. Trên cùng một tập dữ liệu, tỷ lệ của 1NN-DTW là 0,33%.
  • Trong [Rod00], logic thứ nhất với việc tăng tốc cho tỷ lệ lỗi 3,6%. Trên cùng một tập dữ liệu, tỷ lệ lỗi của 1NN-DTW là 0,33%.
  • Trong [Rod04], cây quyết định dựa trên DTW cho tỷ lệ lỗi là 4,9%. Trên cùng một tập dữ liệu, 1NN-DTW cho lỗi 0,0%. • Trong [Wu04], bộ hợp hạch siêu nhân cho tỷ lệ lỗi là 0,79%, trong khi trên cùng một bộ dữ liệu, 1NN-DTW cho 0,33%.

Xin vui lòng xem cuốn sách gốc cho một danh sách các tài liệu tham khảo được đề cập.

Một điều quan trọng cần lưu ý ở đây là thực tế là Xi et al. thậm chí đã xoay sở để đánh bại hiệu suất của MLP trở lại vào năm 2006. Mặc dù ngày nay tình hình có thể hơi khác một chút (vì chúng tôi có các thuật toán Deep learning tốt hơn và nhanh hơn), tôi vẫn coi DTW là một lựa chọn hợp lệ để xem xét khi nào nói đến phân loại tín hiệu.

Cập nhật

Tôi cũng muốn thêm một liên kết đến một bài báo gần đây hơn có tên "Phân loại chuỗi thời gian tuyệt vời: Đánh giá thử nghiệm các thuật toán được đề xuất gần đây" từ năm 2016. Trong bài báo này, các tác giả "đã thực hiện 18 thuật toán được đề xuất gần đây Khung công tác Java và so sánh chúng với hai phân loại chuẩn chuẩn (và lẫn nhau) ". Các trích dẫn sau đây từ căng thẳng giấy rằng DTW là (hoặc ít nhất là vào năm 2016) thực sự vẫn còn liên quan:

  1. Thực tế, nhiều thuật toán không tốt hơn hai phân loại điểm chuẩn của chúng tôi, 1-NN DTW và Rotation Forest.
  2. Đối với những người đang tìm cách xây dựng một mô hình dự đoán cho một vấn đề mới, chúng tôi khuyên bạn nên bắt đầu với DTW, RandF và RotF như một kiểm tra và điểm chuẩn cơ bản.
  3. Nhận được sự khôn ngoan là DTW rất khó để đánh bại.

4

Dynamic Time Warping (DTW) có độ phức tạp bậc hai. Có một số phiên bản khác của thuật toán, như FastDTW (độ phức tạp tuyến tính) làm giảm độ phức tạp bằng cách tính xấp xỉ. FastDTW được triển khai, ví dụ, trong mô-đun Python này .


0

Theo như tôi biết thì chủ yếu là về khía cạnh tính toán đã được cải thiện, vì vậy đây vẫn là một phương pháp thích hợp để đo lường sự tương đồng giữa các chuỗi.

Tôi đề nghị đây là một tài liệu tham khảo tốt, đặc biệt phần 4.3. Đây là phần in đậm của phần này:

Đường dẫn cong vênh W là một tập hợp các chỉ số ma trận liền kề xác định ánh xạ giữa hai chuỗi thời gian. Ngay cả khi có một số lượng lớn các đường cong có thể có, thì đường dẫn tối ưu là đường dẫn tối thiểu hóa chi phí cong vênh toàn cầu. DTW có thể được tính bằng lập trình động với độ phức tạp thời gian O (n2) [Ratanamahatana và Keogh 2004a]. Tuy nhiên, một số biện pháp giới hạn thấp hơn đã được đưa ra để tăng tốc tính toán. Keogh và Ratanamahatana [2005] đã đưa ra khái niệm đường bao trên và dưới đại diện cho độ cong vênh tối đa được phép. Sử dụng kỹ thuật này, độ phức tạp trở thành O (n). Cũng có thể áp đặt một ràng buộc tạm thời về kích thước của cửa sổ cong vênh DTW. Nó đã được chứng minh rằng những điều này cải thiện không chỉ tốc độ mà cả mức độ chính xác vì nó tránh được sự phù hợp bệnh lý được giới thiệu bằng cách vênh kéo dài [Ratanamahatana và Keogh 2004b]. Hai hạn chế toàn cầu được sử dụng thường xuyên nhất là Ban nhạc Sakoe-Chiba và Hình bình hành Itakura. Salvador và Chan [2007] đã giới thiệu thuật toán FastDTW, có thể tính toán thời gian tuyến tính của DTW bằng cách chiếu đệ quy một đường cong tới độ phân giải cao hơn và sau đó tinh chỉnh nó. Một nhược điểm của thuật toán này là nó gần đúng và do đó Khảo sát tính toán ACM, Vol. 45, Số 1, Điều 12, Ngày xuất bản: Tháng 11 năm 2012. 12:18 P. Esling và C. Agon không đảm bảo tìm được giải pháp tối ưu. Ngoài cong vênh năng động, đôi khi có thể hữu ích khi cho phép mở rộng chuỗi thời gian toàn cầu để đạt được kết quả có ý nghĩa, một kỹ thuật được gọi là Quy mô thống nhất (Hoa Kỳ). Fu et al. [2008] đã đề xuất biện pháp tương tự Thu nhỏ và cong vênh (SWM) cho phép kết hợp các lợi ích của DTW với các lợi ích của Hoa Kỳ. Các biện pháp dựa trên hình dạng khác đã được giới thiệu như Khoảng cách lắp ráp không gian (SpADe) [Chen et al. 2007b]; nó là một biện pháp tương tự dựa trên mô hình. Thuật toán này xác định các mẫu phù hợp bằng cách cho phép dịch chuyển và chia tỷ lệ trên cả hai trục thời gian và biên độ, do đó có quy mô mạnh mẽ. DISSIM [Frentzos et al. 2007] khoảng cách đã được giới thiệu để xử lý sự tương tự ở các tỷ lệ lấy mẫu khác nhau. Nó được coi là một xấp xỉ của tích phân của khoảng cách Euclide. Một trong những đề xuất thú vị gần đây dựa trên khái niệm khớp đàn hồi của chuỗi thời gian [Latecki et al. 2005]. Latecki et al. [2007] đã trình bày một kỹ thuật đối sánh tối ưu (OSB) tối ưu có thể tự động xác định hệ số sau và độ cong vênh tốt nhất để tính toán khoảng cách; nó bao gồm một hình phạt khi bỏ qua các yếu tố. Sự tối ưu đạt được thông qua chi phí tính toán cao; tuy nhiên, nó có thể được giảm bằng cách giới hạn phạm vi bỏ qua.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.