Đừng không sử dụng k-means cho chuỗi thời gian.
DTW không được giảm thiểu theo giá trị trung bình; phương tiện k có thể không hội tụ và ngay cả khi nó hội tụ nó sẽ không mang lại kết quả rất tốt. Giá trị trung bình là một ước lượng bình phương nhỏ nhất trên tọa độ. Nó giảm thiểu phương sai, không phải khoảng cách tùy ý và phương tiện k được thiết kế để giảm thiểu phương sai, không phải khoảng cách tùy ý .
Giả sử bạn có hai chuỗi thời gian. Hai sóng hình sin, có cùng tần số và thời gian lấy mẫu khá dài; nhưng chúng được bù bởi . Vì DTW không cong vênh thời gian, nó có thể căn chỉnh chúng sao cho chúng khớp hoàn hảo, ngoại trừ điểm đầu và điểm cuối. DTW sẽ chỉ định một khoảng cách khá nhỏ cho hai chuỗi này. Tuy nhiên, nếu bạn tính giá trị trung bình của hai chuỗi, nó sẽ là 0 - chúng hủy bỏ. Giá trị trung bình không làm cong vênh thời gian động và mất tất cả giá trị mà DTW có được. Trên dữ liệu đó, phương tiện k có thể không hội tụ và kết quả sẽ là vô nghĩa. K-nghĩa thực sự chỉ nên được sử dụng với phương sai (= bình phương Euclide) hoặc một số trường hợp tương đương (như cosine, trên dữ liệu chuẩn hóa L2, trong đó độ tương tự cosine làπgiống như khoảng cách Euclide bình phương)2−
Thay vào đó, hãy tính toán một ma trận khoảng cách bằng DTW, sau đó chạy phân cụm theo thứ bậc, chẳng hạn như liên kết đơn. Trái ngược với k-mean, sê-ri thậm chí có thể có độ dài khác nhau.