Tôi có dữ liệu chuỗi thời gian của các ngôi nhà khác nhau. Giả sử đó là dữ liệu tiêu thụ năng lượng. Bây giờ, tôi muốn phân cụm các ngôi nhà theo mô hình tiêu thụ năng lượng tương tự tối đa. Vì vậy, các số liệu khoảng cách khác nhau mà tôi có thể nghĩ ra để đo lường sự giống nhau bao gồm:
Với khoảng cách Euclide, tôi tìm thấy một ngoại lệ trong một trong những loạt dẫn đến một sự khác biệt rất lớn. Vì vậy, tôi không muốn sử dụng khoảng cách Euclide trong trường hợp của mình.
Với khoảng cách DTW, tôi thấy rằng nó cố gắng ánh xạ các mẫu / hình dạng tương tự trước tiên trong hai chuỗi đã cho, sau đó tính toán độ tương tự giữa hai chuỗi. Tôi không muốn sử dụng điều này bởi vì tôi không muốn thay đổi mô hình tiêu thụ tại một thời điểm khác để phù hợp với hai chuỗi đầu vào.
Đồ thị vẽ tay hỗ trợ cho các điểm trên là:
Bây giờ câu hỏi của tôi là:
- Những số liệu khoảng cách khác là tốt nhất cho trường hợp của tôi ngoài DTW hoặc Euclidean?
- Bạn có thể chỉ cho tôi một số tài liệu tham khảo giải thích khoảng cách Frechet rõ ràng hơn. Tôi tìm thấy một số giấy tờ, nhưng tôi không thể có được khái niệm rõ ràng. Có phải nó chỉ xem xét các điểm tương ứng của hai chuỗi hoặc giống như DTW, nó so sánh một điểm của một chuỗi với nhiều hơn một điểm của chuỗi khác?
CẬP NHẬT: Khi chúng ta so sánh hai loạt, tôi nghĩ rằng chúng ta nhìn từ hai quan điểm:
- Chúng tôi chỉ xem xét độ lớn của hai chuỗi (nghĩa là giá trị đỉnh, giá trị thấp nhất, v.v.). Do đó, nếu hai chuỗi nằm trong cùng một giá trị đỉnh, thì chúng ta coi hai chuỗi là giống nhau, nếu không thì chuỗi có thể được coi là khác nhau.
- Chúng tôi chỉ xem xét hình dạng của hai loạt (nghĩa là cố gắng so sánh các đỉnh và đáy). Chúng tôi không xem xét mức độ xa hoặc gần của hai loạt về độ lớn. Điều này về cơ bản có nghĩa là mặc dù tôi không phân cụm các ngôi nhà tiêu thụ cùng một lượng điện năng, nhưng tôi sẽ nhận được các ngôi nhà trong một cụm theo mô hình tương tự (tăng / giảm) tiêu thụ điện năng.
Tôi muốn một số liệu tương tự liên quan đến quan điểm số 2. Tôi đã tóm tắt cả hai quan điểm trong hình dưới đây.