Dynamic Time Warping và chuẩn hóa


9

Tôi đang sử dụng Độ cong thời gian động để khớp đường cong "truy vấn" và "mẫu" và có thành công hợp lý cho đến nay, nhưng tôi có một số câu hỏi cơ bản:

  1. Tôi đang đánh giá một "trận đấu" bằng cách đánh giá xem kết quả DTW có thấp hơn một số giá trị ngưỡng mà tôi đưa ra theo phương pháp heuristur hay không. Đây có phải là cách tiếp cận chung để xác định "khớp" bằng DTW không? Nếu không, vui lòng giải thích ...

    Giả sử câu trả lời cho (1) là "có", thì tôi bối rối, vì kết quả DTW khá nhạy cảm với a) sự khác biệt về biên độ của các đường cong và b) độ dài của vectơ truy vấn và độ dài của " mẫu "vector.

    Tôi đang sử dụng hàm bước đối xứng, vì vậy (b) tôi đang bình thường hóa kết quả DTW của mình bằng cách chia cho M + N (chiều rộng + chiều cao của ma trận DTW). Điều này có vẻ hơi hiệu quả, nhưng có vẻ như nó sẽ phạt các trận đấu DTW khác xa đường chéo (nghĩa là có đường dẫn dài hơn qua ma trận DTW). Có vẻ như tùy tiện cho cách tiếp cận "bình thường hóa". Chia theo số bước thông qua ma trận dường như có ý nghĩa trực quan, nhưng dường như đó không phải là cách để làm điều đó theo tài liệu.

  2. Vì vậy, có cách nào tốt hơn để điều chỉnh kết quả DTW cho kích thước của vectơ truy vấn và mẫu không?

  3. Cuối cùng, làm cách nào để bình thường hóa kết quả DTW cho sự khác biệt về biên độ giữa truy vấn và vectơ mẫu?

Do đó, do thiếu các kỹ thuật chuẩn hóa đáng tin cậy (hoặc thiếu hiểu biết của tôi), dường như có rất nhiều nỗ lực thủ công liên quan đến việc làm việc với dữ liệu mẫu để xác định mức ngưỡng tốt nhất để xác định "khớp". Tui bỏ lỡ điều gì vậy?

Câu trả lời:


8

||aibi||

Như bạn đã xác định chính xác, bạn cần phải có cùng số điểm (thường) để làm việc này. Tôi sẽ đề xuất sử dụng bộ nội suy / bộ điều khiển mượt mà () trên các đường cong của bạn để làm cho chúng có kích thước bằng nhau trước tiên. Đó là công cụ khá chuẩn cho "thống kê đường cong". Bạn có thể thấy một ứng dụng ví dụ trong Chiou et al. (2003) ; các tác giả không quan tâm đến DTW như vậy trong tác phẩm này nhưng đây là một ví dụ điển hình về cách đối phó với các bài đọc có kích thước không đồng đều.

f(x)f(x)supy|f(x)|

gCλ(Yi,Yk,g)=E{T(Yi(g(t))Yk(t))2+λ(g(t)t)2dt|Yi,Yk}gYi(g(t))Yk(t)Yi(g(t))Yk(t)g(t)t

Vấn đề bạn đang mô tả trong tài liệu Thống kê được biết đến rộng rãi là " đăng ký đường cong " (ví dụ, xem Gasser và Kneip (1995) để xử lý sớm vấn đề này) và nằm trong phạm vi chung của các kỹ thuật Phân tích dữ liệu chức năng .

(Trong trường hợp tôi có thể tìm thấy bài báo gốc có sẵn trên mạng, liên kết sẽ chuyển đến đó; nếu không thì liên kết sẽ chuyển đến một thư viện kỹ thuật số nói chung. Hầu như tất cả các bài viết được đề cập đều có thể được tìm thấy để soạn thảo các phiên bản miễn phí. thay thế bởi bài đăng này.)


Đây là một câu trả lời tuyệt vời và rất rất hữu ích. Các tài liệu tham khảo đặc biệt hữu ích.
Mikko

Bạn có biết một tài liệu tham khảo phù hợp để nói rằng "biên độ là một vấn đề" trong dtw? Điều này có lẽ rõ ràng đến mức tôi đang vật lộn để tìm một tài liệu tham khảo, trong đó thảo luận rõ ràng về nó.
Mikko

L2

Từ các tài nguyên đã được đề cập có lẽ đặt cược tốt nhất của bạn có thể sẽ là cuốn sách FDA của Ramsay & Silverman, Chapt. 7 về "đăng ký và hiển thị dữ liệu chức năng". Một tài nguyên rất tốt cũng là cuốn sách: "Suy luận về dữ liệu chức năng với các ứng dụng" của Horváth và Kokoszka; Phần III "Dữ liệu chức năng phụ thuộc" liên quan đến vấn đề chuẩn hóa chủ yếu là do những người quan tâm đến việc phát hiện điểm thay đổi.
usεr11852
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.