Có bất kỳ thuật toán học tập không giám sát cho dữ liệu tuần tự thời gian?


9

Mỗi quan sát trong dữ liệu của tôi được thu thập với chênh lệch 0,1 giây. Tôi không gọi đó là chuỗi thời gian vì nó không có dấu ngày và thời gian. Trong các ví dụ về thuật toán phân cụm (tôi tìm thấy trực tuyến) và PCA, dữ liệu mẫu có 1 quan sát cho mỗi trường hợp và không được tính thời gian. Nhưng dữ liệu của tôi có hàng trăm quan sát được thu thập cứ sau 0,1 giây trên mỗi chiếc xe và có rất nhiều phương tiện.

Lưu ý: Tôi cũng đã hỏi câu hỏi này trên quora.


1
Xin lưu ý ngôn ngữ. Câu hỏi của bạn là hoàn toàn không rõ ràng. "Dữ liệu mẫu có 1 quan sát cho mỗi trường hợp và không được tính thời gian" nghĩa là gì?
Kasra Manshaei 30/05/2015

1
Tôi đã nói về các ví dụ tôi tìm thấy trong các hướng dẫn trực tuyến. Dữ liệu mẫu họ sử dụng chỉ có 1 quan sát cho mỗi trường hợp / cá nhân (ví dụ: khách hàng, quốc gia, v.v.). Và những dữ liệu đó không phải là chuỗi thời gian.
umair durrani 30/05/2015

Câu trả lời:


7

Những gì bạn có là một chuỗi các sự kiện theo thời gian, vì vậy đừng ngần ngại gọi nó là Chuỗi thời gian!

Phân cụm trong chuỗi thời gian có 2 ý nghĩa khác nhau:

  1. Phân đoạn chuỗi thời gian tức là bạn muốn phân đoạn một chuỗi thời gian riêng lẻ thành các khoảng thời gian khác nhau theo sự tương đồng bên trong.
  2. Phân cụm chuỗi thời gian tức là bạn có một số chuỗi thời gian và bạn muốn tìm các cụm khác nhau theo sự tương đồng giữa chúng.

Tôi giả sử bạn có nghĩa là cái thứ hai và đây là gợi ý của tôi:

Bạn có nhiều phương tiện và nhiều quan sát trên mỗi chiếc xe tức là bạn có nhiều phương tiện. Vì vậy, bạn có một số ma trận (mỗi phương tiện là một ma trận) và mỗi ma trận chứa N hàng (Nr của các quan sát) và cột T (điểm thời gian). Một đề xuất có thể là áp dụng PCA cho từng ma trận để giảm độ mờ và quan sát dữ liệu trong không gian PC và xem liệu có mối quan hệ có ý nghĩa giữa các quan sát khác nhau trong một ma trận (phương tiện) không . Sau đó, bạn có thể đặt từng quan sát cho tất cả các phương tiện lên nhau và tạo một ma trận và áp dụng PCA cho điều đó để thấy mối quan hệ của một quan sát duy nhất giữa các phương tiện khác nhau.

Nếu bạn không có giá trị âm, Factorization được khuyến nghị mạnh mẽ để giảm kích thước của dữ liệu dạng ma trận.

Một đề xuất khác có thể được đặt trong tất cả các ma trận chồng lên nhau và xây dựng một thang đo N x M x T trong đó N là số lượng phương tiện, M là số lượng quan sát và T là trình tự thời gian và áp dụng Phân tích kéo căng để xem quan hệ trên toàn cầu.

Một cách tiếp cận rất hay về Phân cụm chuỗi thời gian được trình bày trong bài viết này , nơi việc triển khai diễn ra lặng lẽ.

Tôi hy vọng nó đã giúp!

Chúc may mắn :)


BIÊN TẬP

Như bạn đã đề cập, bạn có nghĩa là Phân đoạn chuỗi thời gian, tôi thêm câu này vào câu trả lời.

Phân đoạn chuỗi thời gian là vấn đề phân cụm duy nhất có sự thật cơ bản để đánh giá. Trên thực tế bạn xem xét sự phân bố tạo đằng sau chuỗi thời gian và phân tích nó tôi khuyên này , này , này , này , nàynày mà vấn đề của bạn được nghiên cứu một cách toàn diện. Đặc biệt là cái cuối cùng và luận án tiến sĩ.

Chúc may mắn!


1
Cảm ơn cho một câu trả lời tuyệt vời. Trên thực tế, mục tiêu của tôi là thực hiện "phân đoạn chuỗi thời gian" cho mỗi chiếc xe trong bộ dữ liệu của mình.
umair durrani 30/05/2015

1
Tôi đang nghiên cứu hướng dẫn về phân tách chuỗi thời gian. Tôi thấy rằng có nhiều cách để phân hủy chúng thành các thành phần xu hướng, theo mùa và theo chu kỳ. Chuỗi thời gian của tôi, tuy nhiên, là vài giây của quỹ đạo xe. Có thể phân tách chúng thành các thành phần hành vi lái xe khác nhau dựa trên các xu hướng tăng tốc, tốc độ, tốc độ và tốc độ xe dẫn đầu trong một quỹ đạo quan sát?
umair durrani 30/05/2015

2
Có lẽ! để điều này tốt hơn để xem xét cả "phân tách" và "phân khúc". Chẳng hạn, nếu chuỗi thời gian của bạn hiển thị các cụm đáng kể trong không gian PC, bạn có thể liên hệ chúng với hành vi lái xe. Phân khúc cũng là để phát hiện các hành vi lái xe khác nhau trong một chuỗi thời gian. Câu chuyện dài là bạn có thể sử dụng phân đoạn cho các phân đoạn hành vi lái xe khác nhau cho một phương tiện và kỹ thuật phân hủy để phát hiện hành vi lái xe toàn cầu trên tất cả các phương tiện.
Kasra Manshaei
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.