Khi xử lý dữ liệu phát trực tuyến, bạn có thể không muốn / cần nhúng tất cả các điểm trong lịch sử vào một bản đồ t-SNE. Thay vào đó, bạn có thể thực hiện nhúng trực tuyến bằng cách thực hiện theo các bước đơn giản sau:
chọn một cửa sổ thời gian T, đủ dài để mỗi mẫu quan tâm xuất hiện ít nhất một vài lần trong thời lượng cửa sổ.
cuộn cửa sổ khi luồng dữ liệu vào, với dt bước thời gian nhỏ hơn nhiều so với T. Với mỗi vị trí của cửa sổ, hãy tính toán nhúng t-SNE của các điểm dữ liệu trong cửa sổ thời gian.
gieo hạt giống với kết quả của lần trước. Trong t-SNE, người ta cần chọn tọa độ ban đầu của các điểm dữ liệu trong không gian chiều thấp. Trong trường hợp của chúng tôi, vì chúng tôi chọn dt nhỏ hơn nhiều so với T, hai nhúng liên tiếp chia sẻ hầu hết các điểm dữ liệu của chúng. Đối với tất cả các điểm dữ liệu được chia sẻ, khớp tọa độ ban đầu của chúng trong hiện tại nhúng với tọa độ cuối cùng của chúng trong lần nhúng trước . Bước này sẽ đảm bảo rằng các mẫu tương tự có một biểu diễn nhất quán trên các lần nhúng liên tiếp. (trong triển khai sklearn trong python, tham số seed là "init". Theo mặc định, việc triển khai sklearn đặt vị trí ban đầu của các điểm một cách ngẫu nhiên)
Lưu ý 1: Điều quan trọng là các mẫu quan tâm xuất hiện ít nhất một lần trong bất kỳ cửa sổ thời gian nhất định nào, để bộ nhớ của biểu diễn không bị mất khi cửa sổ trượt qua tập dữ liệu. Thật vậy, t-SNE thường không hội tụ đến một giải pháp duy nhất mà chỉ ở mức tối thiểu cục bộ, do đó, nếu bộ nhớ bị mất, một mô hình tương tự có thể được biểu diễn theo hai cách rất khác nhau theo hai cách nhúng.
Lưu ý 2: Phương pháp này đặc biệt phù hợp khi xử lý chuỗi thời gian không cố định, trong đó người ta muốn theo dõi các mẫu phát triển chậm theo thời gian. Thật vậy, mỗi lần nhúng đều ở đây được đặt riêng cho cửa sổ thời gian nhỏ mà nó được tính toán, đảm bảo rằng nó nắm bắt cấu trúc cục bộ theo thời gian theo cách tốt nhất (trái với việc nhúng toàn bộ dữ liệu không cố định).
Lưu ý 3: Trong phương pháp này, các lần nhúng liên tiếp không thể được song song, bởi vì người ta cần kết quả của lần nhúng trước để tạo hạt tiếp theo. Tuy nhiên, vì hạt giống (tức là tọa độ ban đầu của các điểm) được chọn tốt cho hầu hết các điểm (tất cả các điểm được chia sẻ giữa các lần nhúng thành công), nên việc nhúng thường hội tụ rất nhanh, chỉ trong một vài lần lặp.
Để biết ví dụ về việc áp dụng phương pháp này cho chuỗi thời gian không cố định, hãy xem bài viết này ( ICLR 2016, Học các biểu diễn ổn định trong một thế giới thay đổi với t-SNE: bằng chứng về khái niệm trong bài hát ), nơi nó được áp dụng thành công để theo dõi sự xuất hiện của các âm tiết trong suốt quá trình phát triển trong loài chim biết hót.