Tôi muốn thực hiện giảm kích thước trên gần 1 triệu vectơ mỗi chiều với 200 thứ nguyên ( doc2vec
). Tôi đang sử dụng TSNE
triển khai từ sklearn.manifold
mô-đun cho nó và vấn đề chính là sự phức tạp về thời gian. Ngay cả với method = barnes_hut
, tốc độ tính toán vẫn còn thấp. Đôi khi nó hết bộ nhớ.
Tôi đang chạy nó trên bộ xử lý 48 lõi với RAM 130G. Có một phương pháp để chạy nó song song hoặc sử dụng nguồn tài nguyên dồi dào để tăng tốc quá trình.