Trong một nhiệm vụ gần đây, chúng tôi được yêu cầu sử dụng PCA trên các chữ số MNIST để giảm kích thước từ 64 (8 x 8 hình ảnh) xuống 2. Sau đó chúng tôi phải phân cụm các chữ số bằng Mô hình hỗn hợp Gaussian. PCA chỉ sử dụng 2 thành phần chính không mang lại các cụm khác biệt và kết quả là mô hình không thể tạo ra các nhóm hữu ích.
Tuy nhiên, sử dụng t-SNE với 2 thành phần, các cụm được phân tách tốt hơn nhiều. Mô hình hỗn hợp Gaussian tạo ra các cụm khác biệt hơn khi áp dụng cho các thành phần t-SNE.
Sự khác biệt trong PCA với 2 thành phần và t-SNE với 2 thành phần có thể được nhìn thấy trong cặp hình ảnh sau đây trong đó các phép biến đổi đã được áp dụng cho bộ dữ liệu MNIST.
Tôi đã đọc rằng t-SNE chỉ được sử dụng để trực quan hóa dữ liệu chiều cao, như trong câu trả lời này , nhưng được đưa ra các cụm riêng biệt mà nó tạo ra, tại sao nó không được sử dụng như một kỹ thuật giảm kích thước được sử dụng cho các mô hình phân loại hoặc như một phương pháp phân cụm độc lập?