Theo như tôi biết, cả hai bộ tự động và t-SNE đều được sử dụng để giảm kích thước phi tuyến. Sự khác biệt giữa chúng là gì và tại sao tôi nên sử dụng cái này so với cái khác?
Theo như tôi biết, cả hai bộ tự động và t-SNE đều được sử dụng để giảm kích thước phi tuyến. Sự khác biệt giữa chúng là gì và tại sao tôi nên sử dụng cái này so với cái khác?
Câu trả lời:
Cả hai đều cố gắng tìm một chiều nhúng thấp hơn cho dữ liệu của bạn. Tuy nhiên, có những vấn đề giảm thiểu khác nhau. Cụ thể hơn, bộ mã hóa tự động cố gắng giảm thiểu lỗi tái cấu trúc, trong khi t-SNE cố gắng tìm một không gian có chiều thấp hơn và đồng thời nó cố gắng giữ khoảng cách vùng lân cận. Do kết quả của thuộc tính này, t-SNE thường được ưa thích cho các ô và trực quan hóa.
[Bộ tạo tự động] chủ yếu tập trung vào tối đa hóa phương sai của dữ liệu trong không gian tiềm ẩn, do đó, bộ điều khiển tự động ít thành công hơn trong việc giữ cấu trúc dữ liệu cục bộ trong không gian tiềm ẩn so với người học đa dạng ...
Từ "Học cách nhúng tham số bằng cách bảo tồn cấu trúc địa phương", Laurens van der Maaten ( https://lvdmaaten.github.io/publications/ con /AISTATS_2009.pdf )
Autoencoder và t-SNE có thể được sử dụng cùng nhau để hiển thị tốt hơn trong dữ liệu chiều cao, như được mô tả trong [1]:
Đối với trực quan 2D cụ thể, t-SNE có lẽ là thuật toán tốt nhất xung quanh, nhưng nó thường yêu cầu dữ liệu tương đối thấp. Vì vậy, một chiến lược tốt để trực quan hóa các mối quan hệ tương tự trong dữ liệu chiều cao là bắt đầu bằng cách sử dụng bộ mã hóa tự động để nén dữ liệu của bạn vào không gian chiều thấp (ví dụ 32 chiều), sau đó sử dụng t-SNE để ánh xạ dữ liệu nén sang mặt phẳng 2D .
[1] https://blog.keras.io/building-autoencoders-in-keras.html
Autoencoder được thiết kế để bảo toàn dữ liệu trước đó theo nghĩa 2 chỉ tiêu, có thể được coi là bảo toàn động năng của dữ liệu, nếu dữ liệu là vận tốc.
Trong khi t-SNE, sử dụng phân kỳ KL không đối xứng, điều đó sẽ dẫn đến t-SNE tập trung nhiều hơn vào cấu trúc cục bộ, trong khi bộ mã hóa tự động có xu hướng giữ lỗi L2 tổng thể, theo nghĩa toàn cầu.