Đầu tiên là một câu trả lời ngắn gọn, và sau đó là một nhận xét dài hơn:
Câu trả lời
Các kỹ thuật SNE tính toán một ma trận tương tự N × N trong cả không gian dữ liệu gốc và trong không gian nhúng chiều thấp theo cách mà các điểm tương đồng tạo thành phân phối xác suất trên các cặp đối tượng. Cụ thể, các xác suất thường được đưa ra bởi một nhân Gaussian được chuẩn hóa được tính toán từ dữ liệu đầu vào hoặc từ việc nhúng. Về mặt phân loại, điều này ngay lập tức mang đến cho các phương pháp học tập dựa trên cá thể . Bạn đã liệt kê một trong số chúng: SVM's với RBF và @amoeba đã liệt kê kNN. Ngoài ra còn có các mạng chức năng cơ sở xuyên tâm , mà tôi không phải là một chuyên gia về.
Bình luận
Có nói rằng, tôi sẽ cẩn thận gấp đôi về việc suy luận về một tập dữ liệu chỉ nhìn vào các lô t-SNE. t-SNE không nhất thiết phải tập trung vào cấu trúc cục bộ. Tuy nhiên, bạn có thể điều chỉnh nó để làm như vậy bằng cách điều chỉnh perplexity
tham số, quy định (một cách lỏng lẻo) cách cân bằng sự chú ý giữa các khía cạnh cục bộ và toàn cầu của dữ liệu của bạn.
Trong bối cảnh này, perplexity
chính nó là một cú đâm trong bóng tối về số lượng hàng xóm gần gũi mà mỗi quan sát có thể có và được người dùng cung cấp. Bài báo gốc nêu rõ: Hiệu suất của t-SNE khá mạnh mẽ đối với những thay đổi về sự bối rối và các giá trị tiêu biểu nằm trong khoảng từ 5 đến 50. Tuy nhiên, kinh nghiệm của tôi là việc tận dụng tối đa từ t-SNE có thể có nghĩa là phân tích nhiều lô với những rắc rối khác nhau.
Nói cách khác, điều chỉnh learning rate
và perplexity
, có thể thu được các ô 2 chiều trông rất khác nhau cho cùng một số bước đào tạo và sử dụng cùng một dữ liệu.
Tài liệu chưng cất này Cách sử dụng t-SNE Hiệu quả đưa ra một bản tóm tắt tuyệt vời về những cạm bẫy phổ biến của phân tích t-SNE. Các điểm tóm tắt là:
Những siêu đường kính đó (ví dụ như tốc độ học tập, sự bối rối) thực sự quan trọng
Kích thước cụm trong một âm mưu t-SNE không có nghĩa gì
Khoảng cách giữa các cụm có thể không có nghĩa gì
Tiếng ồn ngẫu nhiên không phải lúc nào cũng trông ngẫu nhiên.
Bạn có thể thấy một số hình dạng, đôi khi
Đối với cấu trúc liên kết, bạn có thể cần nhiều hơn một cốt truyện
Cụ thể từ các điểm 2, 3 và 6 ở trên, tôi sẽ suy nghĩ kỹ về việc suy luận về khả năng phân tách dữ liệu bằng cách xem xét các lô t-SNE riêng lẻ. Có nhiều trường hợp bạn có thể 'sản xuất' các ô hiển thị các cụm rõ ràng bằng cách sử dụng đúng các tham số.