t-SNE: Tại sao các giá trị dữ liệu bằng nhau không trực quan đóng?


9

Tôi có 200 điểm dữ liệu có cùng giá trị trên tất cả các tính năng.

Sau khi giảm kích thước t-SNE, chúng không còn trông như nhau nữa, giống như thế này: nhập mô tả hình ảnh ở đây

Tại sao chúng không cùng quan điểm trong hình dung và thậm chí dường như được phân phối thành hai cụm khác nhau?


4
Hãy chắc chắn đọc distill.pub/2016/misread-tsne
Emre

Nó có thể được gây ra bởi độ chính xác (gấp đôi / nổi) bạn đang sử dụng?
El Burro

Hầu hết các giá trị là số nguyên. Và nó rất thưa thớt, khoảng 500 tính năng với hầu hết là số không. Tôi không biết nếu nó có thể được gây ra bởi độ chính xác. Nhưng khoảng cách giữa các cụm và giữa các điểm dữ liệu này là tương đối lớn.
ScienceiaEtVeritas

Những cụm nào? Tôi nghĩ tất cả đều giống nhau - hoặc bạn có nghĩa là cốt truyện?
El Burro

Vâng, tôi có nghĩa là các cụm trên cốt truyện.
Khoa họcEtVeritas

Câu trả lời:


3

Bạn đã đúng rằng các giá trị tương tự trong T-SNE có thể được phân phối trên các điểm khác nhau, lý do điều này xảy ra rất rõ ràng nếu bạn xem thuật toán mà T-SNE chạy qua.

Để giải quyết mối quan tâm đầu tiên của bạn về các điểm thực sự không giống nhau sau khi thuật toán đã được áp dụng cho bộ dữ liệu. Tôi sẽ để lại cho bạn một bài tập để tự xác minh nó, xem xét một mảng đơn giản x 2 = [ 0 , 1 ] và chạy thuật toán thực tế chống lại nó và tự mình thấy rằng các điểm kết quả không phải là thực sự giống hệt nhau. Bạn có thể tham khảo chéo câu trả lời của bạn chống lại điều này.x1= =[0,1]x2= =[0,1]

import numpy as np from sklearn.manifold import TSNE m = TSNE(n_components=2, random_state=0) m.fit_transform(np.array([[0,1],[0,1]]))

Bạn cũng sẽ quan sát thấy việc thay đổi random_statethực sự làm thay đổi tọa độ đầu ra của mô hình. Không có bất kỳ mối tương quan thực sự nào giữa tọa độ thực tế và đầu ra của chúng. Vì bước đầu tiên của TSNE tính toán khả năng có điều kiện.

Bây giờ chúng ta hãy cố gắng hợp lý hóa, sử dụng thuật toán lý do điều này xảy ra, chỉ sử dụng toán học, mà không có bất kỳ trực giác nào, vào lúc này. Lưu ý rằng xTôixjpj|Tôi= =exp(-||xj-xTôi||22σ2)ΣkTôiexp(-||xj-xTôi||22σ2)pTôij= =pTôi|j+pj|Tôi2NpTôijxTôixj

R2

Vì vậy, sự thật là, thay vì nhìn vào hai cụm, hãy nhìn vào khoảng cách giữa chúng, bởi vì điều đó truyền tải nhiều thông tin hơn chính các tọa độ.

Hi vọng đây là câu trả lời cho câu hỏi của bạn :)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.