Sử dụng tốt cho t-SNE, ngoài trực quan hóa dữ liệu là gì?


12

Trong những tình huống nào chúng ta nên sử dụng t-SNE (ngoài trực quan hóa dữ liệu)?

T-SNE được sử dụng để giảm kích thước. Câu trả lời cho câu hỏi này cho thấy rằng t-SNE chỉ nên được sử dụng để trực quan hóa và chúng ta không nên sử dụng nó để phân cụm. Vậy thì việc sử dụng tốt cho t-SNE là gì?


6
Lời khuyên tiêu chuẩn là KHÔNG sử dụng tsne để phân cụm, vì các cụm quá phụ thuộc vào sự bối rối. Nó được cho là chỉ được sử dụng cho "trực quan hóa". Nhưng điều đó không rõ ràng đối với tôi, vì người ta ngay lập tức tìm kiếm (và thấy) các cụm khi nhìn vào một âm mưu tsne. Vì vậy, câu hỏi của bạn là một câu hỏi hay: tsne dùng để làm gì?
generic_user

2
Xem câu trả lời cho câu hỏi này mà tôi đã hỏi: stats.stackexchange.com/questions/263539/iêu
generic_user

như @generic_user đã nói, tôi muốn biết lợi ích của t-sne, bên cạnh đó là trực quan hóa.
sói

Tôi không biết tại sao điều này đã bị đóng như một bản sao. OP đang hỏi những công dụng tốt của t-sne ngoài việc trực quan hóa. Các chủ đề được liên kết là tất cả về phân cụm. Nhưng có thể có những cách sử dụng khác.
amip nói rằng Phục hồi lại

Câu trả lời:


4

Câu trả lời cho câu hỏi này cho thấy rằng t-SNE chỉ nên được sử dụng để trực quan hóa và chúng ta không nên sử dụng nó để phân cụm. Vậy thì việc sử dụng tốt cho t-SNE là gì?

Tôi không đồng ý với kết luận này. Không có lý do nào để cho rằng t-SNE phổ biến hơn bất kỳ thuật toán phân cụm nào khác. Mỗi thuật toán phân cụm đưa ra các giả định về cấu trúc của dữ liệu và chúng có thể được dự kiến ​​sẽ thực hiện khác nhau tùy thuộc vào phân phối cơ bản và việc sử dụng cuối của chiều giảm.

t-SNE giống như nhiều thuật toán học tập không giám sát thường cung cấp một phương tiện để kết thúc, ví dụ như có được cái nhìn sâu sắc sớm về việc dữ liệu có thể tách rời hay không, kiểm tra xem nó có cấu trúc nào đó và kiểm tra bản chất của cấu trúc này hay không. Người ta không cần trực quan hóa đầu ra t-SNE để bắt đầu trả lời một số câu hỏi này. Các ứng dụng khác của nhúng nhúng chiều thấp hơn bao gồm các tính năng xây dựng để phân loại hoặc loại bỏ đa cộng tuyến để cải thiện hiệu suất của các phương pháp dự đoán.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.