Giải thích trực quan về cách UMAP hoạt động, so với t-SNE


18

Tôi có bằng tiến sĩ sinh học phân tử. Các nghiên cứu của tôi gần đây đã bắt đầu liên quan đến phân tích dữ liệu chiều cao. Tôi có ý tưởng về cách thức hoạt động của t-SNE (nhờ video StatQuest trên YouTube ) nhưng dường như tôi không thể nghĩ về UMAP (Tôi đã nghe cuộc nói chuyện của người tạo UMAP trực tuyến nhưng không dễ hiểu). Tôi đã trở lại bài báo gốc mô tả nó nhưng nó quá nhiều toán học đối với tôi.

Bất cứ ai có thể làm sáng tỏ về vấn đề này? Tôi đang tìm kiếm hoặc một lời giải thích trực quan, tương tự như video StatQuest liên kết ở trên.


1
Tôi đang tìm kiếm trực giác trong lời nói nhưng cũng có một số hiểu biết đơn giản về các phép tính toán học (tôi không biết liệu điều này có khả thi không). Tôi muốn thấy một cái gì đó như thế này cho UMAP: "StatQuest tSNE Giải thích rõ ràng" youtube.com/watch?v=NEaUSP4YerM Khi tôi nói, tôi hiểu cách tSNE hoạt động, tôi đang đề cập đến phương pháp tính toán rộng được mô tả trong video . Tôi hơi khó tưởng tượng ví dụ trong video ở không gian chiều cao hơn, nhưng nhìn chung tôi có thể thấy khoảng cách được tính toán. Tôi muốn có một sự hiểu biết tương tự về UMAP
Atakan

Câu trả lời:


13

Bạn nói rằng sự hiểu biết của bạn về t-SNE dựa trên https://www.youtube.com/watch?v=NEaUSP4YerM và bạn đang tìm kiếm một lời giải thích về UMAP ở cấp độ tương tự.

Tôi đã xem video này và nó khá chính xác trong những gì nó nói (tôi có một số nitpicks nhỏ, nhưng nhìn chung nó vẫn ổn). Hài hước lắm, nó gần như áp dụng cho UMAP như nó vốn có. Đây là những điều không áp dụng:

  1. Điểm tương đồng được tính từ khoảng cách sử dụng hạt nhân khác nhau; nó không phải là Gaussian, nhưng nó cũng phân rã theo cấp số nhân và nó cũng có chiều rộng thích nghi, như trong t-SNE.
  2. Điểm tương đồng không được bình thường đến tổng là 1, nhưng vẫn kết thúc bằng việc bình thường để tổng hợp một giá trị không đổi.
  3. Điểm tương đồng được đối xứng, nhưng không chỉ bằng cách tính trung bình.
  4. Hạt nhân tương tự trong không gian nhúng không phải là hạt nhân phân phối chính xác, mà là một hạt nhân rất giống nhau.

Tôi nghĩ rằng tất cả những khác biệt này không quan trọng lắm và không có kết quả. Phần thực sự quan trọng là phần trong video mà người kể chuyện nói (10m40s):

Chúng tôi muốn làm cho hàng này trông giống như hàng này [...]

Các video không giải thích cách định lượng t-SNE cho dù họ là tương tự hay không và làm thế nào nó đi vào việc đạt được rằng họ trông giống như. Cả hai phần đều khác nhau trong UMAP. Nhưng tuyên bố được trích dẫn cũng có thể áp dụng cho UMAP.


Cách viết bài UMAP, sự tương đồng về tính toán với t-SNE không rõ ràng lắm. Cuộn xuống Phụ lục C trong https://arxiv.org/pdf/1802.03426.pdf và / hoặc xem tại đây https://jlmelville.github.io/uwot/umap-for-tsne.html , nếu bạn muốn xem so sánh song song các tính toán mà tôi liệt kê ở trên và các hàm mất mát của t-SNE và UMAP.


Điều này rất hữu ích, cảm ơn! Tôi có một câu hỏi về điều đó phân khúc cụ thể của video. Khi anh ta đang hiển thị "bản đồ nhiệt không có thứ tự" ở bên trái, các chấm chú thích (điểm dữ liệu đầy màu sắc) theo thứ tự và cường độ màu tại giao lộ cột hàng không khớp với biểu đồ ở bên phải. Đó là một sự diễn đạt sai, phải không? Tôi mong đợi đồ thị ở bên trái để có thứ tự khi nói đến các điểm dữ liệu, sau đó sẽ được sắp xếp theo UMAP. Tôi đang đi sai đường ở đây?
Atakan

@Atakan Tôi không chắc bạn đang nói gì. Tôi không thấy một sự diễn đạt sai. Tôi đang xem khung hình video lúc 10:40. Ma trận tương đồng trái là "một mớ hỗn độn". "Dấu chấm chú thích" ở bên trái chỉ cần đánh dấu cụm của từng điểm; hãy tưởng tượng rằng các điểm được đánh số từ 1 đến 12. 12 hàng / cột của ma trận tương ứng với các điểm này; 4 hàng đầu tiên tương ứng với các điểm "xanh", 4 tương ứng bên cạnh những điểm "đỏ", vv Kể từ khi nhúng 1 chiều (ở dưới cùng của khung) là "một mớ hỗn độn", những điểm tương đồng trong ma trận cũng là "một mớ hỗn độn".
amip

8

Sự khác biệt chính giữa t-SNE và UMAP là việc giải thích khoảng cách giữa các đối tượng hoặc "cụm". Tôi sử dụng dấu ngoặc kép vì cả hai thuật toán không có nghĩa là phân cụm - chúng chủ yếu để trực quan hóa.

t-SNE bảo tồn cấu trúc cục bộ trong dữ liệu.

UMAP tuyên bố để bảo vệ cả hai địa phương và hầu hết các cấu trúc toàn cầu trong dữ liệu.

Điều này có nghĩa là với t-SNE, bạn không thể giải thích khoảng cách giữa các cụm A và B ở các đầu khác nhau của âm mưu của bạn. Bạn không thể suy ra rằng các cụm này khác nhau hơn A và C, trong đó C gần với A hơn trong cốt truyện. Nhưng trong cụm A, bạn có thể nói rằng các điểm gần nhau là các đối tượng giống nhau hơn các điểm ở các đầu khác nhau của hình ảnh cụm.

Với UMAP, bạn sẽ có thể diễn giải cả khoảng cách giữa / vị trí của các điểm và cụm.

Cả hai thuật toán đều rất ngẫu nhiên và phụ thuộc rất nhiều vào sự lựa chọn của siêu đường kính (t-SNE thậm chí nhiều hơn UMAP) và có thể mang lại kết quả rất khác nhau trong các lần chạy khác nhau, do đó, âm mưu của bạn có thể làm xáo trộn thông tin trong dữ liệu mà lần chạy tiếp theo có thể tiết lộ.

Tốt PCA cũ trên Mặt khác là xác định và dễ hiểu với kiến ​​thức cơ bản của đại số tuyến tính (nhân ma trận và eigenproblems), nhưng chỉ là một sự giảm tuyến tính trái ngược với giảm phi tuyến tính của t-SNE và UMAP.


10
Tôi hoàn toàn không đồng ý với đánh giá này: "t-SNE bảo tồn cấu trúc địa phương và bỏ qua cấu trúc toàn cầu. UMAP thừa nhận cả cấu trúc địa phương và toàn cầu." UMAP hoạt động trên biểu đồ lân cận k-gần nhất (đối với một số giá trị nhỏ của k), chính xác như t-SNE.
amip

Đây thực sự là những gì các tác giả của yêu cầu UMAP, xem ví dụ ở đây hoặc ở đây . Bạn có biết về một so sánh (lý thuyết hoặc thực tế) cho thấy rằng tuyên bố của họ không đúng? Hãy chia sẻ!
Edgar

6
Tôi biết rằng họ nói điều này ...: - / Nhưng chính họ là những người đang đưa ra tuyên bố này, vì vậy trách nhiệm thuộc về họ để chứng minh điều đó (không phải để tôi từ chối). Tôi đã không thuyết phục bởi những gì tôi thấy cho đến nay.
amip

2
đúng, nó vẫn là một phương pháp mới. chúng ta hãy hy vọng một số đánh giá chặt chẽ hơn của umap vs t-SNE sẽ được thực hiện. tôi đã thay đổi câu trả lời của tôi để phản ánh quan điểm của bạn.
Edgar

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.