Bạn đã nghe nói về Phép tính xấp xỉ và phép chiếu đồng nhất (UMAP) chưa?
UMAP (Phép tính xấp xỉ và phép chiếu đồng nhất) là một kỹ thuật học đa dạng mới lạ để giảm kích thước phi tuyến tính. UMAP được xây dựng từ một khung lý thuyết dựa trên hình học Riemannian và cấu trúc liên kết đại số. Kết quả là một thuật toán có thể mở rộng thực tế áp dụng cho dữ liệu trong thế giới thực. Thuật toán UMAP cạnh tranh với t-SNE về chất lượng hình ảnh và được cho là bảo tồn nhiều hơn cấu trúc toàn cầu với hiệu suất thời gian chạy vượt trội. Hơn nữa, UMAP như được mô tả không có hạn chế tính toán đối với kích thước nhúng, khiến nó trở thành một kỹ thuật giảm kích thước mục đích chung cho học máy.
Kiểm tra mã và giấy tờ gốc của họ để biết danh sách ưu và nhược điểm, nó rất dễ sử dụng.
Thông tin nhanh: UMAP có thể xử lý các bộ dữ liệu lớn và nhanh hơn t-SNE và cũng hỗ trợ phù hợp với dữ liệu ma trận thưa thớt, và trái với t-SNE, một kỹ thuật giảm kích thước mục đích chung, có nghĩa là không chỉ có thể được sử dụng để hiển thị mà còn để giảm không gian tính năng cho ăn vào các mô hình học máy khác.
Ví dụ cụ thể: Tôi đã điểm chuẩn phương pháp và so sánh nó với một số máy tính xách tay chuẩn kỹ thuật giảm kích thước khác , nếu muốn có một cái nhìn nhanh và bắt đầu nhảy.