UMAP降維算法
Uniform Manifold Approximation and Projection (UMAP)是一種降維技術(shù),可用于類似于 t-SNE 的可視化,也可用于一般的非線性降維。該算法建立在對(duì)數(shù)據(jù)的三個(gè)假設(shè)之上。
- 數(shù)據(jù)均勻分布在黎曼流形上;
- 黎曼度量是局部常數(shù)(或可以近似);
- 流形是局部連接的。
根據(jù)這些假設(shè),可以對(duì)具有模糊拓?fù)浣Y(jié)構(gòu)的流形進(jìn)行建模。嵌入是通過搜索具有最接近的可能等效模糊拓?fù)浣Y(jié)構(gòu)的數(shù)據(jù)的低維投影來找到的。
此軟件包現(xiàn)在也提供對(duì) densMAP 的支持。densMAP 算法增強(qiáng)了 UMAP,除了數(shù)據(jù)的拓?fù)浣Y(jié)構(gòu)外,還保留了局部密度信息。
UMAP依賴于 scikit-learn,因此也依賴于 scikit-learn 的依賴關(guān)系,如 numpy 和 scipy。由于性能原因,UMAP 增加了對(duì) numba 的要求。原始版本使用 Cython,但 Numba 的代碼清晰度、簡(jiǎn)單性和性能的提高使得這一轉(zhuǎn)變成為必要。
評(píng)論
圖片
表情
