tSNE和UMAP的區別
這壹篇是我的學習筆記,先附上學習鏈接: /s/qkbc1vz-ERHzGp8gfLiVsg
首先,這是兩種降維的scRNA-seq的降維圖
那麽它們有什麽區別呢?
首先,在高維空間內,描述兩個點(兩個細胞)的距離不壹樣,tSNE采取的是“概率算法”,即把兩個點的距離轉換成概率,若 i 與 j 這兩個點距離比較近的話,它所對應的概率較大;而UMAP采取的是傳統的歐式距離。
這裏的x表示的高維空間的距離
在計算σ的時候(計算距離所需)
在此之前,我們先簡單介紹下perplexity和香農熵
perplexity反應的是細胞的臨近個數,當perplexity越大,細胞分布越緊密,壹般perplexity = (細胞數-1)/ 3
香農熵是用於描述細胞的混亂程度的物理量,什麽意思呢?
每兩個細胞之間都會存在壹定的距離,香農熵描述的是細胞間的距離層差不齊的程度
那麽回到我們這幅圖
最後就是降維以後,在低維空間的距離校正方法不同,tSNE采用的是t分布進行校正,而UMAP采用的是與最小距離比較,從而確定表達式
這裏的y指的是低維空間的兩點(兩個細胞)間的距離,
通過高維空間的距離到低維空間的映射,那麽低維距離就可以進行可視化