t-SNE是一种基于概率的非线性降维算法,可以将高维数据映射到低维空间,并保留数据之间的局部关系。该算法的核心思想是,将高维数据的相似关系映射成低维空间中的相似关系,同时将低维空间中不相似的数据映射成高维空间中的不相似关系。这种映射可以通过最小化KL散度的方式来实现,KL散度可以比较高维空间中两个概率分布的差异,进而得到低维空间中的数据分布。
相对于其他常用的降维方法如PCA和LDA等,t-SNE更适用于非线性数据的降维,并能够更好地适应数据之间的复杂关系。它也与其他降维算法如UMAP等进行比较,其特点之一是保留更多的局部信息,因此在可视化高维数据方面表现更好。