6、无监督学习知识点

无监督学习知识点

聚类
K-mean:选k个点,不断计算中心距离(x,y坐标的平均值)进行分类
DBscan:设置圆半径对相邻点进行归类
层次:两两合并,和哈夫曼树构造类似
mean shift:计算梯度密度,向该方向移动
C-mean:高斯分布核的距离分类


关联

apriori:
将所有数据排列组合,根据支持度和置信度对组合进行筛选

fp-grow:
根据支持度和置信度,构造fP树进行排列组合

euclat:
用元素划分置信度,再划分元素



降维

pca:协方差
PCA的工作就是从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与数据本身是密切相关的。转换坐标系时,以方差最大的方向作为坐标轴方向,因为数据的最大方差给出了数据的最重要的信息。

Lda:投影
投影后类内方差最小,类间方差最大

SNE与t-SNE:将“距离的远近关系”转化为一个概率分布,梯度下降法更新降维参数,计算出映射后的两组概率用KL散度衡量效果,用梯度下降调节效果。
SNE:  高斯分布  
t-SNE:t分布(指数拉大距离减少拥挤)  解决拥挤重叠现象

LSA和SVD:
奇异值分解,将一个矩阵用其他几个矩阵的乘积来表示

你可能感兴趣的:(学习笔记,学习,python)