scikit-learn之聚类算法之Affinity Propagation

基本概念

exemplar: 聚类的中心点;
s(i,k): 样本 i 和样本 k 之间的相似度,初始化时会有一个相似度矩阵;
preference: 偏好参数(参考度),指相似度矩阵中横轴纵轴索引相同的点,如s(i,i),表示数据点 i 作为聚类中心的程度。迭代开始前假设所有点成为聚类中心的能力相同,因此参考度一般设为相似度矩阵中所有值得最小值或者中位数,但是参考度越大则说明各数据点成为聚类中心的能力越强,则最终聚类中心的个数越多;
r(i,k): responsibility(吸引度),样本 k 适合作为样本 i 的聚类中心的累积信任度;
a(i,k): availability(归属度),样本 i 应该选择样本 k 作为其聚类中心的累积信任度;
damping factor: 阻尼系数,为了避免 r(i,k) 和 a(i,k) 在更新时发生数值震荡;

算法流程

1、计算初始的相似度矩阵,将各点之间的吸引度 r(i,k) 和归属度 a(i,k) 初始化为 0;
2、更新各点之间的吸引度,随之更新各点之间的归属度,公式如下:
这里写图片描述
这里写图片描述
这里写图片描述
其中,λ

你可能感兴趣的:(机器学习)