机器学习——聚类

#  聚类任务

聚类是将数据集中的样本划分为若干个互不相交的子集,每个子集称为一个”簇“。

需要注意的是:聚类过程仅能自动形成簇结构,簇所对应的概念语义需由使用者来把握命名。

聚类既能作为一个单独过程,用于寻找数据内在的分布式结构,也可以作为分类其他学习任务的前驱过程。

# 聚类的种类

聚类按照聚类方法分为原型聚类、密度聚类和层次聚类三种。

## 原型聚类

原型聚类亦称”基于原型的聚类“,此类算法假设聚类结构能通过一组原型刻画,在现实聚类任务中极为常用。

通常情况下,算法先对原型进行初始化,然后对原型进行迭代更新求解。

### k均值算法

该算法

你可能感兴趣的:(聚类,机器学习,算法)