机器学习-聚类算法

在世界的分析和描述中,类,或在概念上有意义的具有公共特性的对象组,扮演着重要的角色。的确,人类擅长将对象划分成组(聚类),并将特定的对象指派到这些组(分类)。例如,即使很小的孩子也能很快地将图片上的对象标记为建筑物、车辆、人、动物、植物等。就理解数据而言,簇是潜在的类,而聚类分析是研究自动发现这些类的技术。聚类分析在广泛的领域都扮演着重要角色。这些领域包括如下:

经济领域:帮助市场分析人员从客户数据库中发现不同的客户群,并且用购买模式来刻画不同的客户群的特征;企业信用等级分类;

生物学领域:推导植物和动物的分类;对基因分类,获得对种群的认识;

心理学和医学:一种疾病或健康状况有多种变种,聚类分析可以用来发现这些子类别。例如,聚类已经用来识别不同类型的抑郁症。聚类分析也可以用来检测疾病的时间和空间分布模式。

其它社会科学、统计学、模式识别、信息检索、机器学习和数据挖掘等。

聚类分析仅根据在数据中发现的描述对象及其关系的信息,将数据对象分组。其目标是,组内的对象相互之间是相似的(相关的),而不同组中的对象是不同的(不相关的)。组内的相似性(同质性)越大,组间差别越大,聚类就越好。

你可能感兴趣的:(聚类,算法,机器学习)