分类模型——聚类分析(零)

聚类分析在数据挖掘领域中非常活跃的领域之一,因为随着大数据时代的到来,相应的数据处理模型急需面世。聚类分析作为一种无监督机器学习方法,在信息检索和数据挖掘等领域都有很广泛的应用,例如金融分析、医学、生物分类、考古等众多领域。当然简单的聚类分析应用于我们数学建模比赛中是完全没有问题的。但是小编还是想具体介绍一下聚类分析的背景以及前景。因为小编认为这个模型的突破完全可以让人类步入新的纪元。虽然现有的聚类算法比较多,但它们都会有这样那样的不足,数据集的不同也会影响不同聚类算法的聚类结果。研究和改善聚类算法、提高聚类结果的准确率一直以来是国内外专家、研究人员的重点工作之一。给大家先看一下简单的聚类分析

分类模型——聚类分析(零)_第1张图片
这是简单的二维聚类,它显示了一个按照数据对象之间的距离进行聚类的示例,距离相近的数据对象被划分为一个簇。
小编来给大家具体说说它的前景吧。
1,商业
大家目前可能已经熟悉了商家广告的精准投放,这个例子就可以是为聚类分析的产物。大家都知道现在消费者的数据采集变得无比容易,那如何去根据一堆庞大的数据去分析出每位消费者的喜好呢,或者说如何精准的获得每个喜好群体的消费者。这就需要聚类分析来对庞大的数据进行分类。
2,生物
目前的聚类分析仅仅是简单低维度的聚类分析,像十维,百维,千维,万维…这些聚类分析算法目前还是一片空白,但我们可以预测当聚类分析算法突破到万维时,人类完全可以攻克蛋白质,遗传信息的奥秘。从而步入创造生命的时代。
其它方面小编就不赘述了,我们进入正题,解析聚类分析。
聚类分析包含以下算法(可能还有其它的聚类分析算法,但小编知识有限就细写讲以下几个算法趴)

分类模型——聚类分析(零)_第2张图片
这其中小编最熟悉的是K-means和K-medoide但实际上K-medoide是K-means的改进版,它优化了“噪声”对中心点的影响(噪声是指数据中的极端数据,毕竟林子大了什么鸟都有嘛,何况成千上万的数据呢)但是我个人认为K-medoide还有一定的优化空间,我个人也验证了自己优化后的模型准确性有较大幅度的提升,后续的文章会具体介绍哦~
我们下一篇正式开启聚类分析法(一)大家有需要的可以关注下我滴公众号哦,我会在里面放实现代码(我也是一篇一篇写,大家不要着急哈)。
分类模型——聚类分析(零)_第3张图片

你可能感兴趣的:(数学建模模型)