期末周总结-人工智能-遗传算法聚类

针对 k -Means 算法在聚类时精确度不高及输入参数难以确定等缺点,提出了基于遗传算法的聚类框架。该算法框架主要是将聚类问题转化为对准则函数最优解的搜索问题,然后使用遗传算法在全局空间上进行搜索进而得到最优解。对该框架下传统遗传算法聚类和基于 k -Means 的遗传算法聚类进行了研究,实验部分与 k -Means 算法在四个数据集上进行了综合对比。实验结果表明,遗传算法聚类具有聚类效果好,无需提前输入聚类簇数等优点,综合性能优于 k -Means 算法。
期末周总结-人工智能-遗传算法聚类_第1张图片

 k-Means算法准则函数如下:

期末周总结-人工智能-遗传算法聚类_第2张图片

遗传算法的具体实现过程可以被描述为:该算法首先从初始种群出发,然后通过染色体在适应大环境前提下不断进行优化。遗传算法中判断染色体质量的好坏是以其适应能力的强弱为依据的,下一代染色体的适应能力越强其进行下一轮进化的可能性就越大,循环进行多次进化以后形成最强染色体,这组染色体就是研究问题的最优解或最佳解决方案。从遗传的角度来看,在这种算法中染色体的适应能力在很大程度上决定了最优解的质量的高低,而这种最优解又对应的是群体中个体的最优解。由于在判断个体适应能力强弱时会使用适应度函数来计算其大小值,因此需要注意的是该函数的定义要和求解问题的特征相符才能计算个体的适应度大小。
基于上文分析,聚类问题可以转化为对准则函数的最优化求值问题。而遗传算法可以在全局上随机搜索最优解,因此将聚类问题转化为最优化求解问题后,可以用遗传算法进行聚类,确保聚类结果能达到全局最优。遗传算法主要有染色体编码,初始种群设定,适应度函数设定,遗传操作设计等几大部分所组成。接下来本文基于这几部分对基于遗传算法的聚类问题进行分析。
期末周总结-人工智能-遗传算法聚类_第3张图片
基本遗传操作包括选择、交叉和变异三种类型。选择操作是指根据选择概率,按照某种策略从当前种群中挑选出一定数目的个体,使它们能够有更多的机会遗传到下一代。交叉操作是指按照某种方式对选择的父代个体染色体的部分基因进行交配重组,从而形成新的个体。变异是指对选中个体的染色体中某些基因进行变动,已形成新的个体。遗传算法中交叉和变异操作增加了算法的局部搜索能力,从而维护种群的多样性。
期末周总结-人工智能-遗传算法聚类_第4张图片

期末周总结-人工智能-遗传算法聚类_第5张图片 

 结果如下:

期末周总结-人工智能-遗传算法聚类_第6张图片

本文首先简要介绍了聚类的基本概念,进而将聚类问题描述为对准则函数的最优解搜寻问题。基于遗传算法能在全局空间上搜索最优解这一思想,本文将遗传算法用于求解聚类问题。此外,为了加快初始阶段的搜索速度,本文将 k -Means 与传统遗传算法相结合得到新的基于 k -Means 的遗传算法。在实验部分对这三个算法进行了综合对比,实验发现,标准的遗传算法确实能得到最优解,性能胜过 k -Means 算法,但存在迭代次数多,收敛速度慢的缺陷。基于 k -Means的遗传算法虽然可以在初始阶段加快搜索速度,但由于 k -Means 的缺陷导致了群体过度早熟,容易陷入了局部最优解。

 

 

 

你可能感兴趣的:(聚类,人工智能,算法)