MLACO: A multi-label feature selection algorithm based on ant colony optimization一种基于蚁群优化的多标签特征选择算法

Multi-label feature selection;Ant colony optimization;Cosine similarity;Correlation similarity

创新点:作者首次提出了一种新的基于蚁群优化(ACO)的多标签关联冗余特征选择方法MLACO。通过引入两个无监督和有监督的启发式函数,MLACO试图通过多次迭代,在特征空间中寻找冗余度最低(无监督)和类标签相关性最高的最有前途的特征。为了加快算法的收敛速度,将特征和类标签之间的归一化余弦相似度作为每个蚂蚁的初始信息素。该方法不考虑任何学习算法,可分为基于滤波器的方法。比较了MLACO的性能与使用ML-KNN分类器的五种著名和最先进的特征选择方法。

        根据数据中类标签的是否存在,特征选择方法可分为有监督、无监督和半监督两种。在监督方法中,数据被标记,特征的重要性由特征与类标签之间的相关性决定,如信息增益、熵、相互信息等。相比之下,无监督方法使用没有类标签的数据集,因此特征秩应该根据方差、拉普拉斯分数等统计度量来计算。在半监督数据中,有一些标记数据,而特征与这些标签之间的相关性有助于在未标记数据中评估它们

        由于标签大量、标签依赖、高维、数据不平衡等原因,多标签特征选择成为一个具有挑战性的过程。

        近年来,基于种群的元启发式算法在解决高质量解和合理时间内的组合优化问题方面引起了广泛的关注。进化算法如遗传算法,基于群智能的算法如蚁群,粒子群优化,磷虾群,重力搜索和贪婪群优化器都属于这类算法。

        ACO由被称为蚂蚁的人工药剂组成,它们的灵感来自于真实蚂蚁的行为。每只蚂蚁都随机地穿过这些特征,并在一条叫做信息素的路径上留下一些化学痕迹。每只蚂蚁在每次迭代中都会更新信息素的轨迹。信息素的强度显示了已建立的溶液的质量;即信息素值越多,特征质量越好。在该方法中,我们利用特征和类标签之间的最大余弦相似度来初始化信息素轨迹作为先验知识。有两种无监督和监督启发式函数来检测特征的冗余和相关性,特征之间的相关性作为特征的冗余,特征与类标签之间的最大相关性作为特征的相关性。该方法没有考虑任何学习算法。因此,可以将其归类为一种基于过滤器的方法。最后,根据其信息素对特征进行降序排序,并选择最靠前的特征。

        蚁群优化算法优点具有全局和局部能力、使用分布式长期记忆和使用强化学习方法等优点

所提算法:

1、测量特征的冗余性和相关性(使用特征之间的皮尔逊相关系数的绝对值度量相似性)

MLACO: A multi-label feature selection algorithm based on ant colony optimization一种基于蚁群优化的多标签特征选择算法_第1张图片

2、信息素初始化(特征与类标签之间的余弦相似度的最大值来初始化信息素矩阵)

MLACO: A multi-label feature selection algorithm based on ant colony optimization一种基于蚁群优化的多标签特征选择算法_第2张图片

在计算了特征与类标签之间的余弦相似度矩阵后,用每个特征与对应的类标签之间的余弦相似度的最大值来指定信息素矩阵。因为在一些数据集中,这些值非常接近,最小-最大归一化应用于区间[0,1]之间的比例。

 

3、状态转换规则

MLACO: A multi-label feature selection algorithm based on ant colony optimization一种基于蚁群优化的多标签特征选择算法_第3张图片

4、全局信息素更新规则

5、算法步骤

MLACO: A multi-label feature selection algorithm based on ant colony optimization一种基于蚁群优化的多标签特征选择算法_第4张图片

你可能感兴趣的:(文献阅读,机器学习,算法,人工智能)