进化集成学习算法综述

【摘  要】进化集成学习结合了集成学习和进化算法两方面的优势,并在机器学习、数据挖掘和模式识别等领域被广泛应用。首先对进化集成学习算法的理论基础、组成结构及分类情况进行了概述。然后根据进化算法在集成学习中的优化任务,从样本选择、特征选择、集成模型参数组合优化、集成模型结构优化以及集成模型融合策略优化几个方面对当前进化集成学习领域的一些代表性研究成果进行了详细的综述,并分析和总结了各种进化集成学习算法的特点。最后对现有的进化集成研究的优缺点进行探讨,并给出了未来的研究方向。

【关键词】  集成学习 ; 机器学习 ; 进化算法 ; 分类 ; 回归 ; 聚类

1.引言

作为当前人工智能(artificial intelligence,AI)发展的主要方向之一,机器学习(machine learning, ML)越来越多地受到人们的关注。由于单个学习器的泛化能力或鲁棒性往往较差,因此一些研究将多个学习器以一定的策略组合,构成集成模型,以提高学习器解决问题的能力。许多研究结果表明,新构建的集成学习(ensemble learning,EL)系统往往可以获得比单一学习器更优越的泛化性能或鲁棒性,并且可以在保证集成学习系统性能的前提下,选择一组最佳子学习器来提高学习系统的效率,这些优势使集成学习逐渐成为机器学习领域的研究热点,美国人工智能协会(American Association Artificial Intelligence,AAAI)前主席 Thomas G Dietterich 教授还曾将集成学习、可扩展机器学习(例如对大数据集、高维数据的学习等)、强化学习、概率网络列为机器学习的四大研究方向。近些年,随着集成学习

你可能感兴趣的:(物联网及AI前沿技术专栏,大数据)