kezhang_30

读-进化集成学习算法综述

进化集成学习算法综述

一、引言
二、进化集成学习的理论基础与分类
- 1.集成学习的定义与理论依据
- 2.集成学习的组成
- 3.基于进化算法的集成学习方法
三、分类、回归和聚类问题中的进化集成学习算法
- 1.基于数据处理的方法
- 2.基于集成学习模型参数优化的方法
- 3.基于集成学习模型结构优化的方法
- 4.基于融合策略优化的方法
- 5.混合进化集成学习算法
四、总结

原文：胡毅, 瞿博阳, 梁静, 王杰, 王艳丽. 进化集成学习算法综述. 智能科学与技术学报[J], 2021, 3(1): 18-35 doi:10.11959/j.issn.2096-6652.202103

一、引言

在集成学习中，不同子学习器的多样性与求得解的准确性或鲁棒性之间往往存在冲突，这种冲突一般可以通过调整子学习器自身结构参数或群体学习器的融合权值等方法解决，这明显是一个优化问题。

与传统优化方法相比，遗传算法、粒子群优化算法、差分进化算法等一系列进化算法具有适用性广、鲁棒性强、可以实现全局优化等特点。因此，一些学者讲集成学习与进化算法结合，形成进化集成学习算法。

在进化集成学习算法中，进化算法通常被用于集成学习系统中的样本选择、特征选择或对集成模型包含的参数、网络结构等进行优化，也有部分工作使用进化优化算法选择一组最佳子学习器（选择性集成学习）或对多个子学习器的融合策略进行优化。

进化集成学习算法示意图:

二、进化集成学习的理论基础与分类

1.集成学习的定义与理论依据

介绍偏差-方差-协方差分解理论：

分析指出，提高整个集成学习系统的关键在于设计相关性低的子学习器，即提高子学习器的多样性。

2.集成学习的组成

集成学习系统主要包括集成学习的生成和子学习器的融合两部分。

集成学习的生成主要通过一定的技术生成一系列好而不同的子学习器。
多样性：

数据多样性
参数多样性
结构多样性
其他

多样性和预测性能是集成学习方法的两个重要的指标。如何较好地平衡集成学习系统的多样性与预测性能是一个非常复杂的问题，采用经验法在大多数情况下并不能达到最佳效果，而进化优化算法的全局搜索特性为解决两种指标相互冲突的问题提供了契机，因此进化集成学习算法具有十分重要的理论意义和实际应用价值。

集成学习系统的另一个重要组成部分就是子学习器的融合，将多个子学习器的输出整合为最终的结果。常见的融合策略有多数投票、简单平均、基于权值的投票方法和基于Median Partition共识函数的融合策略等。

3.基于进化算法的集成学习方法

在进化集成学习算法中，首先将多个子学习器以Bagging、Adaboost等方法组建成集成学习模型，以样本子集、特征子集、网络参数和融合权值等为编码对象，对种群进行初始化。然后以最小化集成学习模型的预测精度或网络的复杂度，以及最大化网络结构的多样性为优化目标，对种群进行适应度评价。采用交叉和变异策略、小生境策略或档案集管理方法等机制，对种群中的个体进行更新，直至达到最大迭代次数或满足其他终止条件。

针对不同的集成学习模型，可以通过选择合适的进化算法来提高模型的整体学习能力。

如果仅考虑提高集成学习模型的预测准确性，则可以采用单目标优化算法。
如果同时考虑预测准确性与所建立模型的复杂性，则需选择多目标优化算法。

三、分类、回归和聚类问题中的进化集成学习算法

1.基于数据处理的方法

一些学者使用不同的进化算法对集成学习的样本进行数据处理，主要集中在样本选择、特征选择和特征构建上。

样本选择主要用于减少样本规模，最大限度地检测并消除冗余和错误的样本信息。
特征选择通过一定的方法筛选并剔除数据的冗余特征，以达到降低数据特征空间维度、提高解决问题效率的目的。
特征构建则对源数据进行推断，并构建有利于数据分析的新的特征。

在集成学习系统中，选取最小规模的样本子集或有效特征子集可以最大限度地减轻学习系统的计算负担，提升学习系统的综合学习能力。

A method for entity resolution in high dimensional data using ensemble classifiers [J]. Mathematical Problems in Engineering, 2017(12): 1-11. LIU Y , DIAO X C , CAO J J ,et al.
在这篇文章中，作者以SVM为子分类器，通过设计一种改进的多目标蚁群优化（MOACO）算法对高维度的实体解析问题进行处理。

在文中提出的EC-ER算法的目标函数表达式如下：

其中，αi表示第 i 个子分类器的准确率；β(αj,αi)表示第i个分类器与第j个分类器的差异度，差异度的值通过计算不同分类器预测结果的皮尔逊相关系数得到；γi表示第 i 个子分类器的特征数量。

作者设计的多目标优化算法旨在使集成学习系统保持更高的分类准确率和子分类器多样性的同时，获得更少的样本特征数量。
在获得Pareto前沿解后，作者按照优先度梯度的方法获得最终的Pareto最优解。优先顺序从高到低分别是准确率最高、差异度最大和特征数量最少，在满足前两个目标的前提下选择最少的特征数量。
然而在特征选择中，相同的特征数量对应着多种不同的特征组合，这是一个多模态的优化问题。在实际情况中，可以采用多模态优化技术获得同一最佳特征子集下的多种特征组合。在保证集成学习模型预测性能和多样性的前提下，赋予了决策者更多选择最佳特征子集的机会。

Unsupervised feature selection using clustering ensembles and population based incremental learning algorithm[J]. Pattern Recognition, 2008,41(9): 2742-2756.
在这篇文章中，作者以K-means为子学习器，通过随机子空间方法构建集成聚类学习模型CEFS。其中，种群增量学习（population based incremental learning，PBIL）算法被应用于集成聚类学习的特征选择问题中。该方法对所有特征进行二进制编码，以最大化聚类算法的产生解与集成解的相似程度为目标进行优化。这种相似程度的表达式如下：
其中，ξ表示要解决问题的类别数目；y 和Y分别表示子学习器和集成学习器的输出结果。

作者通过集成多个聚类算法来提高集成聚类学习的鲁棒性，并利用集成学习模型确定特征选择评价准则，提出基于集成聚类的无偏差特征选择方法。然而所提出的方法并没有包含对整个集成网络的多样性分析，可以通过集成多个差异度大的子学习器或者设计多样性指标，并使用进化计算的方法，寻找同时满足相似度和多样性指标的最佳特征子集。

2.基于集成学习模型参数优化的方法

集成学习模型中的参数对整个模型的性能有很大影响。这里的参数主要指集成学习生成阶段子学习器包含的参数或集成模型中包含的其他参数。

在机器学习中，即使是相同的学习器，当设置不同的参数时，预测效果也会大相径庭。

因此，许多研究采用不同的进化优化方法对集成模型中学习器的参数进行优化，以增加集成学习模型参数的多样性，从而提高整个集成学习系统的多样性。

A multi-level approach using genetic algorithms in an ensemble of least squares support vector machines[J]. Knowledge-Based Systems, 2016,106: 85-95.
在这篇文章中，以最小二乘支持向量机（LSSVM）为子学习器构建集成分类学习系统，并且以最小化误差为目标函数，采用GA算法同时进行参数优化、融合权值优化、特征选择和最佳子学习器的选择。该方法同时兼顾集成模型的结构特性与数据特征属性，在进化过程中不断地优化整个集成模型。

此方法不足之处在于，基础的GA算法不同很好地同时处理多个复杂的优化任务。针对不同的优化任务应设计相应的目标函数，因为单目标优化的方法无法很好地处理不同优化任务之间的关联性与冲突性。

A niching evolutionary algorithm with adaptive negative correlation learning for neural network ensemble[J]. Neurocomputing, 2017,247: 173-182.
这篇文章中，作者以径向基（RBF）神经网络为子学习器设计集成学习算法，解决分类问题。提出的MRNCL算法通过带有适应度共享和分配的非支配排序方法设计一种多目标进化优化算法，并将该算法用于优化RBF网络的中心、宽度和隐含层到输出层的权值。优化算法的适应度函数的表达式如下：

其中，R 表示集成模型中训练样本的数量；fi 表示第 i 个子学习器的输出值；xj为子学习器第 j 个训练样本的输入量；Y 为集成学习模型的最终输出量；zj表示第 j 个训练样本的期望输出值；ωj表示第 j 个训练样本对应的 RBF 网络输出层的权值。

3个计算式分别表示最小化单个神经网络中训练数据的均方误差、最大化不同神经网络间的负相关度和最小化集成网络的正则化值。

负相关学习主要是在集成学习的生成阶段给每个子学习器（主要是神经网络）的误差函数增加一个惩罚函数。新增的惩罚函数可以在不同的子学习器间形成一个负相关的误差，从而增加不同子学习器的差异化程度，达到增强集成学习模型多样性的目的。

作者还在负相关集成神经网络的基础上加入正则化分析，以降低算法的复杂度，提高算法处理带噪声数据的能力。

3.基于集成学习模型结构优化的方法

结构的多样性是集成学习模型多样性的重要体现。对集成学习模型的网络结构进行优化包括对子学习器的结构优化以及对整个集成网络子学习器的组合优化。

A multiobjective genetic programming-based ensemble for simultaneous feature selection and classification[J]. IEEE Transactions on Cybernetics, 2015,46(2): 499-510.
在这篇文章中，作者设计了一种基于决策树的集成分类器，并将多分类问题转化为二分类问题进行求解。

作者以最小化假正（false positive，FP）和假负（false negative，FN）的数量，以及最小化决策树的树叶节点为优化目标对决策树结构进行优化。由于文献中以最小化FP和FN的数量为优化目标，设计的进化集成学习算法 ASMiGP 更加适合不平衡数据的分类问题，这点在其实验分析阶段得到了验证。

Ensemble of heterogeneous flexible neural trees using multiobjective genetic programming[J]. Applied Soft Computing, 2017,52: 909-924.
在这篇文章中，作者使用多目标遗传规划（MOGP）算法对子学习器的节点分布和激活函数类别进行优化。作者选择选择神经网络和决策树两种不同的学习器组建一种名为异质柔性神经树（HFNT）的集成学习系统。

作者还使用HFNT解决分类、回归和时间序列预测问题。在HFNT中，多层反馈神经网络的节点可以设定不同的激活函数，并且不同的节点还可以跨层连接。

作者以最小化学习器学习结果的错误率、最小化树的规模和最大化多样性指标为优化目标，对HFNT的网络节点和不同节点对应的激活函数种类进行寻优。

在确定了HFNT的结构后，还采用DE算法对集成网络中的权值进行微调。在最后的组合阶段，融合策略采用多数投票的方法。

采用进化算法选择最佳子学习器组合的方法：
A genetic algorithm-based heterogeneous random subspace ensemble model for bankruptcy prediction[J]. International Journal of Applied Engineering Research, 2016,11: 2927-2931.
作者以最大化集成学习模型分类准确度为目标函数，使用GA对集成学习算法中的子学习器进行二进制编码，以寻找最佳子学习器组合。

文中将K近邻（KNN）、逻辑回归（LR）、DT和SVM 4种方法作为子学习器，通过随机子空间的方法构建异质集成分类学习模型GAHRS，并将之用于处理公司破产预测问题。

4.基于融合策略优化的方法

进化集成学习方法的融合策略主要包括子学习器融合权值优化和共识函数优化。前者主要针对集成分类学习和集成回归学习，而后者主要体现在集成聚类学习中。

Flexible neural trees ensemble for stock index modeling[J]. Neurocomputing, 2007,70(4-6): 697-703.
在这篇文章中，作者使用柔性神经树（FNT）集成技术对股票市场进行预测。

作者使用GP算法对神经树的结构进行优化，当确定了集成回归学习模型FNTE的结构后，通过PSO算法实现对网络模型参数的寻优和对融合阶段的权值的优化。多级优化策略虽然采用进化算法调整子学习器的多样性和预测性能，但是将子学习器融合权值优化与集成网络参数或结构优化分开进行的方法忽略了集成网络优化的整体性。

AdaBoost face detection algorithm based on fusion optimization of AFSA and PSO[J]. Journal of Chinese Computer Systems, 2016,37(4): 861-865.
在这篇文章中，作者利用人工鱼群算法（AFSA）的寻优特性来改进PSO算法的局部搜索能力，然后使用提出的混合优化算法来选择Adaboost模型中的最优子学习器组合及其融合权值。优化目标为最小化分类误差。最终的集成分类学习模型AFSA-PSO-AdaBoost被应用于人脸检测问题中。

5.混合进化集成学习算法

常见的集成学习方法通过集成多个相同属性的学习器（如分类、回归或聚类学习器）来完成有监督或无监督学习。然而，有些研究却将分类学习器或回归学习与聚类学习器结合，共同组建混合集成学习系统，并通过进化算法改善所建系统的学习能力。

Clustering and co-evolution to construct neural network ensembles:an experimental study[J]. Neural Networks, 2008,21(9): 1363-1379.
在这篇文章中，作者提出一种基于聚类和协同进化算法的集成神经网络模型CONE。
CONE首先采用进化聚类（ECM）算法将数据划分到不同的子空间中，然后使用基于模糊逻辑的神经网络（EFuNN）对不同子空间中的数据进行分类。由于被划分到不同子空间中的数据的结构不同，导致对应的EFuNN网络结构也互不相同，再分别使用单目标协同进化遗传算法（CEGA）、多目标协同进化遗传算法（MO-CEGA）和多目标协同进化策略（MO-CES）对不同EFuNN的结构或参数进行优化，从而在保证分类精度的同时，优化网络规模、提高计算效率。

通过聚类算法对问题进行知识提取的方法增加了集成算法的可解释性，使CONE更适用于解决在线预测问题。

四、总结

进化集成学习算法将集成学习与进化算法结合，不仅为提高集成学习的综合性能提供了新技术，同时也极大地丰富了集成学习的理论。未来关于进化集成学习算法的研究方向主要包括如下几个方面：

进化集成学习算法中目标函数的设计
选择合适的目标函数对提高进化集成学习算法的性能至关重要。常用的目标函数包括预测结果的准确度、集成模型的多样性、网络结构的复杂性、网络的负相关度和样本的相似度等。
进化集成学习算法中进化算法最终解的选择
分析现有的研究结果发现，最终解的选择方法与其需要解决的问题有很强的关联性。因此，在实际应用中，如何根据要解决的问题确定合适的最终解选择方案仍需要进行更广泛的研究。
进化集成学习算法中进化算法的选择
在进化集成学习中，需要根据集成模型的特点选择合适的进化算法。在面对大数据、云计算等复杂的机器学习任务时，相应的进化集成学习算法也需要根据实际问题重新设计针对性更强的进化算法。
进化集成学习方法应用范围的拓展
通过文献综述发现，当前的进化集成学习算法主要被用于解决分类问题，而面向回归和聚类问题的进化集成学习技术也值得更广泛的研究。此外，对进化集成方法进行改进以适用分布式计算、设计适用于在线学习的进化集成学习算法、将无监督学习与有监督学习方法结合以增强集成模型的学习性能等问题都是值得广泛和深入研究的课题。

【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
C++17 并行算法：std::execution::par
在多核处理器普及的今天，如何高效利用硬件资源成为提升软件性能的关键。C++17引入的并行算法库（ParallelAlgorithms）为开发者提供了一套标准化的并行编程接口，通过简单的策略切换即可将顺序算法转换为并行执行。本文将深入探讨C++17并行算法中最核心的执行策略std::execution::par，从基础概念到高级应用，全面解析其原理、用法及最佳实践。一、C++17并行算法概述1.1并
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
求平方根：牛顿迭代法 mjfztms leetcode 算法
应用牛顿迭代法求解方程近似解，收敛速度很快牛顿迭代法求解平方根给你一个非负整数x，计算并返回x的算术平方根n，结果只保留整数部分。算法流程图由题意得，n2=xn^2=xn2=x，即为对f(n)=n2−xf(n)=n^2-xf(n)=n2−x求解。第一步：易得：x2−x1=0−f(x1)f′(x1)x_2-x_1=\frac{0-f(x_1)}{f'(x_1)}x2−x1=f′(x1)0−f(x1)
【秋招算法】2025 届搜广推方向求职历程（SSP、头部计划）秋冬无暖阳° 搜广推等—算法面经面试职场和发展算法
【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）文章目录【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）1.背景2.日常实习3.暑期实习3.1暑期BG3.2暑期记录4.秋招4.1秋招BG4.2转正4.3头部4.4提前批4.5正式批5.面试记录5.1Coding5.2其他高频编程题5.3常见八股、面经6.关于搜广推1.背景关于日常实习、暑期实习、提前批，秋招、春招、补招何为大
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
算法分析与设计实验2：实现克鲁斯卡尔算法和prim算法表白墙上别挂我算法笔记经验分享
实验原理（一）克鲁斯卡尔算法：一种用于求解最小生成树问题的贪心算法，该算法的基本思想是按照边的权重从小到大排序，然后依次选择边，并加入生成树中，同时确保不会形成环路，直到生成树包含图中所有的顶点为止。具体步骤：边的排序：将所有边按照权重从小到大排序。初始化：创建一个空的生成树（可以是一个空的图结构），以及一个用于记录每个顶点所属集合（或称为连通分量）的数据结构（例如并查集）。边的选择：依次选择排序
（面经总结）一篇文章带你整理面试过程中常考的九大排序算法南淮北安冲刺大厂之面经总结面经排序算法二分插入冒泡快速
文章目录一、二分插入排序1.原理2.代码二、冒泡排序1.原理2.代码三、插入排序算法1.原理2.代码四、快速排序算法1.原理2.代码五、希尔排序1.原理2.代码六、归并排序1.原理2.代码七、桶排序八、基数排序九、堆排序1.原理2.代码十、总结1.算法分类2.性能分析一、二分插入排序首先必须是排好序的数组，然后通过二分查找，找到合适的位置，插入1.原理二分查找算法又叫作折半查找，要求待查找的序列有
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
通信算法之278：数据链/自组网通信设备--MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码--1.系统指标需求及帧结构设计秋风战士无线通信基带处理算法 MATLAB仿真软件无线电算法无人机经验分享
MIMO(2T2R)-OFDM系统系列–实际工程应用算法代码第一章：系统指标需求拆解分析第二章：通信系统帧结构设计和OFDM参数设计第三章：通信业务速率设计及理论解调门限第四章：同步序列设计及同步性能仿真验证第五章：数据业务设计及性能仿真验证第六章：信道模型设计第七章：接收关键算法设计及仿真验证第八章：其它待补充本文目录MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码一、实际项目：系
通信算法之287：通信技术点咨询秋风战士 MATLAB仿真软件无线电无线通信基带处理算法网络算法无人机经验分享
专业技术咨询方向第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线OFDM系统（SFBC码）帧结构设计第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
反向传播神经网络极简入门自信哥
单个神经元神经网络是多个“神经元”（感知机）的带权级联，神经网络算法可以提供非线性的复杂模型，它有两个参数：权值矩阵{Wl}和偏置向量{bl}，不同于感知机的单一向量形式，{Wl}是复数个矩阵，{bl}是复数个向量，其中的元素分别属于单个层，而每个层的组成单元，就是神经元。神经元神经网络是由多个“神经元”（感知机）组成的，每个神经元图示如下：这其实就是一个单层感知机，其输入是由和+1组成的向量，其
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【限时干货】Calibre智能分类，轻松突破内网限制畅享电子书库比头发还脆弱服务器 tcp/ip linux
文章目录前言1.网络书库软件下载安装2.网络书库服务器设置3.内网穿透工具设置4.公网使用kindle访问内网私人书库前言本研究旨在构建一套运行于微软操作系统环境下的独立电子图书管理体系，核心目标是建立可远程操作的资源访问机制。该架构采用高可用性设计，在第三方阅读平台服务中断时仍能保障数字内容传输的稳定性。系统创新性地融合了两大核心技术组件：通过Calibre开源软件实现文献分类算法与格式转换功能
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
使用 C++ 实现 MFCC 特征提取与说话人识别系统 whoarethenext c++开发语言 mfcc 语音识别
使用C++实现MFCC特征提取与说话人识别系统在音频处理和人工智能领域，C++凭借其卓越的性能和对硬件的底层控制能力，在实时音频分析、嵌入式设备和高性能计算场景中占据着不可或缺的地位。本文将引导你了解如何使用C++库计算核心的音频特征——梅尔频率倒谱系数(MFCCs)，并进一步利用这些特征构建一个说话人识别（声纹识别）系统。Part1:在C/C++中计算MFCCs直接从零开始实现MFCC的所有计算
深入解析C++中 std::sort背后的实现原理 —Introsort（Introspective Sort）点云SLAM C++c++算法数据结构快速排序排序算法堆排序深度优先
Introsort简介Introsort是一种混合排序算法，结合了三种经典算法的优点：算法用于特点快速排序通常情况平均时间复杂度O(nlogn)堆排序当快速排序退化（递归过深）时最坏时间复杂度O(nlogn)插入排序小规模数组时（如长度≤16）常数开销小，快Introsort运行机制排序逻辑如下：if(size2*log2(n))堆排序（HeapSort）else快速排序（QuickSort）快速
冒泡排序算法详解（含Python代码实现）算法_小学生算法
冒泡排序（BubbleSort）是最基础的排序算法之一，通常用于学习排序算法的入门理解。本文将通过Python代码实现冒泡排序，并详细讲解其原理、执行流程、复杂度分析及适用情况。✨一、算法简介冒泡排序的核心思想是：相邻两个元素比较，将较大的元素不断“冒泡”至右侧，最终实现排序。其基本过程是重复比较相邻的元素，如果顺序错误就交换，重复这一过程，直到没有任何需要交换的为止。二、Python代码实现下面
揭秘 Spring Cloud Zuul 在后端的负载均衡策略大厂资深架构师 Spring Boot 开发实战 spring cloud 负载均衡 spring ai
揭秘SpringCloudZuul在后端的负载均衡策略关键词：SpringCloudZuul、负载均衡、微服务网关、Ribbon、请求路由摘要：在微服务架构中，API网关是流量的“总调度员”，而负载均衡则是它的“智能大脑”。本文将以“小区门卫派件”为故事主线，用通俗易懂的语言揭秘SpringCloudZuul如何通过集成Ribbon实现后端负载均衡。我们将从核心概念到算法原理，从代码实战到应用场景
ImportError: /nvidia/cusparse/lib/libcusparse.so.12: undefined symbol: __nvJitLinkComplete_12_4 爱编程的喵喵 Python基础课程 python ImportError torch nvJitLink 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了ImportError:/home/
【NWFSP问题】基于中华穿山甲算法CPO求解零等待流水车间调度问题NWFSP研究（Matlab代码实现）
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️赠与读者1概述1.引言2.理论基础2.1中华穿山甲算法（CPO）核心原理2.2NWFSP数学模型3.CPO-NWFSP求解框架设计3.1编码与解码3.2离散化位置更新3.3目标函数适配4.实验设计与性能分析4.1实验设置4.2结果分析4.3敏感性分析5.结论与展望
【机器学习笔记 Ⅱ】11 决策树模型巴伦是只猫机器学习机器学习笔记决策树
决策树模型（DecisionTree）详解决策树是一种树形结构的监督学习模型，通过一系列规则对数据进行分类或回归。其核心思想是模仿人类决策过程，通过不断提问（基于特征划分）逐步逼近答案。1.核心概念节点类型：根节点：起始问题（最佳特征划分点）。内部节点：中间决策步骤（特征判断）。叶节点：最终预测结果（类别或数值）。分支：对应特征的取值或条件判断（如“年龄≥30？”）。2.构建决策树的关键步骤(1)
【机器学习笔记 Ⅱ】10 完整周期
机器学习的完整生命周期（End-to-EndPipeline）机器学习的完整周期涵盖从问题定义到模型部署的全过程，以下是系统化的步骤分解和关键要点：1.问题定义（ProblemDefinition）目标：明确业务需求与机器学习任务的匹配性。关键问题：这是分类、回归、聚类还是强化学习问题？成功的标准是什么？（如准确率>90%、降低10%成本）输出：项目目标文档（含评估指标）。2.数据收集（DataC
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本