小酒馆燃着灯

第八章集成学习

文章目录

- 一集成学习概述
- - 1.1 学习器
  - 1.2 概述与优势
  - 1.3 增强基学习器多样性常用方法
- 二偏差（Bias）和方差（Variance）
- 三 Bagging(套袋法)
- - 3.1 简述
  - 3.2 训练过程
  - 3.3 预测过程
- 四随机森林(Random Forest)
- - 4.1 简述
  - 4.2 RF算法推广
  - 4.3 额外树(Extra Tree)
  - 4.4 完全随机树嵌入(TRTE)
  - 4.5 孤立森林(Isolation Forest)
  - 4.6 RF随机森林总结
  - 4.7 思考引入下文
- 五提升学习(Boosting)
- - 5.1 简述
  - 5.2 自适应增强（Adaboost）
  - - 5.2.1 原理
    - 5.3.2 AdaBoost与LR的关系
    - 5.3.3 算法推导
    - - 5.3.3.1 求解权重系数
      - 5.3.3.2 算法构建
    - 5.3.4 算法示例
    - 5.4.5 总结
  - 5.3 梯度提升决策树**(**GBDT)
  - - 5.3.1 简述
    - 5.3.2 算法原理
    - 5.3.3 GBDT回归算法和分类算法
    - 5.3.4 总结
- 六 Bagging、Boosting的区别
- 七极致梯度提升（eXtreme Gradient Boosting，XGBoost）
- - 7.1 简述
  - 7.2 算法推导
  - 7.3 学习策略
  - 7.4 树节点分裂方法
  - 7.5 XGBoost的其它特性
- 八堆叠(Stacking)
- - 8.1 基学习器与元学习器
  - 8.2 简述
  - 8.3 原理
  - 8.4 训练阶段
  - 8.5 预测阶段
  - 8.6 原理
  - 8.7 训练阶段
  - 8.8 预测阶段

经典机器学习系列之【集成学习】 - 知乎 (zhihu.com)
(46条消息) 集成学习(ensemble learning)原理详解_Soyoger的博客-CSDN博客
(46条消息) 集成学习-Bagging原理与实现西瓜书_西瓜书bagging_BIT_666的博客-CSDN博客
AdaBoost算法 - 知乎 (zhihu.com)
GBDT(梯度提升决策树)——来由、原理和python实现 - 知乎 (zhihu.com)
机器学习梯度提升算法的温和介绍 - MachineLearningMastery.com
GBDT的原理、公式推导、Python实现、可视化和应用 - 知乎 (zhihu.com)
XGBoost的原理、公式推导、Python实现和应用 - 知乎 (zhihu.com)
(47条消息) 一文读懂 Bias（偏差）、Error（误差）、Variance（方差）_bias偏差_Suprit的博客-CSDN博客

一集成学习概述

1.1 学习器

弱分类器(weak learner)指那些分类准确率只稍微好于随机猜测的分类器(error rate < 0.5)，常见的弱学习器包括决策树、朴素贝叶斯分类器、支持向量机等

**预测准确率较低：**弱学习器的预测结果可能比随机猜测稍好一些，但通常不能达到高准确率

**可用于组合：**虽然单个弱学习器的预测能力有限，但可以通过组合多个弱学习器来提高整体预测准确率

**训练速度较快：**弱学习器通常具有较简单的结构和较少的参数，因此训练速度较快

强学习器（Strong Learner）是指在机器学习中，具有较高预测能力的学习算法或模型。与弱学习器相比，强学习器的预测准确率更高，能够提供更可靠的预测结果，常见的强学习器包括神经网络、深度学习模型、支持向量机等

**高预测准确率：**强学习器能够在训练数据和测试数据上都获得较高的预测准确率

**复杂模型：**强学习器通常具有复杂的结构和较多的参数，能够更好地拟合训练数据的特征

**训练速度较慢：**由于模型的复杂性，强学习器的训练过程可能需要更长的时间

同质集成中，个体学习器由相同的学习算法生成，个体学习器称为基学习器
异质集成中，个体学习器由不同的学习算法生成，个体学习器称为组件学习器

1.2 概述与优势

集成学习的思想是将若干个学习器(分类器&回归器)组合之后产生一个新学习器

集成算法的成功在于保证弱分类器的多样性(Diversity)。而且集成不稳定的算法也能够得到一个比较明显的性能提升

常见的集成学习思想有：

Bagging(套袋法)

Boosting(提升)

Stacking(堆叠)

集成学习器性能要好于单个个体学习器需要满足好而不同的两点要求：

个体学习器要好于随机猜测的结果

个体学习器要相互独立

第一个条件相对来说比较容易实现，在当前问题下训练一个模型，结果比瞎猜的结果好就行了

第二个条件是集成学习研究的核心问题。每个个体学习器学习的都是同一个问题，所以个体学习器不可能做到完全相互独立。下一小节我们具体阐述如何提高个体学习器的多样性

优势：

弱分类器间存在一定的差异性，这会导致分类的边界不同，也就是说可能存在错
误。那么将多个弱分类器合并后，就可以得到更加合理的边界，减少整体的错误率，
实现更好的效果

对于数据集过大或者过小，可以分别进行划分和有放回的操作产生不同的数据子
集，然后使用数据子集训练不同的分类器，最终再合并成为一个大的分类器

如果数据的划分边界过于复杂，使用线性模型很难描述情况，那么可以训练多个
模型，然后再进行模型的融合

对于多个异构的特征集的时候，很难进行融合，那么可以考虑每个数据集构建一
个分类模型，然后将多个模型融合

异构的特征集指的是在机器学习任务中，输入数据中包含不同类型或不同表示形式的特征。这些特征可能来自于不同的数据源、具有不同的数据类型或表示方式

1.3 增强基学习器多样性常用方法

想要在个体学习器足够好的前提下，增强其多样性，好而不同解决，我们可以直观上来想象一下。整个的算法学习过程是从数据到模型再到输出

首先考虑输入。如果每个学习器学习不同的样本，那么可以学习出相对来说不同的个体学习器。那么现在的问题就是怎么划分训练样本，你可以随机抽取，或者利用不同的属性子集训练出不同的个体学习器

其次考虑模型，如果基学习器的模型不一样，也能训练出不同的个体学习器

最后考虑输出，如果我们依据标签的特性来进行划分，也能得到不同的个体学习器

训练样本扰动：

从原始训练样本中产生不同的样本子集，然后利用不同的样本子集训练不同的个体学习器。如Bagging中使用的自助采样，Boosting中使用的序列采样

这种训练样本扰动的方法简单高效，但只对不稳定的基学习器有效，像**决策树、神经网络等；对于稳定的基学习器**，如线性学习器、支持向量机、朴素贝叶斯、K-NN等，就效果不明显，产生这个问题的原因就是因为稳定的基学习器，“变通能力”并不是很强

输入属性扰动：

RF算法解释:

RF在以**决策树为基学习器构建Bagging集成的基础上，进一步在决策树的训练过程中引入随机属性。传统决策树在选择划分属性时是在当前结点的属性集合中选择一个最优属性**；而在RF中，对基决策树的每个结点，先从该结点的属性集合中随机选择一个包含n个属性的子集，然后再从这个子集中选择一个最优属性用于划分。

随机森林中基学习器多样性不仅来自样本扰动，还来自属性扰动，使得最终集成的泛化性能可通过个体学习器之间差异度的增加而进一步提升。

但这类输入属性扰动的方法只对大量冗余属性的数据集有效，但若数据集只包含少量属性，或者冗余属性很少，则不宜使用。随机森林由于起始引入了属性扰动，性能会比Bagging差一点，但随着个体数量增多，随机森林通常会收敛到更低的泛化误差算法参数扰动：

算法参数扰动：

算法参数扰动指的是通过随机设置不同的参数来训练差别较大的个体学习器

输出标记扰动：

输出标记扰动是对训练样本的类别标记稍作变动，将原来的多分类问题随机转化多个二分类问题来训练基学习器

混合扰动：

混合扰动在同一个集成算法中同时使用上述多种扰动方法。比如随机森林就同时使用了训练样本扰动和输入属性扰动

二偏差（Bias）和方差（Variance）

偏差（Bias）和方差（Variance）是统计学和机器学习中两个重要的概念，它们描述了模型的预测误差来源

偏差是指模型的预测值与真实值之间的差异，即模型的预测能力的偏离程度。如果模型的偏差较大，说明模型对真实数据的特征没有很好地捕捉到，可能出现欠拟合的情况。偏差较大的模型通常会产生一致的错误，无论输入的数据如何变化，都会偏离真实值

方差是指模型的预测值在不同训练数据集上的变化程度，即模型的预测能力的波动程度。如果模型的方差较大，说明模型对训练数据过于敏感，可能出现过拟合的情况。方差较大的模型在不同的训练数据上可能会产生不一致的错误，即在不同的数据集上表现不稳定

偏差和方差之间存在一种权衡关系，这就是“棒性”（Robustness）。在理想情况下，我们希望模型既能够对训练数据有较低的偏差，又能够对不同的训练数据有较低的方差，以实现较好的泛化能力。然而，在实际应用中，偏差和方差通常是相互制约的，减小偏差可能会增加方差，减小方差可能会增加偏差。因此，需要在偏差和方差之间进行平衡，以找到最优的模型

解决偏差和方差问题的方法包括增加模型复杂度、增加训练数据量、使用正则化等。通过调整这些因素，可以使模型在偏差和方差之间取得合适的平衡，从而提高模型的预测能力和泛化能力。

鲁棒性（Robustness）是指模型对于异常值、噪声或其他干扰因素的抵抗能力。一个鲁棒性较好的模型能够在面对这些干扰时保持较好的性能和稳定性

提高模型的鲁棒性可以通过以下方法来实现：

数据清洗：识别和处理异常值和噪声，以减少对模型的干扰

特征选择：选择具有较好鲁棒性的特征，避免过度依赖噪声或不相关的特征

模型选择：选择对异常值和噪声具有较好鲁棒性的模型，如支持向量机（SVM）和决策树

集成学习：通过组合多个模型的预测结果，可以减少对单个模型的依赖，提高整体的鲁棒性

正则化：通过引入正则化项，可以减少模型对噪声的过度拟合

交叉验证：使用交叉验证来评估模型的鲁棒性，通过在不同的数据子集上进行训练和验证，可以检测模型在不同数据分布下的性能

总结：

low bias and low variance：又准又稳

low bias and high variance：准但不稳

high bias and low variance：不准但稳

high bias and high variance：不准又不稳

三 Bagging(套袋法)

3.1 简述

Bagging方法又叫做自举汇聚法(Bootstrap Aggregating)，思想是：在原始数据集上通过有放回的抽样的方式，重新选择出S个新数据集来分别训练S个分类器的集成技术。大部分情况下，经过 bagging 得到的结果方差（variance）更小

基学习器：

Bagging方法的弱学习器可以是基本的算法模型，eg: Linear、Ridge、Lasso、
Logistic、Softmax、ID3、C4.5、CART、SVM、KNN等

效果评估：

Bagging方法训练出来的模型在预测新样本分类/回归的时候，会使用多数投票或者求均
值的方式来统计最终的分类/回归结果

Bagging方式是有放回的抽样，并且每个子集的样本数量必须和原始样本数量一致，所以抽取出来的子集中是存在重复数据的，模型训练的时候允许存在重复数据

差不多有1/3的样本数据是不在Bagging的每个子模型的训练数据中的

$\lim_{m\to\infty}\bigg(1-\frac{1}{m}\bigg)^{m}=\frac{1}{e}\approx0.368$

3.2 训练过程

3.3 预测过程

四随机森林(Random Forest)

4.1 简述

在Bagging策略的基础上进行修改后的一种算法。随机森林，特征选择保证了样本间的差异性，具体过程如下:

从原始样本集(n个样本)中用Bootstrap采样(有放回重采样)选出n个样本

使用抽取出来的子数据集(存在重复数据)来训练决策树；从所有属性中随机选择K

个属性，从K个属性中选择出最佳分割属性作为当前节点的划分属性，按照这种方式

来迭代的创建决策树

重复以上两步m次，即建立m棵决策树

这m个决策树形成随机森林，通过投票表决结果决定数据属于那一类

对于分类问题，采用投票的方法，得票最多子模型的分类类别为最终的类别；对于回归问题，采用简单的平均方法得到预测值

图解：

4.2 RF算法推广

RF算法在实际应用中具有比较好的特性，应用也比较广泛，主要应用在：分类、回归、特征转换、异常点检测等。常见的RF变种算法如下：

额外树(Extra Tree)，分类-回归

完全随机树嵌入(Totally Random Trees Embedding(TRTE))，特征转换

孤立森林(Isolation Forest)，异常点检测

4.3 额外树(Extra Tree)

4.4 完全随机树嵌入(TRTE)

4.5 孤立森林(Isolation Forest)

4.6 RF随机森林总结

RF的主要优点：

训练可以并行化，对于大规模样本的训练具有速度的优势

由于进行随机选择决策树划分特征列表，这样在样本维度比较高的时候，仍然具有比较高的训练性能

给以给出各个特征的重要性列表

由于存在随机抽样，训练出来的模型方差小，泛化能力强，能够缓解过拟合的情况

RF实现简单

对于部分特征的缺失不敏感

RF的主要缺点：

在某些噪音比较大的特征上（数据特别异常情况），RF模型容易陷入过拟合

取值比较多的划分特征对RF的决策会产生更大的影响，从而有可能影响模型的效果

4.7 思考引入下文

在随机森林的构建过程中，由于各棵树之间是没有关系的，相对独立的；在构建的过程中，构建第m棵子树的时候，不会考虑前面的m-1棵树
思考：

如果在构建第m棵子树的时候，考虑到前m-1棵子树的结果，会不会对最终结果产生有益的影响？

各个决策树组成随机森林后，在形成最终结果的时候能不能给定一种既定的决策顺序呢？(也就是那颗子树先进行决策、那颗子树后进行决策)

五提升学习(Boosting)

5.1 简述

提升学习（Boosting）是一种机器学习技术，可以用于回归和分类的问题，它每一步产生弱预测模型(如决策树)，并加权累加到总模型中；如果每一步的弱预测模型的生成都是依据损失函数的梯度方式的，那么就称为梯度提升(Gradient boosting)

提升技术的意义：如果一个问题存在弱预测模型，那么可以通过提升技术的办法得到一个强预测模型

学习过程：

常见的模型有：

自适应增强（Adaptive Boosting，Adaboost）

梯度提升决策树(Gradient Boosting Decision Tree，GBDT)

5.2 自适应增强（Adaboost）

5.2.1 原理

AdaBoost这个方法， 比较迷人的地方就在于训练数据集误差率降为0之后，依然能继续降低测试误差，看起来，似乎不会过拟合。Schapire给出的解释主要是基于间隔理论，但是， AdaBoost的间隔和SVM的间隔是不一样的

间隔包含了分类正确性与确信度的含义

关于AdaBoost的间隔理论， Schapire在1998年提出之后，受到过质疑，周志华老师在这个问题上给出了解释，并说明了当间隔分布无法继续提升的时候， 过拟合终将发生

统计学习方法之间的不同，主要来自器模型、策略、算法的不同。确定了模型、策略、算法，统计学习的方法也就确定了。这也就是将其称为统计学习三要素的原因

再结构化一下这三个部分，好好理解：

模型：需要学习的条件概率分布或者决策函数

策略：按照什么样的准则学习或选择最优的模型。统计学习的目标在于从假设空间中选取最优模型。

经验风险最小化( $R_{emp}$ )

结构风险最小化( $R_{srm}$ )

算法：考虑用什么样的方法求解最优模型，这时统计学习问题归结为最优化问题，统计学习方法的算法称为求解最优化问题的算法

提升方法实际采用加法模型（即基函数的线性组合）与前向分步算法

不同的问题，主要区别在于损失函数不同：

平方误差用于回归问题

指数损失用于分类问题

5.3.2 AdaBoost与LR的关系

AdaBoost的两个性质：

能在学习过程中不断减少训练误差

训练误差是以指数速率下降的

AdaBoost算法的核心思想就是调整错误样本的权重，进而迭代升级

Adaptive Boosting是一种迭代算法。每轮迭代中会在训练集上产生一个新的学习器，然后使用该学习器对所有训练样本进行预测，以评估每个样本的重要性(Informative)。换句话来讲就是，算法/子模型会为每个样本赋予一个权重，每次用训练好的学习器标注/预测各个样本(训练数据)，如果某个样本点被预测的越正确，则将样本权重降低；否则提高样本的权重。权重越高的样本在下一个迭代训练中所占的权重就越大，也就是说越难区分的样本在训练过程中会变得越重要

整个迭代过程直到错误率足够小或者达到一定的迭代次数为止

权重解释：

5.3.3 算法推导

5.3.3.1 求解权重系数

5.3.3.2 算法构建

什么是加法模型：

同样的数据集T，配合不同的权值分布，拿到不同的基分类器G

误差率的定义将权值系数分布与基分类器的结果联系在了一起

权值分布D的宽度代表分类器的误差率相对大小

G的宽度代表最终模型中该分类器对应的系数大小

在模型的最终表示中有个 $\sum$

AdaBoost分类算法的流程图:

算法过程：

5.3.4 算法示例

5.4.5 总结

优点：

可以处理连续值和离散值

模型的鲁棒性比较强

解释强，结构简单

可以使用各种回归分类模型来构建弱学习器，非常灵活

缺点：

对异常样本敏感，异常样本可能会在迭代过程中获得较高的权重值，最终影响模型效果

5.3 梯度提升决策树(GBDT)

5.3.1 简述

GBDT由三部分构成：DT(Regression Decistion Tree)、GB(Gradient Boosting)和Shrinkage(衰减)

GBDT也是Boosting算法的一种，但是和AdaBoost算法不同，区别如下：

AdaBoost算法是利用前一轮的弱学习器的误差来更新样本权重值，然后一轮一轮的迭代；GBDT也是迭代，但是GBDT要求弱学习器必须是回归CART模型，而且GBDT在模型训练的时候，是要求模型预测的样本损失尽可能的小

直观理解：

所有GBDT算法中，底层都是回归树

迭代决策树和随机森林的区别：

随机森林使用抽取不同的样本构建不同的子树，也就是说第m棵树的构建和前m-1棵树的结果是没有关系的

迭代决策树在构建子树的时候，使用之前子树构建结果后形成的残差作为输入数据构建下一个子树；然后最终预测的时候按照子树构建的顺序进行预测，并将预测结果相加

5.3.2 算法原理

解释为什么出现了负梯度：

利用泰勒展开，得到前后两个之差，要保证之差大于零，所以可令等于负梯度，进而保证为正，逐步逼近正确值

5.3.3 GBDT回归算法和分类算法

5.3.4 总结

优点：

可以处理连续值和离散值

适合低维数据

在相对少的调参情况下，模型的预测效果也会不错

模型的鲁棒性比较强

缺点：由于弱学习器之间存在关联关系，难以并行训练模型；数据维度较高会加大算法的计算复杂度

六 Bagging、Boosting的区别

样本选择：Bagging算法是有放回的随机采样；Boosting算法是每一轮训练集不变，只是训练集中的每个样例在分类器中的权重发生变化或者目标属性y发生变化，而权重&y值都是根据上一轮的预测结果进行调整

样例权重：Bagging随机抽样，样例等权重；Boosting根据错误率调整样例的权重，错误率越大则权重越大

预测函数：Bagging所有预测模型的权重相等；Boosting算法对于误差小的分类器具有更大的权重

并行计算：Bagging算法并行生成各个基模型；Boosting只能顺序生产，后一个模型需要前一个模型的结果

Bagging是减少模型的variance(方差)；Boosting是减少模型的Bias(偏度)

Bagging里每个分类模型都是强分类器，因为降低的是方差，方差过高需要降低是过拟合；Boosting里每个分类模型都是弱分类器，因为降低的是偏度，偏度过高是欠拟合

七极致梯度提升（eXtreme Gradient Boosting，XGBoost）

7.1 简述

XGBoost（eXtreme Gradient Boosting）极致梯度提升，是一种基于GBDT的算法。一些优化，比如：

利用泰勒展开，二阶导数使损失函数更精准

正则项避免树过拟合，简化模型

Block存储可以并行计算

7.2 算法推导

上课记录：

w表示cart树，x进入cart进入到那个叶子，在判断叶子结果

惩罚项，超参数，叶子数，对叶子节点的数值进行惩罚，mean求每个叶子节点均值作为预测结果，15分类不同，得到的惩罚不同，使数更加稳定

先对每个叶子求和，再对叶子求和

树的结构确定，q函数就确定了

决策树每个叶子的纯度越小越好，MSE

7.3 学习策略

7.4 树节点分裂方法

**精确算法：**遍历所有特征的所有可能的分割点，计算gain值，选择最大的gain值对应的(feature,value)进行分割

近似算法：对于每个特征，只考虑分位点，减少计算复杂度

案例：

7.5 XGBoost的其它特性

列采样(column subsampling)：借鉴随机森林的做法，支持列抽样，不仅可以降低过拟合，还可以减少计算量

支持对缺失值的自动处理。对于特征的值有缺失的样本，XGBoost可以自动学习分裂方向

XGBoost支持并行。XGBoost的并行是特征粒度上的，在计算特征的Gain的时候，会并行执行，但是在树的构建过程中，还是串行构建的

XGBoost算法中加入正则项，用于控制模型的复杂度，最终模型更加不容易过拟合

XGBoost基学习器支持CART、线性回归、逻辑回归

XGBoost支持自定义损失函数(要求损失函数二阶可导)；分类，对数损失；回归，最小二乘

八堆叠(Stacking)

8.1 基学习器与元学习器

基学习器与元学习器：

基学习器是指用于解决具体学习任务的机器学习算法，它可以从训练数据中学习出一个模型，然后用于预测或分类新的数据。基学习器的选择和设计对于学习任务的性能至关重要，常见的基学习器包括决策树、支持向量机、神经网络等

元学习器是指用于学习如何选择和组合基学习器的机器学习算法。它通过对多个基学习器的性能和特征进行学习，来决定如何将这些基学习器集成为一个更强大的学习器。元学习器的目标是自动地学习出一种学习策略，使得在不同的学习任务上能够快速、准确地选择和组合合适的基学习器

总之，基学习器和元学习器是机器学习中两个重要的概念。基学习器用于解决具体的学习任务，而元学习器用于学习如何选择和组合基学习器，以提高学习任务的性能。两者相互配合可以构建出更强大和灵活的学习系统

8.2 简述

Stacking(有时候也称之为stacked generalization)是指训练一个模型用于组合(combine)其他各个模型。即首先我们先训练多个不同的模型，然后再以之前训练的各个模型的输出为输入来训练一个模型，以得到一个最终的输出

如果可以选用任意一个组合算法，那么理论上，Stacking可以表示前面提到的各种Ensemble方法。然而，实际中，我们通常使用单层logistic回归作为组合模型

注意：Stacking有两层，一层是不同的基学习器（classifiers/regressors），第二个是用于组合基学习器的元学习器（meta_classifier/meta_regressor）

8.3 原理

8.4 训练阶段

8.5 预测阶段

得到一个最终的输出

如果可以选用任意一个组合算法，那么理论上，Stacking可以表示前面提到的各种Ensemble方法。然而，实际中，我们通常使用单层logistic回归作为组合模型

注意：Stacking有两层，一层是不同的基学习器（classifiers/regressors），第二个是用于组合基学习器的元学习器（meta_classifier/meta_regressor）

8.6 原理

8.7 训练阶段

8.8 预测阶段

你可能感兴趣的:(车道线检测,深度学习,手写AI,集成学习,机器学习,人工智能)

AI人工智能代理工作流AI Agent WorkFlow：面向服务计算中的代理工作流管理 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能代理工作流AIAgentWorkFlow：面向服务计算中的代理工作流管理关键词：人工智能，代理工作流，服务计算，自动执行，智能调度，协同处理，流程管理1.背景介绍1.1问题的由来随着互联网和云计算的快速发展，服务计算作为一种分布式计算模式，已经成为企业信息化建设的重要方向。在服务计算中，工作流技术被广泛应用于业务流程的建模、执行和管理。然而，传统的基于BPM（业务流程管理）的工作流管理
Spring AI 在微服务中的应用：支持分布式 AI 推理 drebander AI 编程 springAI
1.引言在现代企业中，微服务架构已成为开发复杂系统的主流方式，而AI模型推理也越来越多地被集成到业务流程中。如何在分布式微服务架构下高效地集成SpringAI，使多个服务可以协同完成AI任务，并支持分布式AI推理，是企业面临的关键挑战。本篇文章将探讨：在微服务架构中如何部署SpringAI服务；如何通过分布式AI推理提高推理性能与扩展性；典型应用场景，如电商推荐、智能客服、实时分析等。2.Spri
Apple M1 ARM MacBook 安装 Apache TVM FF-Studio arm开发 apache
一、前置准备AppleSiliconMacBook本文以AppleM1/M2为例，M3及后续版本同理。已安装HomebrewmacOS上的包管理器，可前往Homebrew官网查看安装指引。已安装Anaconda或Miniforge确保Conda是ARM版本（通过condainfo|grepplatform验证应为osx-arm64）。二、创建并激活Conda环境在终端创建环境（Python3.8为
Deepseek的api调用报错乱码问题 2301_78002904 AI编程
最近的deepseek也是很火，但是在调用api的过程中也会出现一些大大小小的问题，所以这里也给出一种问题和他的解决方案，报错的类型如下图所示APIStreamingFailedCommandfailedwithexitcode1:powershell(Get-CimInstance-ClassNameWin32_OperatingSystem).caption'powershell'��ڲ
2025年美赛数学建模 MCM Problem B: Managing Sustainable Tourism 问题 B：可持续旅游管理思路+代码解析【第一问】一键难忘付费专栏数学建模 2025美赛 2025年美赛数学建模可持续旅游管理
本文为个人解题笔记，仅供参考学习。本文B题的第一问。其他问题均在本专栏内，订阅一次，全部可见。本文为个人解题笔记，仅供参考学习。第一小问【为阿拉斯加州朱诺建⽴⼀个可持续旅游业模型。】BuildamodelforasustainabletourismindustryinJuneau,Alaska.Youmaywanttoconsiderfactorssuchasthenumberofvisitors
【Python进阶】Python中的电子邮件处理：SMTP、IMAP和MIME m 哆哆.ღ python python 服务器网络
1、电子邮件概述1.1电子邮件的工作原理1.1.1邮件服务器与客户端电子邮件的运作基于客户端-服务器架构，用户通常通过邮件客户端软件（如Outlook、Thunderbird等）或者网页版邮件服务（如Gmail、YahooMail等）撰写、发送和接收邮件。邮件客户端负责与邮件服务器进行通信，邮件服务器则承担着存储、转发和管理邮件的任务。当用户编写一封电子邮件后，邮件首先被客户端软件打包并通过SMT
c语言可变参数,C 可变参数详解 weixin_39710003 c语言可变参数
所谓可变参数又称参数个数可变函数，即函数参数数目可变，我想你也会经常遇到一个问题就是你想要一个可变数量的参数，不是就指定的函数，那c语言中的可变参数就能发挥作用了。就像我前面说的，c可变参数就是能改变参数个数的。原型声明格式为：typeVarArgFunc(typeFixedArg1,typeFixedArg2,…);我们来一个例子来练习：intfunc(int,...){...}intmain(
github最强Chatbox AI 模型桌面，支持 ChatGPT、Claude等主流模型，适用于 Win、Linux等，总结文档图片并互动，智能编程，AI实时联网搜索与查询，图片生成，科研写作等 struggle2025 人工智能深度学习语音识别计算机视觉语言模型图像处理数据分析
一、软件介绍（文末提供下载）Chatbox是一个AI模型桌面客户端，支持ChatGPT、Claude、GoogleGemini、Ollama等主流模型，适用于Windows、Mac、Linux、Web、Android和iOS全平台。github地址：GitHub-Bin-Huang/chatbox:User-friendlyDesktopClientAppforAIModels/LLMs(GPT,
pycharm、anaconda安装tensorflow问题努力的南波万 pycharm tensorflow neo4j
(pythonconda01)C:\Users\lvd13>condainstalltensorflowChannels:-defaultsPlatform:win-64Collectingpackagemetadata(repodata.json):doneSolvingenvironment:|warninglibmambaAddedemptydependencyforproblemtypeS
2025年美赛数学建模 MCM Problem B: Managing Sustainable Tourism 问题 B：可持续旅游管理代码解析 2025年数学建模美赛 2025年美赛MCM/ICM 数学建模旅游 2025美赛 2025年数学建模美赛 python代码 matlab 可持续旅游管理
目录代码框架：遗传算法优化可持续旅游模型python代码代码解析：matlab代码代码解析：代码框架：遗传算法优化可持续旅游模型python代码importnumpyasnpimportrandomimportmatplotlib.pyplotasplt#定义遗传算法的参数POP_SIZE=100#种群大小GENS=500#迭代代数MUTATION_RATE=0.01#变异率CROSSOVER_R
uniapp 自定义图片预览组件PicturePreview（Vue3、组合式、ts）舍予一前端知识汇总 uni-app javascript 前端
组件import{ref}from'vue';constimages=ref>([]);constcurrentIndex=ref(0);constshow=ref(false);constscale=ref(1);functiononSwiperChange(e:any){scale.value=1;currentIndex.value=e.detail.current;}constonScal
《C++ 并发编程指南》：开启并发编程新篇章孔秋宗Mora
《C++并发编程指南》：开启并发编程新篇章Cplusplus-Concurrency-In-PracticeADetailedCplusplusConcurrencyTutorial《C++并发编程指南》项目地址:https://gitcode.com/gh_mirrors/cp/Cplusplus-Concurrency-In-Practice项目介绍《C++并发编程指南》是一本开源书籍，旨在为
python 操作sqlite COSummer python python sqlite
importsqlite3if__name__=='__main__':cx=sqlite3.connect("C:/Users/503061752/Desktop/AutoTest.sdb")cu=cx.cursor()cu.execute("select*fromwaiting_time")res=cu.fetchall()forcurresinres:print(curres)以上代码实现的
2025年01月30日Github流行趋势油泼辣子多加 GitHub每日趋势 github
项目名称：Janus项目地址url：https://github.com/deepseek-ai/Janus项目语言：Python历史star数：11942今日star数：2187项目维护者：learningpro,hills-code,TheOneTrueGuy,mowentian,soloice项目简介：Janus系列：统一多模态理解和生成模型项目名称：DeepSeek-Coder项目地址ur
快手NS sig3签名算法（2025年1月） sh_moranliunian 蜘蛛侠网络爬虫后端 python 爬虫算法
kuaishou/__NS_sig3.js源码见文章最后。python中调用示例importjsonimportsysimportrequestsimportosimportexecjsimporthashlibimportdatetimefromCookieUtilimportCookieUtilfromfake_useragentimportUserAgentnormal_js=execjs.
【mdadm】开机自动挂载raid（systemctl方式）名栩家庭存储存储 mdadm RAID
背景之前采用了网络上常见的/etc/fstab开机挂载raid，突然有一天RAID出现问题，导致系统无法开机。解决方案为了避免这个问题，我采用了等待系统启动完毕后再加载的方式。脚本是一个systemd服务单元文件，用于在启动时挂载一个RAID设备，并在关机时卸载它sudovim/etc/systemd/system/raid-mount.service输入内容[Unit]Description=M
axios 常见的content-type、responseType有哪些？梦境之冢前端开发实战问题解决前端 http javascript
一、ContentType'ContentType'，也被称为MIME类型（MultipurposeInternetMailExtensions），是一种用于标识数据格式的机制。在HTTP协议中，'ContentType’通常通过请求或响应头部的’Content-Type’字段来指定。这个字段的值是一个字符串，用于描述消息体的媒体类型，如文本、图像、音频、视频等，以及可能的字符集和编码方式。当客户
.NET MAUI 项目教程瞿格女
.NETMAUI项目教程docs-mauiThisrepositorycontainsdocumentationfor.NETMulti-platformAppUI(MAUI).项目地址:https://gitcode.com/gh_mirrors/do/docs-maui1.项目介绍什么是.NETMAUI？.NETMulti-platformAppUI(.NETMAUI)是一个跨平台的UI框架，
记录一个Jetbrains家族的IDE的Terminal环境变量问题互联网速递520 ide
问题描述在JetBrains家族的IDE的Terminal中，定义环境变量A的时候，无法引用环境变量B，否则会导致打开Terminal的时候环境变量失效，比如：FOO=C:\binPATH=%FOO%;%PATH%打开终端之后，PATH环境变量会彻底无效，并不能展开系统原来的PATH环境变量并在其前面添加C:\bin问题追踪咱也是做软件的，想来想去这个功能实现也不复杂，打开终端之前，取得所有环境变
OpenAI 函数调用功能入门 AI火箭 chatgpt openai
Javascript版Langchain入门作者：AI小火箭的HB我是AI小火箭的HB，我探索和写作人工智能和语言交叉点的所有事物，范围从LLM，聊天机器人，语音机器人，开发框架，以数据为中心的潜在空间等。介绍LangChain是一个开源Python库，用于构建由大型语言模型（LLM）支持的应用程序。它提供了一个框架，将LLM与其他数据源（如互联网或个人文件）连接起来，允许开发人员将多个命令链接在
Deepseek 对种猪市场会带来哪些影响？百态老人笔记大数据人工智能
DeepSeek对种猪市场的影响可以从以下几个方面进行分析：1.提高生产效率与降低成本根据，DeepSeek已经被用于养猪场中分析饲料配比，从而将猪的育肥周期从6个月缩短至5个月，并降低了15%的成本。这表明DeepSeek在优化养殖流程和提高生产效率方面具有显著作用，能够帮助养猪场降低运营成本，提升经济效益。2.推动智能化养殖技术的应用和提到，深度学习技术（如YOLOv5模型）已经被应用于生猪的
Python 库的记录 weixin_40895135 python
GitHub-jobbole/awesome-python-cn:Python资源大全中文版，内容包括：Web框架、网络爬虫、网络内容提取、模板引擎、数据库、数据可视化、图片处理、文本处理、自然语言处理、机器学习、日志、代码分析等环境管理管理Python版本和环境的工具p–非常简单的交互式python版本管理工具。pyenv–简单的Python版本管理工具。Vex–可以在虚拟环境中执行命令。vir
kotlin 深入学习爱水的云开发分享 java servlet android
一、进阶用法解构解构:解构指的是将对象的多个属性分别赋值给多个变量的过程funmain(args:Array){valuser=User(12,"name")val(age,name)=userprintln(age)println(name)}classUser(varage:Int,varname:String){operatorfuncomponent1()=ageoperatorfunco
如何获取 DeepSeek 多模态大模型 Janus-Pro-7B Channing Lewis AI #AGI #NLP deepseek
DeepSeek团队近期开源了新一代多模态模型Janus-Pro-7B，该模型在图像生成和多模态理解方面表现卓越，超越了OpenAI的DALL-E3，并在基准测试中取得了优异成绩。Janus-Pro-7B的代码和模型参数已经分别在github和huggingface上开源，我们拉取到本地后就能运行使用了。以下是如何获取Janus-Pro-7B模型的详细指南：步骤一：克隆代码库gitclonehtt
Ikigai是什么 Channing Lewis 社会生活日本
Ikigai（生き甲斐）是一个日语词语，意思是“生活的意义”或“生命的价值所在”。它是一种关于人生意义的哲学概念，源自日本文化，强调通过找到自己热爱、擅长、社会需要以及能带来经济回报的交集来实现幸福和满足感。Ikigai的四个关键元素Ikigai通常以一个四重交叉的图表示，包括以下四个部分：你热爱的事（WhatYouLove）你内心真正喜欢的事情，让你感到快乐和有热情。你擅长的事（WhatYouA
stream流-去重今天学点啥6 Java java 后端
针对基本数据类型集合publicclassDistinctDemo{ publicstaticvoidmain(String[]args){ ArrayListusers=newArrayListSystem.out.println(u)); }}针对对象集合根据对象中的某一个成员变量进行去重使用filter根据集合中对象的某个成员变量进行去重publicclassDis
iptables禁止访问1端口和80端口 13572025090 网络 linux 服务器 tcp/ip 运维
iptables-AINPUT-ptcp--dport1-jDROPiptables-AINPUT-ptcp--dport80-jDROP这是在Linux系统上使用iptables禁止访问1端口和80端口的命令。其中-AINPUT表示添加规则到INPUT链，-ptcp表示使用TCP协议，--dport表示目标端口，-jDROP表示将匹配的数据包直接丢弃。
Qt: QT图形绘制简介大白萝卜不紧张 qt qt 开发语言
1.QPainter描述：QPainter是Qt最常用的绘图类。它提供了一组丰富的功能来绘制各种形状、文本和图像。用途：适用于自定义绘制，比如在QWidget或QGraphicsView中绘制。功能：绘制基本图形（线条、矩形、圆形、多边形等）。绘制文本和图像。支持渐变、纹理和抗锯齿效果。2.QGraphicsView和QGraphicsScene描述：QGraphicsView是一个用于显示和管理
Invocation of init method failed； nested exception is java.sql.SQLException: com.mysql.cj.jdbc.Drive weixin_42277889 mysql java sql
代码更新后连不上数据库，前天都还可以，现在不行了，一直报错mysql没有。Pom文件全局搜也灭有。一开始是查不到的，但是实际上pom文件中引入了，maven没有更新。。。。
Qt绘制图像 MechMaster QT qt c++
Qt绘制图像1.例程代码2.四个常用的绘图设备2.1QImage2.2QPixmap2.3QBitmap2.4QPicture3.复合模式1.例程代码voidWidget::paintEvent(QPaintEvent*event){QPainterpainter;//绘制imageQImageimage(100,100,QImage::Format_ARGB32);painter.begin(&
微信开发者验证接口开发 362217990 微信开发者 token 验证
微信开发者接口验证。 Token，自己随便定义，与微信填写一致就可以了。根据微信接入指南描述 http://mp.weixin.qq.com/wiki/17/2d4265491f12608cd170a95559800f2d.html 第一步：填写服务器配置第二步：验证服务器地址的有效性第三步：依据接口文档实现业务逻辑这里主要讲第二步验证服务器有效性。建一个
一个小编程题-类似约瑟夫环问题 BrokenDreams 编程
今天群友出了一题：一个数列,把第一个元素删除,然后把第二个元素放到数列的最后,依次操作下去,直到把数列中所有的数都删除,要求依次打印出这个过程中删除的数。 &
linux复习笔记之bash shell (5) 关于减号-的作用 eksliang linux关于减号“-”的含义 linux关于减号“-”的用途 linux关于“-”的含义 linux关于减号的含义
转载请出自出处： http://eksliang.iteye.com/blog/2105677 管道命令在bash的连续处理程序中是相当重要的，尤其在使用到前一个命令的studout（标准输出）作为这次的stdin（标准输入）时，就显得太重要了，某些命令需要用到文件名，例如上篇文档的的切割命令（split）、还有
Unix(3) 18289753290 unix ksh
1)若该变量需要在其他子进程执行，则可用"$变量名称"或${变量}累加内容什么是子进程？在我目前这个shell情况下，去打开一个新的shell，新的那个shell就是子进程。一般状态下，父进程的自定义变量是无法在子进程内使用的，但通过export将变量变成环境变量后就能够在子进程里面应用了。 2)条件判断： &&代表and ||代表or&nbs
关于ListView中性能优化中图片加载问题酷的飞上天空 ListView
ListView的性能优化网上很多信息，但是涉及到异步加载图片问题就会出现问题。具体参看上篇文章http://314858770.iteye.com/admin/blogs/1217594 如果每次都重新inflate一个新的View出来肯定会造成性能损失严重，可能会出现listview滚动是很卡的情况，还会出现内存溢出。现在想出一个方法就是每次都添加一个标识，然后设置图
德国总理默多克：给国人的一堂“震撼教育”课永夜-极光教育
http://bbs.voc.com.cn/topic-2443617-1-1.html德国总理默多克：给国人的一堂“震撼教育”课　安吉拉—默克尔，一位经历过社会主义的东德人，她利用自己的博客，发表一番来华前的谈话，该说的话，都在上面说了，全世界想看想传播——去看看默克尔总理的博客吧！　　德国总理默克尔以她的低调、朴素、谦和、平易近人等品格给国人留下了深刻印象。她以实际行动为中国人上了一堂
关于Java继承的一个小问题。。。随便小屋 java
今天看Java 编程思想的时候遇见一个问题，运行的结果和自己想想的完全不一样。先把代码贴出来！ //CanFight接口 interface Canfight { void fight(); } //ActionCharacter类 class ActionCharacter { public void fight() { System.out.pr
23种基本的设计模式 aijuans 设计模式
Abstract Factory：提供一个创建一系列相关或相互依赖对象的接口，而无需指定它们具体的类。　　Adapter：将一个类的接口转换成客户希望的另外一个接口。A d a p t e r模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。　　Bridge：将抽象部分与它的实现部分分离，使它们都可以独立地变化。　　Builder：将一个复杂对象的构建与它的表示分离，使得同
《周鸿祎自述：我的互联网方法论》读书笔记 aoyouzi 读书笔记
从用户的角度来看,能解决问题的产品才是好产品,能方便/快速地解决问题的产品,就是一流产品. 商业模式不是赚钱模式一款产品免费获得海量用户后,它的边际成本趋于0,然后再通过广告或者增值服务的方式赚钱,实际上就是创造了新的价值链. 商业模式的基础是用户,木有用户,任何商业模式都是浮云.商业模式的核心是产品,本质是通过产品为用户创造价值. 商业模式还包括寻找需求
JavaScript动态改变样式访问技术百合不是茶 JavaScript style属性 ClassName属性
一:style属性格式: HTML元素.style.样式属性="值"; 创建菜单:在html标签中创建或者在head标签中用数组创建 <html> <head> <title>style改变样式</title> </head> &l
jQuery的deferred对象详解 bijian1013 jquery deferred对象
jQuery的开发速度很快，几乎每半年一个大版本，每两个月一个小版本。每个版本都会引入一些新功能，从jQuery 1.5.0版本开始引入的一个新功能----deferred对象。 &nb
淘宝开放平台TOP Bill_chen C++c 物流 C#
淘宝网开放平台首页：http://open.taobao.com/ 淘宝开放平台是淘宝TOP团队的产品，TOP即TaoBao Open Platform，是淘宝合作伙伴开发、发布、交易其服务的平台。支撑TOP的三条主线为： 1.开放数据和业务流程 * 以API数据形式开放商品、交易、物流等业务； &
【大型网站架构一】大型网站架构概述 bit1129 网站架构
大型互联网特点面对海量用户、海量数据大型互联网架构的关键指标高并发高性能高可用高可扩展性线性伸缩性安全性大型互联网技术要点前端优化 CDN缓存反向代理 KV缓存消息系统分布式存储 NoSQL数据库搜索监控安全想到的问题： 1.对于订单系统这种事务型系统，如
eclipse插件hibernate tools安装白糖_ Hibernate
eclipse helios(3.6)版 1.启动eclipse 2.选择 Help > Install New Software...> 3.添加如下地址： http://download.jboss.org/jbosstools/updates/stable/helios/ 4.选择性安装：hibernate tools在All Jboss tool
Jquery easyui Form表单提交注意事项 bozch jquery easyui
jquery easyui对表单的提交进行了封装，提交的方式采用的是ajax的方式，在开发的时候应该注意的事项如下： 1、在定义form标签的时候，要将method属性设置成post或者get，特别是进行大字段的文本信息提交的时候，要将method设置成post方式提交，否则页面会抛出跨域访问等异常。所以这个要
Trie tree(字典树)的Java实现及其应用-统计以某字符串为前缀的单词的数量 bylijinnan java实现
import java.util.LinkedList; public class CaseInsensitiveTrie { /** 字典树的Java实现。实现了插入、查询以及深度优先遍历。 Trie tree's java implementation.(Insert,Search,DFS) Problem Description Igna
html css 鼠标形状样式汇总 chenbowen00 html css
css鼠标手型cursor中hand与pointer Example：CSS鼠标手型效果 <a href="#" style="cursor:hand">CSS鼠标手型效果</a><br/> Example：CSS鼠标手型效果 <a href="#" style=&qu
[IT与投资]IT投资的几个原则 comsci it
无论是想在电商,软件,硬件还是互联网领域投资,都需要大量资金,虽然各个国家政府在媒体上都给予大家承诺,既要让市场的流动性宽松,又要保持经济的高速增长....但是,事实上,整个市场和社会对于真正的资金投入是非常渴望的,也就是说,表面上看起来,市场很活跃,但是投入的资金并不是很充足的......
oracle with语句详解 daizj oracle with with as
oracle with语句详解转在oracle中，select 查询语句，可以使用with,就是一个子查询，oracle 会把子查询的结果放到临时表中，可以反复使用例子:注意，这是sql语句，不是pl/sql语句，可以直接放到jdbc执行的 ----------------------------------------------------------------
hbase的简单操作 deng520159 数据库 hbase
近期公司用hbase来存储日志,然后再来分析 ,把hbase开发经常要用的命令找了出来. 用ssh登陆安装hbase那台linux后用hbase shell进行hbase命令控制台! 表的管理 1）查看有哪些表 hbase(main)> list 2）创建表 # 语法：create <table>, {NAME => <family&g
C语言scanf继续学习、算术运算符学习和逻辑运算符 dcj3sjt126com c
/* 2013年3月11日20:37:32 地点：北京潘家园功能：完成用户格式化输入多个值目的：学习scanf函数的使用 */ # include <stdio.h> int main(void) { int i, j, k; printf("please input three number:\n"); //提示用
2015越来越好 dcj3sjt126com 歌曲
越来越好房子大了电话小了感觉越来越好假期多了收入高了工作越来越好商品精了价格活了心情越来越好天更蓝了水更清了环境越来越好活得有奔头人会步步高想做到你要努力去做到幸福的笑容天天挂眉梢越来越好婆媳和了家庭暖了生活越来越好孩子高了懂事多了学习越来越好朋友多了心相通了大家越来越好道路宽了心气顺了日子越来越好活的有精神人就不显
java.sql.SQLException: Value '0000-00-00' can not be represented as java.sql.Tim feiteyizu mysql
数据表中有记录的time字段（属性为timestamp）其值为：“0000-00-00 00:00:00” 程序使用select 语句从中取数据时出现以下异常： java.sql.SQLException:Value '0000-00-00' can not be represented as java.sql.Date java.sql.SQLException: Valu
Ehcache（07）——Ehcache对并发的支持 234390216 并发 ehcache 锁 ReadLock WriteLock
Ehcache对并发的支持在高并发的情况下，使用Ehcache缓存时，由于并发的读与写，我们读的数据有可能是错误的，我们写的数据也有可能意外的被覆盖。所幸的是Ehcache为我们提供了针对于缓存元素Key的Read（读）、Write（写）锁。当一个线程获取了某一Key的Read锁之后，其它线程获取针对于同
mysql中blob,text字段的合成索引 jackyrong mysql
在mysql中，原来有一个叫合成索引的，可以提高blob,text字段的效率性能，但只能用在精确查询，核心是增加一个列，然后可以用md5进行散列，用散列值查找则速度快比如： create table abc(id varchar(10),context blog,hash_value varchar(40)); insert into abc(1,rep
逻辑运算与移位运算 latty 位运算逻辑运算
源码：正数的补码与原码相同例+7 源码：00000111 补码：00000111 （用8位二进制表示一个数）负数的补码：符号位为1，其余位为该数绝对值的原码按位取反；然后整个数加1。 -7 源码： 10000111 ，其绝对值为00000111 取反加一：11111001 为-7补码已知一个数的补码，求原码的操作分两种情况：
利用XSD 验证XML文件 newerdragon java xml xsd
XSD文件（XML Schema 语言也称作 XML Schema 定义（XML Schema Definition，XSD）。具体使用方法和定义请参看： http://www.w3school.com.cn/schema/index.asp java自jdk1.5以上新增了SchemaFactory类可以实现对XSD验证的支持，使用起来也很方便。以下代码可用在J
搭建 CentOS 6 服务器(12) - Samba rensanning centos
（1）安装 # yum -y install samba Installed: samba.i686 0:3.6.9-169.el6_5 # pdbedit -a rensn new password:123456 retype new password:123456 …… （2）Home文件夹 # mkdir /etc
Learn Nodejs 01 toknowme nodejs
（1）下载nodejs https://nodejs.org/download/ 选择相应的版本进行下载（2）安装nodejs 安装的方式比较多，请baidu下我这边下载的是“node-v0.12.7-linux-x64.tar.gz”这个版本（1）上传服务器（2）解压 tar -zxvf node-v0.12.
jquery控制自动刷新的代码举例 xp9802 jquery
1、html内容部分复制代码代码示例: <div id='log_reload'> <select name="id_s" size="1"> <option value='2'>-2s-</option> <option value='3'>-3s-</option

第八章 集成学习

文章目录

一 集成学习概述

1.1 学习器

1.2 概述与优势

1.3 增强基学习器多样性常用方法

二 偏差（Bias）和方差（Variance）

三 Bagging(套袋法)

3.1 简述

3.2 训练过程

3.3 预测过程

四 随机森林(Random Forest)

4.1 简述

4.2 RF算法推广

4.3 额外树(Extra Tree)

4.4 完全随机树嵌入(TRTE)

4.5 孤立森林(Isolation Forest)

4.6 RF随机森林总结

4.7 思考引入下文

五 提升学习(Boosting)

5.1 简述

5.2 自适应增强（Adaboost）

5.2.1 原理

5.3.2 AdaBoost与LR的关系

5.3.3 算法推导

5.3.3.1 求解权重系数

5.3.3.2 算法构建

5.3.4 算法示例

5.4.5 总结

5.3 梯度提升决策树**(**GBDT)

5.3.1 简述

5.3.2 算法原理

5.3.3 GBDT回归算法和分类算法

5.3.4 总结

六 Bagging、Boosting的区别

七 极致梯度提升（eXtreme Gradient Boosting，XGBoost）

7.1 简述

7.2 算法推导

7.3 学习策略

7.4 树节点分裂方法

7.5 XGBoost的其它特性

八 堆叠(Stacking)

8.1 基学习器与元学习器

8.2 简述

8.3 原理

8.4 训练阶段

8.5 预测阶段

8.6 原理

8.7 训练阶段

8.8 预测阶段

你可能感兴趣的:(车道线检测,深度学习,手写AI,集成学习,机器学习,人工智能)

第八章集成学习

一集成学习概述

二偏差（Bias）和方差（Variance）

四随机森林(Random Forest)

五提升学习(Boosting)

5.3 梯度提升决策树(GBDT)

七极致梯度提升（eXtreme Gradient Boosting，XGBoost）

八堆叠(Stacking)