tacit-lxs

机器学习考试复习

决策树

基于树结构来进行决策

优点
- 模型可解释性、白盒模型，能直观地显示整个决策问题在时间和决策顺序上不同阶段的决策过程。在应用于复杂的多阶段决策时，阶段明显，层次清楚，便于决策机构集体研究，可以周密地思考各种因素，有利于作出正确的决策。
- 训练需要的数据少，能处理分类数据和数值型数据。
缺点
- 不稳定，数据中的微小变化可能会导致生成不同的树。
- 容易产生一个过于复杂的模型，导致模型对数据的泛化能力会很差。

1. 划分选择

基于什么规则选出最优划分属性，进行树的分支。

1.1 信息增益

信息熵：

信息增益：

根据以上两个公式算出当前数据集D中每一属性的信息增益，取信息增益最大的属性a最为最优划分属性。进行分支。在分支后的数据集D‘中存在三种情况：

样本的取值不同且样本含有不同类别，则继续划分。
样本的取值相同，或属于同一类别，不用再划分，将其结点设定为所含样本最多的类别。
当前结点包含的样本数为空，不用划分，将其结点设定为父节点所含样本最多的类别。

1.2 增益率

它的出现是基于信息增益会对可取值数目较多的属性有所偏好，为了减少这种编好带来的不利影响。而增益率对可取值数目较少的属性有所偏好。著名C4.5算法的做法是，先从候选划分属性中找出信息增益高于平均水平的属性，再从中选择增益率最高的。

增益率定义为

其中

1.3 基尼指数

通过算出每个属性的基尼指数值，选择基尼指数最小的属性最为最优划分属性。

基尼指数定义为

其中

2. 剪枝处理

进行剪枝的原因是通过主动去掉一些分支来减少过拟合（把训练集自身的一些特点当作所有数据都具有的一般性质而导致）的风险。

过程：

通常提前将数据集划分为训练集、验证集。
在验证集上验证划分前后的精度或误差。

2.1预剪枝

指剪枝的时间在决策树的生成过程中，对每个结点在划分前进行估计，若当前结点的划分不能带来决策树泛化性能提升，则停止划分并将当前结点标记为叶节点。

优点

降低过拟合风险，减少了决策树的训练时间开销和测试时间开销

缺点

有过欠拟合的风险

2.2 后剪枝

该操作会先从训练集中生成一颗完整的决策树，然后自底向上地对非叶节点进行考察，若将该节点对应的子树替换为叶节点能带来决策树泛化性能提升，则将该子树替换为叶节点。

优点

降低过拟合风险，性能较好

缺点

时间开销大

3. 连续与缺失值

现实学习任务中常会遇到的连续属性，也会遇到不完整的样本。

2.1连续离散化

最简单的策略是用二分法对连续属性进行处理。

将属性的所有取值排序，然后找到能使信息增益达到最大的划分点（划分点集合Ta），

不大于划分点的为一种取值，大于划分点的为一种取值，这样转换之后就可以用信息增益的公式进行计算了。

2.2 缺失值处理

如过选择放弃不完整样本，那么将是对数据信息极大的浪费

只考虑哪些属性a上没有缺失值的样本参与信息增益的计算。并为每一个样本赋予一个权重w

其中
如果划分时某样本该属性值出现缺失，则划分到所有分支，并改变权重

4. 多变量决策

与单变量决策树不同，它不是为每个结点寻找一个最优划分属性，而是试图建立一个合适的线性分类器。从而实现复杂的划分，实现分类效果的提升。

神经网络

我们可以把神经网络看作是许多神经元按一定的层次结构连接起来而构成的。

神经元：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-UPWl3Dxe-1625486794519)(复习.assets/pic3.zhimg.com&app=2002&size=f9999,10000&q=a80&n=0&g=0n&fmt=jpeg)]

优点：
- 有能力学习和构建非线性的复杂关系的模型，拥有自学习的能力，例如实现图像识别时，只在先把许多不同的图像样板和对应的应识别的结果输入人工神经网络，网络就会通过自学习功能，慢慢学会识别类似的图像。
- 具有联想存储功能。
- 具有高速寻找优化解的能力。寻找一个复杂问题的优化解，往往需要很大的计算量，利用一个针对某问题而设计的反馈型人工神经网络，发挥计算机的高速运算能力，可能很快找到优化解。
缺点：
- 黑盒子，没能力来解释自己的推理过程和推理依据。
- 需要大量的数据进行训练，而且当数据不充分的时候，神经网络就无法进行工作。
- 理论和学习算法还有待于进一步完善和提高。

1. 感知机和多层网络

感知机实际上就是使用了两层神经元的网络，多层网络理所当然指的是多层神经元组成的网络。

感知机的训练可以同一为权重的学习，也就是说可以先固定阈值。若预测正确则不进行调整，错误了就根据错误程度进行权重的调整。

感知机不能求解非线性可分的问题，于是便有了多层神经网络。常见的神经网络可以称其为全连接，每一层神经元与下一层神经元全互连，同一层的神经元之间不存在相互连接，也不存在跨层连接。

简单的来说，神经网络的学习就是连接权值和阈值的学习。

2. BP算法

一种用来训练多层网络学习连接权值和阈值的算法，会使用梯度下降法更新参数。

bp神经网络是人工神经网络中最基础的一种模型，由于这种神经网络模型使用了数值正向传递，误差逆向传递的训练方法(back propagation)而被冠名为bp神经网络。误差逆向传递的训练方法有很多种，但是由于直接解值对于多层神经网络来说计算量非常巨大，故采用另外一种逼近算法，梯度下降法。梯度下降法是一种可以使得误差逆向传播，将全局误差收敛到极小值从而训练bp神经网络的训练方法，采用计算梯度的方式来一步步逼近误差极小值。

作者：ValK
链接：https://www.zhihu.com/question/396352046/answer/1237377964
来源：知乎
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

推导bp神经网络：

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MU85scpB-1625486794521)(复习.assets/image-20210704143211553.png)]

隐藏层的节点在反向传播的时候，与输出层连接的每个神经元都有关。

标准 BP 算法（每次针对一个训练样例更新连接权值和阈值）和累积 BP 算法，就是对应标准梯度下降和随机梯度下降，差别就是后者每次迭代用全部数据计算梯度，前者用一个数据计算梯度。

缺陷

BP神经网络容易陷入过拟合

早停

训练集误差降低但验证集误差升高
正则化

描述网络复杂度的部分

3. 全局最小和局部极小

我们可以把解看作是参数空间中的一点。如果这一点能实目标函数的取值小于这个参数空间中所有的点对应的函数值，则称为全局最小。如果只是在这点的某个领域内，满足最小，则称为局部最小。

梯度下降法

由于负梯度方向是函数值下降最快的方向，因此梯度下降法就是沿着负梯度方向搜索最优解。如果仅有一个局部极小，那么此时的局部极小就是全局最小，但如果存在多个局部极小，则不能保证找到全局最小。
跳出局部极小
- 初始化不同的参数值
- 模拟退火
- 随机梯度下降
- 遗传算法

4. 其他常见神经网络

RBF网络

在有足够多的隐层神经元的RBF网络能以任意精度逼近任意函数
ART网络

一种无监督学习策略，可进行增量学习或在线学习。

竞争方式：计算距离。
SOM网络

一种竞争学习型的无监督网络，他能将高维数据映射到低维空间，同时还能保持输入数据在高维空间的拓扑结构
级联相关网络

它不仅是训练网络的权值和阈值，而且将网络本身的结构也当作学习的对象。
Elman网络

一种常用的递归神经网络，它允许网络中出现环形结构。

隐层神经元的输出可以被反馈回来，作为下一时刻隐层神经元的输入。
Boltzmann机

为网络定义一个能量，训练网络即最小化能量函数。

5. 深度学习

可以简单的理解为很深层的神经网络

支持向量机

学习一个超平面，能对数据进行划分，对特征空间划分的最优超平面是SVM的目标,最大化分类边际的思想是SVM方法的核心

优点
- SVM 是一种有坚实理论基础的新颖的小样本学习方法.它基本上不涉及概率测度及大数定律等,因此不同于现有的统计方法.从本质上看,它避开了从归纳到演绎的传统过程,实现了高效的从训练样本到预报样本的“转导推理”,大大简化了通常的分类和回归等问题.
- 支持向量是SVM的训练结果,在SVM分类决策中起决定作用的是支持向量.SVM 的最终决策函数只由少数的支持向量所确定,计算的复杂性取决于支持向量的数目,而不是样本空间的维数,这在某种意义上避免了“维数灾难”.
缺点
- SVM算法对大规模训练样本难以实施，由于SVM是借助二次规划来求解支持向量,而求解二次规划将涉及m阶矩阵的计算（m为样本的个数）,当m数目很大时该矩阵的存储和计算将耗费大量的机器内存和运算时间
- 用SVM解决多分类问题存在困难，经典的支持向量机算法只给出了二类分类的算法,而在数据挖掘的实际应用中,一般要解决多类的分类问题.可以通过多个二类支持向量机的组合来解决.主要有一对多组合模式、一对一组合模式和SVM决策树；再就是通过构造多个分类器的组合来解决.主要原理是克服SVM固有的缺点,结合其他算法的优势,解决多类问题的分类精度.如：与粗集理论结合,形成一种优势互补的多类问题的组合分类器。

1. 间隔与支持向量

距离超平面最近的几个训练样本点称为支持向量，两个异类的支持向量到超平面的距离之和称为间隔。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-S6kSTNev-1625486794522)(复习.assets/201810190934182)]

基本模型：

对偶问题

通过使用拉格朗日乘子法，得到模型的对偶问题。

然后对w,b求偏导令其为零，带入消去w,b,即可得到对偶问题。

解除a，求得w,b,即可求得最终的模型。

训练完成后，大部分的训练样本都不需要保留，最终的模型只与支持向量有关
这是一个二次规划问题。
- SMO算法
  
  每次选取两个变量并固定其他参数，不断的选取不同的参数组进行更新。

2. 核函数

为了解决SVM线性不可分的问题，我们需要将原始空间映射到一个更高维度的特征空间。因为原始空间如果是有限维的话，那么一定存在一个更高维的空间使样本线性可分。而映射向量在高维空间进行计算是非常困难的，最是可以在原始空间中用一个核函数代替即可解决计算复杂度的问题。

核函数

3. 软间隔与正则化

现实任务中很难确定合适的核函数使得训练样本在特征空间中线性可分，所以为了缓解这个问题允许支持向量机在一些样本上出错。

4. 支持向量回归

训练一个回归模型，f(x)=wx+b.我们仅当f(x）与真实值y之间存在可以接受的误差e，当他们之间的差别大于e之后开始计算损失。

5. 核方法

用核函数的线性组合替换学习的模型。

贝叶斯分类器

贝叶斯分类器是各种分类器中分类错误概率最小或者在预先给定代价的情况下平均风险最小的分类器。它的设计方法是一种最基本的统计分类方法。其分类原理是通过某对象的先验概率，利用贝叶斯公式计算出其后验概率，即该对象属于某一类的概率，选择具有最大后验概率的类作为该对象所属的类。

类先验概率p©可通过个样本出现的频率来估计。类条件概率p(x|c)需要进行参数估计。

优点
- 接受大量数据训练和查询时所具备的高速度，支持增量式训练；对分类器实际学习的解释相对简单
- 对于多分类问题也同样很有效，复杂度也不会有大程度上升。
缺点
- 无法处理基于特征组合所产生的变化结果

1.极大似然估计

因为概率模型的训练过程就是参数估计的过程，极大似然估计属于频率主义。

寻找能最大化似然函数的参数值

2. 朴素贝叶斯分类器

它假设每个属性独立的对分类结果发生影响。

其中（若属性为连续属性）

若某个属性值在训练集中没有与某个类同时出现过，则连乘的概率值将为零。为了避免其他属性携带的信息被训练集中未出现的属性值抹去，在估计概率值时通常要进行“平滑”
- 拉普拉斯修正N

朴素贝叶斯的主要优点有：
1）朴素贝叶斯模型有稳定的分类效率。
2）对小规模的数据表现很好，能处理多分类任务，适合增量式训练，尤其是数据量超出内存时，可以一批批的去增量训练。
3）对缺失数据不太敏感，算法也比较简单，常用于文本分类。
朴素贝叶斯的主要缺点有：　　　
1）理论上，朴素贝叶斯模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此，这是因为朴素贝叶斯模型给定输出类别的情况下,假设属性之间相互独立，这个假设在实际应用中往往是不成立的，在属性个数比较多或者属性之间相关性较大时，分类效果不好。而在属性相关性较小时，朴素贝叶斯性能最为良好。对于这一点，有半朴素贝叶斯之类的算法通过考虑部分关联性适度改进。
2）需要知道先验概率，且先验概率很多时候取决于假设，假设的模型可以有很多种，因此在某些时候会由于假设的先验模型的原因导致预测效果不佳。
3）由于我们是通过先验和数据来决定后验的概率从而决定分类，所以分类决策存在一定的错误率。
4）对输入数据的表达形式很敏感。

3. 半朴素贝叶斯分类

因为在现实任务中，样本的每个属性往往很难满足相互独立。因此出现的半朴素贝叶斯分类器适当的考虑部分属性间的相互依赖关系。

独依赖：假设每个属性在类别之外最多只依赖一个其他属性。

贝叶斯网

用有向图刻画属性之间的依赖关系，用一个条件概率表来描述属性的联合概率分布。
结构

根据贝叶斯网构建道德图。
学习

现实中我们并不知晓网的结构，可以用一个评分函数进行搜索。
1. 推断QS态。
  - EM算法：针对不完整的训练样本。

考试预测

绪论

泛化能力

在训练集中学习到的模型，适用于新样本的能力。

版本空间

哪些于训练集一致的“假设集合”

奥卡姆剃刀

若有多个假设与观察一致，则选择最简单的那个

没有免费午餐

模型误差与算法没有关系，我们要根据具体问题，具体分析，选择合适的模型。

模型评估和选择

评估方法

1.留出法
2.交叉验证法
3.自助法

查准率和查全率

P: 所有预测为正例的样本(TP+FP)中为真正正例所占比例
R: 所有正例样本(TP+FN)中被预测为正例所占的比例
识别率: (TP+TN)/(TP+TN+FP+FN)

ROC

真正例率=p
假正例率：预测为假的样本在所有假例中的比例。

线性模型

LDA

线性判别模型：给定训练样例集，设法将样例投影到一条直线上，是的同类样例的投影点尽可能接近、异类样例的投影点尽可能远离；在对新样本进行分类时，将其投影到同样的这条直线上，再根据投影点的位置来确定新样本的类别。

类别不平衡

指训练集中不同类别的样本数目差别很大
再放缩：
1.欠采样(负采样)
2.过采样

决策树

决策树的基本思想

决策树算法是一种逼近离散函数值的方法。通过对数据集进行划分，确定划分条件，得出一类一类的数据子集。

CART回归树

使用基尼指数来选择最优划分属性，选择使得划分后基尼指数最小的属性作为最优划分属性

神经网络

训练网络的最优化算法
```
梯度下降法
```

SVM

支持向量机的优缺点

支持向量的意义

距离超平面最近的且满足一定条件的几个训练样本点，他们的本质向量，我们所划分的超平面最终是由支持向量所决定的。

svm概念,其目的,什么是最优化分类面

支持向量机是一类按监督学习方式对数据进行二元分类的广义线性分类，其目的是求得在特征空间划分的最优超平面，其决策边界是对学习样本求解的最大边距超平面。
基本思想是：找到集合边缘上的若干数据（称为支持向量，用这些点找出一个平面（称为决策面），使得两个异类支持向量到该平面的距离之和最大。这种拥有最大间隔的超平面则为最优化分类面。
由简至繁的 SVM 模型包括：
 当训练样本线性可分时，通过硬间隔最大化，学习一个线性可分支持向量机；
 当训练样本近似线性可分时，通过软间隔最大化，学习一个线性支持向量机；
 当训练样本线性不可分时，通过核技巧和软间隔最大化，学习一个非线性支持向量机；

SVM怎么防止过拟合

通过引入松弛变量，使SVM可以容忍异常点的存在。

贝叶斯

朴素贝叶斯法的基本假设

对已知类别，假设所有属性相互独立。

聚类

无监督学习

训练样本的标记信息是未知的，目标是通过对无标记的训练样本的学习来揭示数据的内在性质及规律，为进一步数据分析提供基础。

聚类

寻找数据内在的分布结构，也可作为分类等其他学习任务的前驱过程。

聚类算法

1.原型聚类
	-k均值聚类
	-学习向量量化
	-高斯混合聚类
2.密度聚类：假设聚类结构可以通过样本分布的紧密程度。
	-DBSCAN算法
3.层次聚类：试图在不同的层次上对数据集进行划分
	-AGNES算法

集成学习

bagging

对训练样本进行采样，产生出若干个不同的子集，再从每个数据子集中训练一个基学习器。

Adaboost（串行）和bagging（并行）的区别

	Adaboost	bagging
数据集	只有一个数据集，但是在不同的迭代过程中，权重是有区别的	通过自助法生成了k个数据集
数据	在每一次迭代中，不同观测的权重不同，上一次判断错误的样本在本次迭代中权重相对较高	在每一个数据集中，各个观测的权重都相同
结合策略	不同的学习器在最终的强学习器中的权重不同，错误率越低的学习器，其权重越高	不同的学习器的权重相同
训练过程	迭代是有先后顺序的，本次迭代过程需要依赖上一次迭代过程	k个弱学习器的训练是可以同时进行的，他们是相互独立的

第10章

KNN思想：

给定测试样本，基于某种距离度量找出训练集中与其最靠近的k个训练样本，然后基于这k个“邻居”样本信息进行预测
步骤：
(1) 计算已知类别数据集中的点与当前点之间的距离；
(2) 按照距离递增次序排序；
(3) 选取与当前点距离最小的 k 个点；
(4) 确定前 k 个点所在类别的出现频率；
(5) 返回前k个点出现频率最高的类别作为当前点的预测分类。

统计学习算法的三要素
```
模型、算法、策略
```

你可能感兴趣的:(机器学习,神经网络)

数据增强：扩充数据集提升模型泛化能力 AI天才研究院计算 AI大模型企业级应用开发实战 ChatGPT 计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1.数据增强的重要性在机器学习领域，模型的泛化能力至关重要。一个泛化能力强的模型能够在未见数据上表现良好，而过拟合的模型则会在训练数据上表现出色，但在新数据上表现糟糕。数据增强是一种有效提升模型泛化能力的技术，它通过对现有数据进行各种变换，人为地扩充数据集，从而增加训练数据的数量和多样性。1.2.数据增强的应用场景数据增强广泛应用于各种机器学习任务中，包括：图像识别:对图像进行旋转
数据增强：扩充数据集，提升模型的鲁棒性 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 LLM大模型落地实战指南计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
数据增强：扩充数据集，提升模型的鲁棒性1.背景介绍1.1数据集的重要性在机器学习和深度学习领域中,数据集是训练模型的基础。高质量的数据集对于构建准确、鲁棒的模型至关重要。然而,在现实世界中,获取大量高质量的数据通常是一个巨大的挑战。数据采集过程耗时耗力,而且成本高昂。此外,某些领域的数据存在隐私和安全问题,难以获取。1.2数据集不足的挑战当数据集规模有限时,模型很容易过拟合,无法很好地推广到新的、
NLP高频面试题（三）——普通RNN的梯度消失和梯度爆炸问题 Chaos_Wang_ NLP常见面试题自然语言处理 rnn 人工智能
普通RNN（循环神经网络）的梯度消失和梯度爆炸问题是指在训练深层或长序列的RNN模型时出现的两种典型问题：一、梯度消失（VanishingGradient）梯度消失是指在反向传播过程中，梯度逐层传播时变得越来越小，最终趋于接近0，导致模型前层的参数难以更新。原因：在反向传播时，每一层的梯度是通过链式法则计算得到的。因为链式求导中不断乘以一个较小的数值（小于1），随着层数或时间步的增加，梯度将指数级
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
机器学习之KMeans算法知舟不叙机器学习算法 kmeans
文章目录引言1.KMeans算法简介2.KMeans算法的数学原理3.KMeans算法的步骤3.1初始化簇中心3.2分配数据点3.3更新簇中心3.4停止条件4.KMeans算法的优缺点4.1优点4.2缺点5.KMeans算法的应用场景5.1图像分割5.2市场细分5.3文档聚类5.4异常检测6.Python实现KMeans算法7.总结引言KMeans算法是机器学习中最经典的无监督学习算法之一，广泛应
机器学习流程—数据预处理清洗不二人生机器学习机器学习人工智能数据预处理
文章目录机器学习流程—数据预处理清洗定义问题数据预处理数据加载与展示重复数据处理数据类型空值处理无关特征删除数据分布删除异常值生成标签和特征数据分割机器学习流程—数据预处理清洗数据处理是将数据从给定形式转换为更可用和更理想的形式的任务，即使其更有意义、信息更丰富。使用机器学习算法、数学建模和统计知识，整个过程可以自动化。这个完整过程的输出可以是任何所需的形式，如图形、视频、图表、表格、图像等等，具
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
Apache Storm：实时数据处理的闪电战 Aaron_945 Java apache storm 大数据
文章目录ApacheStorm原理拓扑结构数据流处理容错机制官网链接基础使用安装与配置编写拓扑提交与运行高级使用状态管理窗口操作多语言支持优点高吞吐量低延迟可扩展性容错性总结ApacheStorm是一个开源的分布式实时计算系统，它允许你以极高的吞吐量处理无界数据流。Storm被广泛用于实时分析、在线机器学习、连续计算等多种场景。本文将深入探讨ApacheStorm的原理、基础使用、高级特性及其优点
知识蒸馏：从软标签压缩到推理能力迁移的工程实践(基于教师-学生模型的高效压缩技术与DeepSeek合成数据创新) AI仙人掌人工智能 AI 人工智能深度学习语言模型机器学习
知识蒸馏通过迁移教师模型（复杂）的知识到学生模型（轻量），实现模型压缩与性能平衡。核心在于利用教师模型的软标签（概率分布）替代独热编码标签，学生模型不仅学习到教师模型输出数据的类别信息，还能够捕捉到类别之间的相似性和关系，从而提升其泛化能力核心概念知识蒸馏的核心目标是实现从教师模型到学生模型的知识迁移。在实际应用中，无论是大规模语言模型（LLMs）还是其他类型的神经网络模型，都会通过softmax
什么是机器视觉3D引导大模型视觉人机器视觉机器视觉3D 3d 数码相机机器人人工智能大数据
机器视觉3D引导大模型是结合深度学习、多模态数据融合与三维感知技术的智能化解决方案，旨在提升工业自动化、医疗、物流等领域的操作精度与效率。以下从技术架构、行业应用、挑战与未来趋势等方面综合分析：一、技术架构与核心原理多模态数据融合与深度学习3D视觉引导大模型通常整合RGB图像、点云数据、深度信息等多模态输入，通过深度学习算法（如卷积神经网络、Transformer）进行特征提取与融合。例如，油田机
Python 机器学习基础之学习基础环境搭建仙魁XAN Python 机器学习基础+实战案例 python 学习开发语言机器学习 machine learning
Python机器学习基础之学习基础环境搭建目录Python机器学习基础之学习基础环境搭建一、简单介绍二、什么是机器学习三、python环境的搭建1、Python安装包下载2、这里以下载Python3.10.9为例3、安装Python3.10.94、检验python是否安装成功，win+R快捷打开运行，输入cmd，打开cmd四、Pycharm环境搭建1、下载Pycharm安装包2、安装Pycharm
【机器学习】主成分分析法（PCA）若兰幽竹机器学习机器学习信息可视化人工智能
【机器学习】主成分分析法（PCA）一、摘要二、主成分分析的基本概念三、主成分分析的数学模型五、主成分分析法目标函数公式推导（`梯度上升法`求解目标函数）六、梯度上升法求解目标函数第一个主成分七、求解前n个主成分及PCA在数据预处理中的处理步骤（后续实现）一、摘要本文主要讲述了主成分分析法（PCA）的原理和应用。PCA通过选择最重要的特征，将高维数据映射到低维空间，同时保持数据间的关系，实现降维和去
深入探索 PyTorch 在语音识别中的应用 Zoro｜ PyTorch Deep Learning 机器学习 pytorch 语音识别人工智能
深入探索PyTorch在语音识别中的应用在本篇博客中，我将分享如何使用PyTorch进行语音识别任务，重点围绕环境配置、数据预处理、特征提取、模型设计以及模型比较展开。本文基于最近一次机器学习作业（HW2）的任务内容，任务目标是对语音信号进行逐帧音素预测，从而完成多类别分类任务。一、介绍任务背景任务目标：利用深度神经网络对语音信号进行逐帧音素预测。音素定义：音素是语音中能够区分单词的最小语音单位。
MNIST数据集&手写数字识别 Zoro｜ keras tensorflow 人工智能机器学习
TensorFlow是一个开源的机器学习框架，由Google开发并发布。它提供了一种基于数据流图的编程模型，用于构建和训练机器学习模型。TensorFlow的核心概念是张量（Tensor）和流图（Graph）。张量是TensorFlow中的基本数据单位，可以理解为多维数组，可以是标量、向量、矩阵或更高维度的数组。流图是由一系列操作（Operation）和张量组成的。操作定义了计算和转换张量的方式。
深度学习五大模型：CNN、Transformer、BERT、RNN、GAN详细解析深度学习
卷积神经网络（ConvolutionalNeuralNetwork,CNN）原理：CNN主要由卷积层、池化层和全连接层组成。卷积层通过卷积核在输入数据上进行卷积运算，提取局部特征；池化层则对特征图进行下采样，降低特征维度，同时保留主要特征；全连接层将特征图展开为一维向量，并进行分类或回归计算。CNN利用卷积操作实现局部连接和权重共享，能够自动学习数据中的空间特征。适用场景：广泛应用于图像处理相关的
OpenLSD是一个自适应开源数据集，旨在支持逻辑综合中的多种机器学习任务。数据集
2024-11-14，由中国科学院计算技术研究所、鹏城实验室和北京大学等联合创建OpenLSD数据集，目的为逻辑综合过程中的机器学习任务提供一个自适应的数据集生成框架。该数据集的核心研究问题是如何在逻辑综合的三个基本步骤——布尔表示、逻辑优化和技术映射中，通过机器学习方法提升效率和质量。一、研究背景：逻辑综合是电子设计自动化（EDA）流程中的关键环节，它负责将高级设计规范转化为门级网络列表。近年来
【Python】测试数据生成工具 --- Faker pythonfaker数据分析
Faker库介绍Faker是一个强大的库，能够帮助开发者和测试人员生成大量的假数据，但这些数据看起来却非常真实。它支持生成多种类型的数据，如姓名、地址、公司名称、电子邮件等，甚至能够根据不同国家的特定文化生成相应的数据。Faker的应用不仅限于测试，它还广泛应用于数据分析、机器学习训练集的准备以及任何需要大量样本数据的场景。Faker安装前提：已安装python、pip安装命令如下：pipinst
未来5年AI人工智能与信息技术领域发展趋势海宁不掉头发人工智能软件工程人工智能人工智能软件工程笔记 chatgpt
未来五年人工智能与信息技术领域发展趋势深度解析一、人工智能与神经网络技术的突破路径（一）算法架构的范式革新深度神经网络正经历从量变到质变的演进。以Transformer为核心的序列建模技术持续迭代，字节跳动云雀模型通过动态结构优化，在保持语言理解能力的同时将参数量压缩至GPT-4的1/10，推理速度提升3倍。更值得关注的是类脑计算的突破，中国科学院自动化研究所提出"基于内生复杂性"的类脑神经元模型
深度学习框架PyTorch——从入门到精通（4）数据转换 Fansv587 Torch框架学习深度学习 pytorch 人工智能 python 经验分享
转换（Transforms）很多时候，数据并不总是以训练机器学习算法所需的最终处理形式出现。所以我们需要使用变换对数据进行一些处理，使其适合训练。所有TorchVision数据集都有两个参数——transform来修改特征，target_transform来修改标签——接受包含转换逻辑的可调用项。torchvision.transform模块提供了几个开箱即用的转换。FashionMNIST数据集
RNN及其变体 EmbodiedTech 人工智能大模型自然语言处理
第三章RNN及其变体1认识RNN模型【根据RNN内部结构，可以分为哪几类】定义循环神经网络：一般接受的一序列进行输入，输出也是一个序列作用和应用场景RNN擅长处理连续语言文本，机器翻译、文本生成、文本分类、摘要生成RNN模型的分类根据输入与输出结构NVsN:输入和输出等长，应用场景：对联生成；词性标注；NERNVs1:输入N，输出为单值，应用场景：文本分类1VsN:输入是一个，输出为N，应用场景：
深度学习框架PyTorch——从入门到精通（5）构建神经网络 Fansv587 Torch框架学习深度学习 pytorch 神经网络经验分享
构建神经网络获取训练设备定义类模型层nn.Flattennn.Linearnn.ReLUnn.Sequentialnn.Softmax模型参数补充说明argmax神经网络是由一些层或者模块组成的，这些层和模块会对数据进行各种操作。在PyTorch里，torch.nn这个命名空间提供了你搭建自己神经网络所需要的所有基础组件。PyTorch里的每一个模块都是nn.Module类的子类。一个神经网络本身
机器学习线性回归学习心得_线性回归为机器学习的初学者解释 weixin_26750481 机器学习 python 人工智能逻辑回归深度学习
机器学习线性回归学习心得Datasciencewiththekindofpoweritgivesyoutoanalyzeeachandeverybitofdatayouhaveatyourdisposal,tomakesmart&intelligentbusinessdecisions,isbecomingamust-havetooltounderstandandimplementinyouror
基于MATLAB的遗传算法优化BP神经网络航空发动机寿命预测默默科研仔发动机寿命预测 matlab 神经网络发动机寿命预测
基于MATLAB的遗传算法优化BP神经网络航空发动机寿命预测一、基本原理与优化框架遗传算法（GA）与BP神经网络的结合（GA-BP）主要通过全局搜索优化BP神经网络的初始权值和阈值，解决传统BP易陷入局部最优、收敛速度慢的问题。具体优化形式包括：初始参数优化：GA仅优化初始参数，后续仍依赖BP反向传播微调。全局参数优化：GA直接优化全部网络参数，无需BP参与。混合优化：GA优化初始参数后，再通过B
统计机器学习 (Statistical Machine Learning) 原理与代码实例讲解 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
统计机器学习(StatisticalMachineLearning)原理与代码实例讲解1.背景介绍统计机器学习是现代人工智能和数据科学的核心领域之一。它结合了统计学和计算机科学的理论与方法，通过数据驱动的方式来构建预测模型和决策系统。统计机器学习不仅在学术研究中占据重要地位，还在工业界有广泛应用，如推荐系统、图像识别、自然语言处理等。2.核心概念与联系2.1统计学与机器学习的关系统计学关注数据的收
【python 机器学习】sklearn数据集的使用人才程序员 python 机器学习 sklearn 人工智能深度学习神经网络目标检测
文章目录sklearn数据集的使用1.`sklearn`内置数据集2.导入`sklearn`数据集3.加载和使用Iris数据集3.1加载数据3.2查看数据3.3使用数据集进行分类任务4.加载和使用Digits数据集4.1加载数据4.2查看数据4.3使用数据集进行分类任务5.加载和使用BreastCancer数据集5.1加载数据5.2查看数据5.3使用数据集进行分类任务6.总结sklearn数据集的
深度学习框架PyTorch——从入门到精通（5）自动微分 Fansv587 深度学习 pytorch 人工智能
使用torch.autograd自动微分张量、函数和计算图计算梯度禁用梯度追踪关于计算图的更多信息张量梯度和雅可比乘积在训练神经网络时，最常用的算法是反向传播。在该算法中，参数（模型权重）根据损失函数的梯度相对于给定参数进行调整。为了计算这些梯度，PyTorch有一个内置的微分引擎，名为torch.autograd。它支持为任何计算图自动计算梯度。考虑最简单的一层神经网络，具有输入x、参数w和b以
消融实验（Ablation Study） xwhking 深度学习机器学习深度学习消融实验
消融实验（AblationStudy）定义：消融实验是一种科学研究方法，通过逐步移除模型、算法或系统中的某个组件（如模块、层、特征、数据等），观察其对整体性能的影响，从而验证该组件的必要性和有效性。其名称来源于医学领域的“消融术”（切除部分组织以研究功能），在计算机视觉、机器学习和深度学习中被广泛用于分析模型设计。为什么要做消融实验？1.验证组件的有效性核心目的：确认模型中某个设计（如注意力机制、
【Conda与Pip的完美融合】在Conda环境中优雅使用pip指南 2401_85702623 conda pip python
标题：【Conda与Pip的完美融合】在Conda环境中优雅使用pip指南Conda是一个强大的包管理器和环境管理器，广泛用于Python社区，尤其是在数据科学和机器学习领域。尽管Conda本身可以处理大多数包的安装和管理，但有时我们可能仍需使用pip来安装特定的Python包。本文将详细解释如何在Conda环境中使用pip，包括配置、安装包、环境管理等，确保您可以充分利用这两个工具的优势。1.C
量子计算+AI：未来AI Agent的计算范式 AI天才研究院计算 ChatGPT DeepSeek RL 强化学习 agent agi 推理模型智能驾驶
量子计算+AI：未来AIAgent的计算范式关键词：量子计算，人工智能，AIAgent，量子算法，量子机器学习，量子优化，量子数据处理摘要：量子计算和人工智能（AI）的结合正在改变AIAgent的计算范式。通过量子计算的超强算力和独特性质，AIAgent在数据处理、算法优化和决策能力方面展现出巨大潜力。本文将详细探讨量子计算与AI结合的核心概念、算法原理、系统架构，并通过实际案例展示量子AIAge
深度学习中的Channel，通道数是什么？ %KT% 深度学习深度学习人工智能
参考文章：直观理解深度学习的卷积操作，超赞！-CSDN博客如何理解卷积神经网络中的通道（channel）_神经网络通道数-CSDN博客深度学习-卷积神经网络—卷积操作详细介绍_深度卷积的作用-CSDN博客正文：在跑深度学习代码的过程中，经常遇到的一个报错是：模型尺寸不匹配的问题。一般pytorch中尺寸/张量的表现方式是：torch.size([16,3,24,24])。这四个参数的含义如下：16
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http