yan_nLiiiiii

深度学习课程自学笔记整理(二)——一些自己总结记录的结论和小tips等

注：本人已经学完了吴恩达老师机器学习深度学习的全部课程，整理出来的知识点是比较笼统的、自己总结的一些结论和经验，发在这里主要是为了方便自己复习翻阅，已经学完大部分课程或者对深度学习有了一定基础的uu可以阅读下~欢迎批评指正。

笔记一：吴恩达深度学习课程自学笔记整理(一)

深度学习的实践层面

Train/Dev/Test sets

只有训练集和测试集：七三分
有验证集且总数量不多：六二二分
有验证集且总数量很多-百万级别：大部分作交叉验证集
假设我们有 100 万条数据，其中 1 万条作为验证集，1 万条作为测试集，即：训练集占98%，验证集和测试集各占 1%。对于数据量过百万的应用，训练集可以占到 99.5%，验证和测试集各占 0.25%，或者验证集占 0.4%，测试集占 0.1%。
根据经验，要确保验证集和测试集的数据来自同一分布，关于这个问题老师在后面会多讲一些。因为要用验证集来评估不同的模型，尽可能地优化性能，如果验证集和测试集来自同一个分布就会很好。
最后一点，就算没有测试集也不要紧，测试集的目的是对最终所选定的神经网络系统做出无偏估计，如果不需要无偏估计，也可以不设置测试集。所以如果只有验证集，没有测试集，我们要做的就是，在训练集上训练、尝试不同的模型框架，在验证集上评估这些模型，然后迭代并选出适用的模型。这是因为验证集中已经涵盖测试集数据，其不再提供无偏性能评估。

在机器学习中，如果只有一个训练集和一个验证集，而没有独立的测试集，遇到这种情况，训练集还被人们称为训练集，而验证集则被称为测试集，不过在实际应用中，人们只是把测试集当成简单交叉验证集使用，并没有完全实现该术语的功能。
如果某团队跟你说他们只设置了一个训练集和一个测试集，我会很谨慎，心想他们是不是真的有训练验证集，我会让这些团队改变叫法，改称其为“训练验证集”，而不是“训练测试集”。即便我认为“训练验证集“在专业用词上更准确，实际上，如果你不需要无偏评估算法性能，那么这样是可以的。

偏差、方差

高偏差（high bias）的情况，“欠拟合”（underfitting）
高方差（high variance）的情况，数据过度拟（overfitting）

理解偏差和方差的两个关键数据是训练集误差（Train set error）和验证集误差（Dev set error）：
- 假定训练集误差是 1%，为了方便论证，假定验证集误差是 11%，可以看出训练集设置得非常好而验证集设置相对较差，我们可能过度拟合了训练集，在某种程度上验证集并没有充分利用交叉验证集的作用，像这种情况，我们称之为“高方差”；即：差的多：方差高
- 假设训练集误差是 15%，验证集误差是 16%，训练数据的拟合度不高，就是数据欠拟合，就可以说这种算法偏差比较高。即：训练集误差高-高偏差
- 再举一个例子，训练集误差是 15%，偏差相当高，但是验证集的评估结果更糟糕，错误率达到 30%，这是方差偏差都很糟糕的情况。
一般来说，最优误差也被称为贝叶斯误差，所以，如果最优误差或贝叶斯误差非常高，比如 15%。我们再看看这个分类器（训练误差15%，验证误差 16%），则15%的错误率对训练集来说也是非常合理的，偏差不高，方差也非常低。

针对偏差方差的优化

初始模型训练完成后，我首先要知道算法的偏差高不高，如果偏差较高，试着评估训练集或训练数据的性能。如果偏差的确很高，甚至无法拟合训练集，那么你要做的就是选择一个新的网络，比如含有更多隐藏层或者隐藏单元的网络。采用规模更大的网络通常都会有所帮助，延长训练时间不一定有用，但也没什么坏处。反复尝试，直到可以拟合数据为止，至少能够拟合训练集。
一旦偏差降低到可以接受的数值，检查一下方差有没有问题。如果方差高，解决办法：采用更多数据；正则化。
正则化： $λ/2m Σ||w||^{2}$
为什么只正则化参数而不再加上参数呢？你也可以这么做，只是我们习惯省略不写，因为通常是一个高维参数矢量，已经可以表达高偏差问题，可能包含有很多参数，我们不可能拟合所有参数，而只是单个数字，所以几乎涵盖所有参数。
于是， λ 变成了一个需要调整的超级参数。

dropout 正则化

dropout 会遍历网络的每一层，并设置消除神经网络中节点的概率，最后得到一个节点更少，规模更小的网络。我们用一个三层（ = 3）网络来举例说明：

首先要定义向量， $^{[3]}$ 表示一个三层的 dropout 向量：
d3 = np.random.rand(a3.shape[0],a3.shape[1])
向量或 $^{[3]}$ 用来决定第三层中哪些单元归零。
然后看它是否小于某数，我们称之为 keep-prob。keep-prob 是一个具体数字，它表示保留某个隐藏单元的概率，此处 keep-prob 等于 0.8，它的作用就是生成随机矩阵，其中 $^{[3]}$ 中的对应值为 1 的概率都是 0.8，对应为 0 的概率是 0.2，随机数字小于 0.8。它等于 1 的概率是 0.8，等于 0 的概率是 0.2。
接下来要做的就是从第三层中获取激活函数，这里我们叫它 $^{[3]}$ ， $^{[3]}$ 等于上面的 $^{[3]}$ 乘以 $^{[3]}$ ，a3 =np.multiply(a3,d3)，也可写3 ∗= 3，它的作用就是让 $^{[3]}$ 中各个元素等于 0 的概率为20%。
最后，我们向外扩展[3]，用它除以除以 keep-prob 参数：3/= − b，原因： $^{[4]}$ = $^{[4]}$ $^{[3]}$ + $^{[4]}$ ，为了不影响z $^{[4]}$ 的期望值，我们用 $^{[4]}$ a $^{[3]}$ /0.8，会修正我们所需的那20%。这一步骤就是所谓的dropout法。反向随机失活（inverted dropout）方法通过除以 keep-prob，确保 $^{[3]}$ 的期望值不变。，目前实施 dropout 最常用的方法就是 Inverted dropout

通常我们在测试阶段不会使用dropout函数，我们不期望输出结果是随机的，如果测试阶段应用 dropout 函数，预测会受到干扰。
dropout 的功能类似于2正则化，与2正则化不同的是应用方式不同会带来一点点小变化，甚至更适用于不同的输入范围。对于不同的应用方式 dropout正则化的情况也会不同。

总结一下，如果你担心某些层比其它层更容易发生过拟合，可以把某些层的 keep-prob值设置得比其它层更低，缺点是为了使用交叉验证，你要搜索更多的超级参数；另一种方案是在一些层上应用 dropout，而有些层不用dropout，应用 dropout 的层只含有一个超级参数，就是 keep-prob。
dropout在计算机视觉中应用得比较频繁，有些计算机视觉研究人员非常喜欢用它，几乎成了默认的选择。

其他正则化方法

数据扩增：
水平翻转、裁剪图片、字符变换等
early stopping
提早停止梯度下降

梯度消失/梯度爆炸

指导数或坡度有时会变得非常大，或者非小，甚至于以指数方式变大变小，这加大了训练的难度。无法完全消除，但可以通过权重初始化减缓。

权重初始化：
- 比如只有一个神经元的情况：
  $_1_1 + _2_2 + ⋯ + __, = 0$ ，为了预防值过大或过小，可以看到越大，你希望越小，最合理简单的方法就是设置 = 1/，表示神经元的输入特征数量， $^{[]}$ = . . (shape) ∗ np. sqrt(1/[−1])(tanh激活函数)，[−1]是第 − 1层神经元数量。这里的1/[−1]为方差。
  如果用的是 Relu 激活函数，方差设置为2/，效果会更好。
- 如果激活函数的输入特征被零均值和标准方差化，则方差是 1，也会调整到相似范围，这就降低了梯度消失和爆炸问题，因为它给权重矩阵设置了合理值，你也知道，权重不能比 1 大很多，也不能比 1 小很多。

梯度检验

用法：双边检验比单边检验效果好

用途：

首先，不要在训练中使用梯度检验，它只用于调试。为了实施梯度下降，必须使用和 backprop 来计算，并使backprop 来计算导数，只有调试的时候，才会用梯度检验来确认数值是否接近。完成后，关闭梯度检验。
如果算法的梯度检验失败，要检查所有项，检查每一项，并试着找出 bug，也就是说，如果 $_{approx}[i]$ 与[i]相差很大，我们要做的就是查找不同的值，看看是哪个导致这个差距的。
第三点，在实施梯度检验时，如果使用正则化，请注意正则项。等于与相关的函数的梯度，记住一定要包括正则项。
第四点，梯度检验不能与 dropout 同时使用，因为每次迭代过程中，dropout 会随机消除隐藏层单元的不同子集，难以计算 dropout 在梯度下降上的代价函数。建议先关闭 dropout，用梯度检验进行双重检查，因为在没有 dropout 的情况下，你的算法至少是正确的，然后打开 dropout。

优化算法

Mini-batch梯度下降

把训练集分割为小一点的子集训练，这些子集被取名为 mini-batch。

之前我们使用了上角小括号()表示训练集里的第i个训练样本，用上角中括号[]来表示神经网络的第层，现在引入大括号来代表第i个mini-batch， $^{}$ 和 $^{}$ 。

mini-batch的大小：
设m为训练集的大小，如果 mini-batch 的大小等于，其实就是传统的 batch 梯度下降法；另一个极端情况，假设 mini-batch 大小为 1，就有了新的算法，叫做随机梯度下降法。
考虑到电脑内存设置和使用的方式，如果 mini-batch 大小是 2 的次方，代码会运行地快一些。64 到 512 的 mini-batch 比较常见。

指数加权平均数算法

就是一种计算平均数的算法。
作用：从计算和内存效率来说，这是一个有效的方法，所以在机器学习中会经常使用，更不用说只要一行代码，这也是一个优势。

例如：伦敦的每日温度图如下：

首先，使 $_{0}=0$ ，然后， $_{t}=β_{t-1}+(1-β)θ_{t}$ ，其中， $θ_{t}$ 表示当日温度。
β=0.9:红线每天只取0.1的权重
β=0.98接近1:绿线每天只取0.02的权重

高值得到的曲线要平坦一些，原因在于多平均了几天的温度，所以这个曲线波动更小，缺点是曲线进一步右移，出现一定延迟，因为当 = 0.98，相当于给前一天的值加了太多权重，只有 0.02 的权重给了当日的值。
如果是另一个极端值0.5，相当于平均了两天的温度：

这个黄色线能更快适应温度变化。
偏差修正：
可以使平均数运算更加准确
方法：不用 $_{t}$ ，而是用 $_{t}/(1-β_{t})$
可以让估测变得更好，更准确，特别是在估测初期；当很大的时候， $β^{t}$ 接近0，偏差修正几乎没有作用。如紫线：

Momentum/动量梯度下降法

简而言之，基本的想法就是计算梯度的指数加权平均数，并利用该梯度更新权重。

如图：

慢慢摆动到最小值，这种上下波动减慢了梯度下降法的速度，你就无法使用更大的学习率，如果你要用较大的学习率（紫色箭头），结果可能会偏离函数的范围。在纵轴上，你希望学习慢一点，因为你不想要这些摆动，但在横轴上，你希望加快学习，快速从左向右移，移向最小值红点。

做法：
$_{dW}=β_{dW}+(1-β)dW， _{db}=β_{db}+(1-β)db$
这与之前的公式 $_{t}=β_{t-1}+(1-β)θ_{t}$ 相似。
理解：每次都考虑所有的dW分量。当以前dW的分量都指向一个方向，那么它会叠加其它分量不是主方向。多个batch后会被减小，主方向不断增加，相当于加速。

这个算法肯定要好于没有 Momentum 的梯度下降算法，我们还可以做别的事情来加快学习算法。

RMSprop算法

root mean square prop

如果你想：

公式：

理解：
因为对纵轴求导和对横轴求导的小大不一样，S值就是为了使大的更大，小的更小，这样在作为分母时，就能在梯度上呈现出相反的情况，减小震荡的同时加速梯度下降。
为了确保数值稳定，在实际操练的时候，通常在分母上加上一个很小很小的，是多少没关系， $10^{−8}$ 是个不错的选择，这只是保证数值能稳定一些。

Adam优化算法：

Adam 优化算法基本上就是将 Momentum 和 RMSprop 结合在一起。

以db为例，dW同理：

Momentum：
$_{db}=β_1_{db}+(1-β_1)db$
RMSprop：
由方差性质可知：
$S_{db}=β_2S_{db}+(1-β_2)(db)^2$
加上偏差修正：
$v_{db}^{corrected}=v_{db}/(1-β_1^{t})$
$S_{db}^{corrected}=S_{db}/(1-β_2^{t})$

1常用的缺省值为 0.9，至于超参数2，Adam 算法的发明者推荐使用 0.999，关于的选择其实没那么重要，Adam 作者建议为10^(−8)，但你并不需要设置它，因为它并不会影响算法表现。

学习率衰减

慢慢减少的本质在于：在学习初期，你能承受较大的步伐，但当开始收敛的时候，小一些的学习率能让你步伐小一些。

拆分成不同的 mini-batch，第一次遍历训练集叫做第一代，第二次就是第二代。epoch-num表示第几代：

例子：

我们要做的是要去尝试不同的值，包括超参数0，以及超参数衰退率，找到合适的值。

还有很多衰减，如：指数衰减、离散下降、手动衰减等。

超参数调试

学习率a调试

在早一代的机器学习算法中，如果你有两个超参数：超参 1，超参 2，常见的做法是在网格中取样点。这里放置的是 5×5 的网格，你可以尝试这所有的 25 个点，然后选择哪个参数效果最好。当参数的数量相对较少时，这个方法很实用；
在深度学习领域，我们常做的是随机选择点，如左图所示：

若三个超参数：立方体
另一个惯例是采用由粗糙到精细的策略：

为超参数选择合适的范围-a和β

a：

用对数标尺搜索超参数的方式会更合理，通常不使用线性轴，分别依次取0.0001，0.001，0.01，0.1，1，在对数轴上均匀随机取点，这样，比如在
0.0001 到 0.001 之间，就会有更多的搜索资源可用。

取最小值的对数为a，最大值的对数为b
r在对数轴上的10^ 到 10^ 区间取值
将超参数设置为10^ r
例如：0.0001到1: log0.0001=-4=a, log1=0=b，r=-4*np.random.rand()，然后a随机取值：a=10^r，则a∈[10^{-4},10^{0}]

β：

假设你认为是 0.9到 0.999 之间的某个值，那就不能用线性轴取值了，所以考虑这个问题最好的方法就是，我们探究1 − ，此值在0.1 到 0.001 区间内。

这里，左边的是最大值，右边的是最小值，在[−3, −1]里随机均匀给 r 取值。设定1 − = 10，所以 = 1 − 10，这就变成了在特定的选择范围内超参数随机取值。希望用这种方式得到想要的结果: 在 0.9 到 0.99 区间探究的资源,和在 0.99 到 0.999 区间探究的一样多。

注意：当接近 1 时，就会对细微的变化变得很敏感。所以在接近 1 的区间内的取值过程中，需要更加密集地取值。

两种超参数调试方式：

Pandas and Caviar 熊猫方式和鱼子酱方式

Pandas：

观察它的表现，耐心地调试学习率，但那通常这是你没有足够的计算能力，不能在同一时间试验大量模型时才采取的办法。

Caviar：

同时试验多种模型。

打个比方，把左边的方法称为熊猫方式。当熊猫有了孩子，他们的孩子非常少，一次通常只有一个，然后他们花费很多精力抚养熊猫宝宝以确保其能成活，所以，这的确是一种照料，一种模型类似于一只熊猫宝宝；
对比而言，右边的方式更像鱼类的行为，称之为鱼子酱方式。不对其中任何一个多加照料，只是希望其中一个，或其中一群，能够表现出色。
将称之为熊猫方式与鱼子酱方式。

Batch正则化和程序框架

Batch正则化：

简称BN

把z标准化：

其中， $Z_{norm}$ =(z-μ)/(σ²+)^0.5

将 Batch Norm 拟合进神经网络

BN：全称Batch Normalization(批规范化)

Batch 归一化的做法是将值进行 Batch 归一化，简称 BN，此过程将由和两参数控制，这一操作会给你一个新的规范化的值(̃[1])，然后将其输入激活函数中得到：= (̃)。
需要强调的是 Batch 归一化是发生在计算和之间的。实践中，Batch 归一化通常和训练集的 mini-batch一起使用，在每个 mini-batch上使用。
注意：在BN中，无论[]的值是多少，都是要被减去的，因为在 Batch 归一化的过程中，要减去平均值，加常数会抵消。

Batch Norm 奏效的原因总结

保证了均值和方差固定不变；
可以这样想，它减弱了前层参数的作用与后层参数的作用之间的联系，它使得网络每层都可以自己学习，稍稍独立于其它层，这有助于加速整个网络的学习；
打个比方，各种颜色的猫平均一下结果是黑猫，然后再输入到分类器，这样猫的颜色对分类的影响就可以减弱；
有轻微正则化的效果：归一化过程中，均值和方差的估计是不准确的，因此它们引来了噪声。但这噪声也实现了轻微正则化的效果，弄巧成拙了。

训练和测试时的 BN

在训练时，和2是在整个 mini-batch 上计算出来的，包含了一定数量的样本；
在测试时，是根据训练集估算和2。估算的方式有很多种，理论上可以在最终的网络中运行整个训练集来得到和2，但在实际操作中，我们通常运用指数加权平均来追踪在训练过程中看到的和2的值。然后在测试中使用和2的值来进行所需要的隐藏单元值的调整。

简单来说就是在测试test时对于单个样本均值和方差都没有意义，那么要利用训练时的数据来得到miu和sigma从而计算测试时的z_norm。

softmax回归

多种分类，不只是识别两个分类。

假设一共有四个类别:

算出了之后，分为三个步骤。需要应用 Softmax 激活函数，设定一个临时变量 $t=e^{z^{[l]}}$ ，并进行归一化。具体例子如下：

例如这里的第一个节点，归一化后它会输出0.842，这样说来，对于这张图片(对于这个z值)，类0的概率就为84.2%，同理可得类1、类2、类3的概率，四个概率总和为1。

soft激活函数：设 $^{[]}$ = $^{[]}$ ( $^{[]}$ )，这一激活函数
的特殊之处在于，，因为需要将所有可能的输出归一化，就需要输入一个 4×1 维向量，然后输出一个 4×1 维向量。

C#遇见TensorFlow.NET：开启机器学习的全新时代墨夶 C#学习资料1 机器学习 c#tensorflow
在当今快速发展的科技世界里，机器学习（MachineLearning,ML）已经成为推动创新的重要力量。从个性化推荐系统到自动驾驶汽车，ML的应用无处不在。对于那些习惯于使用C#进行开发的程序员来说，将机器学习集成到他们的项目中似乎是一项具有挑战性的任务。但随着TensorFlow.NET的出现，这一切变得不再困难。今天，我们将一起探索如何利用这一强大的工具，在熟悉的.NET环境中轻松构建、训练和
工业场景将成为AI大模型的重要战场！零基础入门AI大模型，看这篇就够了！大模型扬叔人工智能工业多模态大模型
前言2024年，各大公司推出强大理解能力的多模态大模型，将引领人工智能（AI）技术创新和应用，工业场景将成为多模态大模型的最佳实践场地。随着GPT-4o、Gemini1.5Pro、LLaVA1.6的发布，基于Transformer架构和海量数据训练的多模态大模型再次点燃通用人工智能（AGI），其对文本、图像等多模态输入的支持和强大的理解能力也象征着人工智能迈向通用人工智能（AGI）的新阶段。随着工
人工智能学习路线全链路解析 power-辰南大模型算法实战工程人工智能学习机器学习
一、基础准备阶段（预计2-3个月）（一）数学知识巩固与深化线性代数（约1个月）：矩阵基础：回顾矩阵的定义、表示方法、矩阵的基本运算（加法、减法、乘法），理解矩阵乘法不满足交换律等特性，通过练习题加深对运算规则的掌握，例如计算简单的矩阵乘法式子、求矩阵的转置等。向量空间与线性变换：学习向量空间的概念，包括向量的线性组合、线性相关与线性无关，掌握线性变换的定义、几何意义以及如何用矩阵表示线性变换，借助
透过生活小故事，轻松理解大模型开发的五种核心方法 java
大家好，我是大圣，今天聊一下大模型开发的几种方法。大模型开发常用方法前言人工智能的世界听起来复杂神秘，但其实它与我们的日常生活有着许多相似之处。即使你对大模型开发一无所知，也能通过生活中的简单故事，理解其中的奥秘。本文将以贴近生活的五个场景，通俗易懂地讲解大模型开发中的五种核心方法：提示词工程和外部函数、Agent设计、RAG设计（检索增强生成）、微调以及预训练。让我们一同走进这些故事，揭开大模型
AI绘画工具介绍编程小郭 ai作画
市面上AI绘画工具众多，它们利用深度学习和图像处理技术，为用户提供了丰富的创作体验和可能性。以下是对几款主流AI绘画工具的详细介绍及横向对比：一、主流AI绘画工具介绍Midjourney简介：Midjourney是一个独立的研究实验室，专注于人工智能绘图，被广泛应用于设计、艺术创作、广告制作等领域。特点：以其强大的图像生成能力和跨界融合的创新特点著称，能够根据文本描述和视觉输入生成兼具故事性与视觉
文心一言vsGPT-4全面对比编程小郭文心一言 chatgpt java python 人工智能 ai
文心一言和GPT-4都是当前非常先进的人工智能语言模型，它们各自具有独特的特点和优势。以下是对这两款工具的全面比较：文心一言是由百度开发的一款大型人工智能语言模型，它基于强大的深度学习技术和海量的数据资源，具备出色的语言理解和生成能力。文心一言在中文处理方面尤为出色，能够准确理解中文语境和语义，生成流畅、自然的中文文本。文心一言还具备丰富的知识库和推理能力，能够回答各种问题，提供有用的信息和建议。
最近，大模型岗位爆了。。。 IT猫仔人工智能学习 ai
重磅消息，国资委打响了国内AI第一枪！宣布央企将把发展AI放在全局统筹地位上，并加快建设一批智能算力中心。这意味着传统行业又迎来了一次大洗牌，这个过程需要大量AI人才！！现在国内头部人工智能公司已经开始用AI数字人助力各行各业，央企+交互数字人将成今年一整年的趋势。除此之外，知名大厂也都在布局AI市场。懂AI的程序员年薪已经翻到80w-96w!风口之下，与其焦虑被行业淘汰，不如先人一步掌握AI大模
Kimi终于开源了，联手清华开源大模型推理架构Mooncake 吴脑的键客人工智能架构人工智能
在人工智能迅速发展的时代，大型模型的智能化水平不断提升，但随之而来的推理系统效率挑战也越来越明显。如何应对高推理负载、降低推理成本、缩短响应时间，已成为业界共同面对的重要问题。Kimi公司联合清华大学的MADSys实验室，推出了基于KVCache的Mooncake推理系统设计方案，该方案于2024年6月正式发布。Mooncake推理系统通过创新的PD分离架构和以存换算为中心的理念，显著提升了推理的
基于深度学习的认知架构的AI SEU-WYL 深度学习dnn 人工智能深度学习架构
基于深度学习的认知架构的AI是一类模仿人类认知过程的人工智能系统，旨在模拟人类感知、学习、推理、决策等复杂的认知功能。认知架构的目的是创建一个能够理解和处理复杂环境、实现自我学习和适应的AI系统。结合深度学习技术，这类AI可以更好地应对动态和复杂的任务需求。1.基于深度学习的认知架构的组成一个典型的基于深度学习的认知架构包含多个关键模块：感知模块：负责从外部环境中获取数据，处理和提取特征。深度学习
人工智能：人形机器人的开发需要哪些技能？ InnoLink_1024 机器学习 AGI 人工智能人工智能机器人 ai
人形机器人的开发需要多学科、多领域的专业技能，具体如下：机械工程技能机械设计与建模：熟练掌握计算机辅助设计（CAD）软件，如SolidWorks、AutoCAD等，能够创建精确的3D模型，进行结构分析，并为制造准备详细的图纸。材料与制造工艺：了解各种材料的性质、接合技术以及制造工艺，如铣削、车削、3D打印等，根据机器人的应用场景和性能要求，选择合适的材料和制造工艺。运动学与动力学分析：深入理解运动
人工智能：人形机器人的开发需求会创造哪些热门的就业岗位？ InnoLink_1024 机器学习 AGI 人工智能人工智能机器人 ai
人形机器人的开发需求会创造以下热门的就业岗位：研发设计类机械结构工程师：负责设计人形机器人的机械本体结构，包括关节、骨架、外壳等，需要对机械原理、力学知识有深入理解，熟悉使用CAD、SolidWorks等设计软件。电子电气工程师：设计和开发人形机器人的电子电路系统，包括传感器电路、控制电路、电源电路等，需要掌握电子技术、电路设计、PCB绘制等技能。算法工程师：运动控制算法工程师：负责移动机器人运动
Python-玩转数据-数据分析之分析思维人猿宇宙数据分析 python big data
一、说明当下时代的社会生产发展，人们都开始习惯于用数据来说明某个观点和反映事物的内在规律或享用自动化和人工智能带来的便利。但这些轻松快捷的方便背后，都是相关工作者的专业流程作为源源不断的支撑。二、大数据思维自从几年前大数据开始兴起，大数据思维已经逐渐被更动的人接受，随着其进一步发展，产生了巨大的生产效果。三、数据驱动的生产力作为一个数据工程师，仅仅知道跑数据是不够的，还需要通过数据发现生产环节出现
【深入解析】棋类游戏算法：Minimax, Negamax, 蒙特卡洛树搜索与AlphaZero wit_@ ai python negamax
深入解析棋类游戏算法：Minimax,Negamax,蒙特卡洛树搜索与AlphaZero在人工智能领域，棋类游戏一直是测试和展示智能算法的经典舞台。从最早的Minimax算法到如今的AlphaZero，这些算法通过不同的方式解决了棋局中的决策问题，让计算机能够在复杂的棋局中做出合理甚至超越人类的决策。本文将详细解析几种经典的棋类游戏算法：Minimax，Negamax，蒙特卡洛树搜索（MCTS）以
什么是AI显卡，英伟达与AMD显卡的全面对比 wit_@ 人工智能 python 算法 deep learning 大数据网络
什么是AI显卡？AI显卡是专门为人工智能计算任务设计和优化的图形处理器（GPU）。相比传统显卡，AI显卡具备更强的计算能力、更高的并行处理效率以及针对深度学习、数据科学等领域的特殊硬件支持。在人工智能领域，尤其是深度学习中，训练和推理任务需要处理大量的矩阵运算，这正是GPU擅长的领域。AI显卡通过高度并行的架构，可以显著提升训练速度和模型性能，同时降低功耗和延迟。常见的AI显卡用途包括：深度学习模
详解AI大模型的主要指标与国内常见大模型对比分析 wit_@ 人工智能 AIGC 语言模型 ai 大数据服务器
AI大模型的主要指标与国内常见大模型对比分析随着人工智能技术的快速发展，大模型（LargeAIModels）在自然语言处理、计算机视觉和多模态任务中取得了突破性进展。对于选择和评价AI大模型，不仅需要关注其功能，还要理解其关键指标和性能表现。本文将详细分析AI大模型的主要评价指标，并对国内常见大模型进行具体对比，提供实际数值和深度解析。一、AI大模型的主要指标AI大模型的性能和实用性通常通过以下指
深入探索Python编程技术：从入门到精通的全方位学习指南小码快撩 python 开发语言
引言在当今信息技术飞速发展的时代，Python以其简洁优雅、功能强大、易于上手的特点，成为了众多开发者和初学者首选的编程语言。无论是数据科学、机器学习、Web开发、自动化脚本编写，还是桌面应用开发，Python都能发挥其独特优势，帮助开发者高效完成任务。本文旨在为Python学习者提供一个全面的学习路径与关键知识点概述，助您快速掌握这门强大的编程语言。一、基础语法1.变量定义与数据类型示例代码：#
Python人工智能在气象中的应用，包括：天气预测、气候模拟、降雨量和降水预测、气象数据分析、气象预警系统 xiao5kou4chang6kai4 气象气候预报天气预测气候模拟.降雨量和降水预测气象数据分析气象预警系统 python
Python人工智能在气象中有多种应用，包括：天气预测、气候模拟、降雨量和降水预测、气象数据分析、气象预警系统Python是功能强大、免费、开源，实现面向对象的编程语言，在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能，这些优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Python将成为的主流编程语言之一。人工智
深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术 wit_@ cnn python 机器学习深度学习 scikit-learn
深入了解卷积神经网络（CNN）：图像处理与深度学习的革命性技术导语卷积神经网络（CNN）是现代深度学习领域中最重要的模型之一，特别在计算机视觉（CV）领域具有革命性的影响。无论是图像分类、目标检测，还是人脸识别、语音处理，CNN都发挥了举足轻重的作用。随着技术的不断发展，CNN已经成为了解决众多实际问题的核心工具。但对于许多人来说，CNN仍然是一个相对复杂的概念，尤其是初学者可能会被其背后的数学原
从零开始的 AI Infra 学习之路 SSS不知-道 MLSys 人工智能深度学习 pytorch
从零开始的AIInfra学习之路文章目录从零开始的AIInfra学习之路一、概述二、AI算法应用2.1机器学习2.2深度学习2.3LLM三、AI开发体系3.1编程语言四、AI训练框架&推理引擎4.1PyTorch4.2llama.cpp4.3vLLM五、AI编译&计算架构5.1CUDA5.2CANN六、AI硬件&体系结构6.1INVIDIAGPU6.2AscendNPU一、概述AIInfra（AI
python 特征选择方法_【来点干货】机器学习中常用的特征选择方法及非常详细的Python实例... Blair Long python 特征选择方法
花费了很长时间整理编辑，转载请联系作者授权，违者必究。特征选择(Featureselection)是在构建预测模型的过程中减少输入变量的一个过程。它是机器学习中非常重要的一步并在很大程度上可以提高模型预测精度。这里我总结了一些机器学习中常见的比较有用的特征选择方法并附上相关python实现code。希望可以给大家一些启发。首先，我们为什么要进行特征选择呢？它有以下几个优点：减少过拟合：冗余数据常常
chatgpt赋能python：Python群发微信消息：解决方案 suimodina ChatGpt python chatgpt 微信计算机
Python群发微信消息：解决方案肆无忌惮的群发微信消息，是否是你目前所需的解决方案？如果是，那么你来对地方了。Python是一门十分强大的编程语言，广泛用于各种人工智能、计算机视觉、机器学习等领域。Python可以用于开发各种应用程序，它也可以用于批量处理和发送微信消息。本文将概述如何用Python发送微信消息。我们将介绍用Python实现微信消息的流程和步骤，并提供一些有关如何使用Python
【深度学习】Huber Loss详解小小小小祥深度学习人工智能算法职场和发展机器学习
文章目录1.HuberLoss原理详解2.Pytorch代码详解3.与MSELoss、MAELoss区别及各自优缺点3.1MSELoss均方误差损失3.2MAELoss平均绝对误差损失3.3HuberLoss4.总结4.1优化平滑4.2梯度较好4.3为什么说MSE是平滑的1.HuberLoss原理详解HuberLoss是一种结合了MSE（均方误差）与MAE（平均绝对误差）的损失函数，旨在克服两者的
【YOLOV8】YOLOV8模型训练train及参数详解小小小小祥 YOLO
介绍训练深度学习模型涉及为其提供数据并调整其参数，以便它能够做出准确的预测。UltralyticsYOLOv8的训练模式专为有效、高效地训练目标检测模型而设计，充分利用现代硬件的能力。本指南旨在涵盖使用YOLOv8强大功能集训练自定义模型所需的所有细节，帮助你快速入门。为什么选择UltralyticsYOLO进行训练？高效性：无论是单GPU设置还是跨多个GPU扩展，都能充分利用你的硬件。多功能性：
【YOLOV8】目标检测任务中应该如何选择YOLOV8n/s/m/l/x模型及输入尺寸大小小小小小祥 YOLO 目标检测人工智能
问题描述：YOLOV8作为目前主流的深度学习网络，支持图像分类、目标检测、实例分割、姿态检测、旋转目标检测等功能。对于目标检测任务官方提供了n/s/m/l/x五个模型，我们在使用YOLOV8模型进行自己任务训练时，应该如何选择YOLOV8的模型以及输入尺寸大小呢？YOLOV8官网：https://github.com/ultralytics/ultralyticsYOLOV8n/s/m/l/x信息
利用Langchain与Minimax进行自然语言处理的精彩指南 afTFODguAKBF langchain 自然语言处理 easyui python
#引言在人工智能的浪潮中，自然语言处理（NLP）成为了企业和个人用户的重要工具。Minimax作为一家中国初创企业，专注于提供优秀的语言模型服务。本篇文章将介绍如何使用Langchain库与Minimax进行交互，帮助开发者充分利用这一强大的AI工具。#主要内容##1.Minimax简介Minimax专注于自然语言处理，为企业和个人用户提供高效的语言模型服务。其API能处理多种自然语言任务，例如文
ChatGPT4.0最新功能和使用技巧，助力日常生活、学习与工作！ WangYan2022 教程人工智能 chatgpt 数据分析 ai绘画 AI写作
熟练掌握ChatGPT4.0在数据分析、自动生成代码等方面的强大功能，系统学习人工智能（包括传统机器学习、深度学习等）的基础理论知识，以及具体的代码实现方法，同时掌握ChatGPT4.0在科研工作中的各种使用方法与技巧，以及人工智能领域经典机器学习算法（BP神经网络、支持向量机、决策树、随机森林、变量降维与特征选择、群优化算法等）和热门深度学习方法（卷积神经网络、迁移学习、RNN与LSTM神经网络
人工智能OpenCV计算机视觉技术 yzx991013 OpenCV基础全集 opencv 计算机视觉人工智能
5.3cand可调节边缘检测完整代码：importcv2importnumpyasnp#载入图像，并处理可能的读取错误img_original=cv2.imread('./image/lena.jpg')ifimg_originalisNone:print("无法读取图像文件")raiseSystemExit#创建可调整大小的窗口cv2.namedWindow('Canny',cv2.WINDOW
ASPICE 4.0引领自动驾驶未来：机器学习模型的特点与实践亚远景aspice 机器学习自动驾驶人工智能
ASPICE4.0-ML机器学习模型是针对汽车行业，特别是在汽车软件开发中，针对机器学习（MachineLearning,ML）应用的特定标准和过程。ASPICE（AutomotiveSPICE）是一种基于软件控制的系统开发过程的国际标准，旨在提升软件开发过程的质量、效率和可靠性。ASPICE4.0中的ML模型部分则进一步细化了机器学习在汽车软件开发中的具体要求和流程。以下是对ASPICE4.0-
深入解读ChatGPT的工作原理及底层逻辑 NAR_鱼丸 ChatGPT 程序人生
ChatGPT的工作原理和底层逻辑可以从多个方面进行解读，主要包括其基本原理、核心技术、训练过程以及应用能力。工作原理涉及了深度学习模型、自然语言处理技术和文本生成算法等多个方面。通过预训练和微调，模型能够理解语言的语法和语义，并能够根据上下文生成符合语境的文本回复。基本原理ChatGPT是一种基于自然语言处理（NLP）和深度学习技术的聊天机器人。其基本原理是使用大量文本数据来训练深度神经网络模型
python中tensorflow_python机器学习TensorFlow框架弦歌缓缓
TensorFlow框架关注公众号“轻松学编程”了解更多。一、简介TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统，其命名来源于本身的运行原理。Tensor(张量)意味着N维数组，Flow(流)意味着基于数据流图的计算，TensorFlow为张量从流图的一端流动到另一端的计算过程。TensorFlow是将复杂的数据结构传输至人工智能神经网中进行分析和处理过程的系统
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分