RK_Dangerous

【深度学习】计算机视觉（二）——认识和基础（下）

文章目录

step4：深度学习和计算机视觉基础
- 图像表示
- 图像分类——得分函数
- 分类评价——损失函数
- 结果概率——Softmax分类器
- 反向传播——梯度下降法
- - 梯度下降法
  - 链式法则
- 分类器【核函数待补充】
step5：神经网络部分详解
- 神经网络基础
- 激活函数
- - 常用的激活函数
  - 激活函数与反向传播
- 过拟合问题
- - 惩罚力度对结果的影响
- 损失函数（成本函数）
step6：深度学习与神经网络概念

step4：深度学习和计算机视觉基础

对深度学习有了一个基本的了解，通过学习python库也掌握了很多矩阵的处理方法，但还是无法将计算机处理图片的过程理解清楚。图片和矩阵有什么关系？具体怎么处理图片呢？

图像表示

在计算机中，一张图片被表示成三维数组的形式，每个像素的值从0到255，从0到255值越高图像越明亮。
若有一张图片格式为300*100*3，表示图片的高为300，宽为100，通道为3（最常见的jpg图像的RGB就是三个通道，可以从图片调色的角度去理解通道）。就以RGB通道的图像为例，这是我理解的图片数组的存储形式：

图像分类——得分函数

对图像分类用到得分函数，它是一个线性函数f(x) = W * x + b，函数的输入x是图片存储在计算机中的数组（以下简称图片），输出是该图片对应每个标签的得分，W表示标签的权重，b是偏移量。
文字有些抽象，举个例子，例如对一个32*32*3的图像作5分类（5个类别的标签分别为：小狗、小猫、小兔、小鸡、小猪）。

我们知道32x32x5的矩阵有5120个元素，将三维矩阵展开为1x5120的列矩阵，作为x。对于每个像素块，它对于图片分类的影响是不一样的，例如背景部分的像素块权重应该很小，而物体部分的像素块对图像分类的影响很大，因此，每个像素块都有对应的权重，也就是说需要5120个权重值，我们把它展开为5120x1的行矩阵，作为W。由矩阵的乘法得到：

注意，“得分”理解为图片被分为某一类的分值，总共有多少类别，就要进行多少次乘法。可以直接放在一个矩阵里一次性计算：

这样就得到了该图片每个类别的得分。但是由于某些影响，结果可能不是w*x这么简单，需要通过偏移量b来调整，所以每个标签的最终得分需要再加上bi：

对于W中的值，如果是正数表示对分为该类别具有积极影响，是负数表示对分为该类别具有抑制作用；若数值越大表示影响越大，若数值越小（近似于0）表示该像素对图片的分类不起作用。
这些数据从何而来？
x是经过预处理之后得到的，没什么疑问。而W和b最初可以是任意的，可能得到很离谱的结果，我们需要通过不断地学习去更新W和b的值，从而使结果越来越精确。

分类评价——损失函数

对于不断更新W和b得到方案，如何去评价分类的好坏，衡量分类的结果？根据数学思维，单纯的"好"与"不好"去评价显然是不太严谨和服众的，我们需要数值去直观地评价——利用损失函数。一般不同的分类任务损失函数是不同的。
举个例子：这是三分类得到的某次结果

定义损失函数为：

对于图片i，我们已知它的实际标签（人为确认的），那么yi就是这个图片这个标签对应的结果，j表示该图片其他标签的结果。例如对于第一个小鸡图片，那么yi就是"小鸡"的结果3.2，sj有两个，分别是5.1和-1.7。损失函数的值越大，表示我们的错误越离谱。 我们观察这个式子，如果sy大于sj，即正确类别的得分比错误类别的得分高，那么sj-sy小于0（先忽略后面的+1），max取0表示这里暂时没有发生错误，然后每一个错误类别都计算后加和。加1是防止当错误分类的得分只比正确分类小一点点，此时认为是正确分类，有一定的巧合性在，相当于容忍程度，+1使得sj和sy必须相差较大才满足条件。
计算结果如下：

# 图1：
"""
L1
= max(0, 5.1-3.2+1) + max(0, -1.7-3.2+1)
= max(0, 2.9) + max(0, -3.9)
= 2.9 + 0
= 2.9
"""

# 图2：
"""
L2
= max(0, 1.3-4.9+1) + max(0, 2.0-4.9+1)
= max(0, -2.6) + max(0, -1.9)
= 0 + 0
= 0
"""

# 图3：
"""
L3
= max(0, 2.2-(-3.1)+1) + max(0, 2.5-(-3.1)+1)
= max(0, 5.3) + max(0, 5.6)
= 5.3 + 5.6
= 10.9
"""

注意损失函数的设置不能过于关注局部，否则会产生"过拟合"。类似于上式中+1的作用，我们一般会在损失函数中再添加一项"正则化惩罚项"λR(W)，只考虑权重参数对模型的影响，而与数据无关。即损失函数=数据损失+正则化惩罚项。其中，R(W)为所有w的平方和：

λ是一个比例系数，越大表示越不希望过拟合（过拟合就是某几个权重特别特别大，会对结果有决定性的影响作用，我们一般不希望模型太复杂，希望权重分配地比较平均。神经网络是十分强大的，所以我们往往不需要考虑如何让它变得更强）。
算出测试集的每个损失函数求平均值即为该模型的总损失函数。

结果概率——Softmax分类器

之前使用得分函数可以得到每个图片对应每个标签的得分，不够直观，我们希望得到它可能被正确分类的概率。
以小鸡图片的某次结果为例，先使用exp(x)函数将得分进行转化：

exp(x)能在保持偏序关系下放大差距，且是一一映射。
这样得到的数值可以之间根据比例得到它对应的概率。例如被分为小鸡的概率是24.5 / （24.5 + 164.0 + 0.18） = 0.13。
注意在编程时防止exp(x)溢出，可以在x后面加一个常数控制。
归一化之后，我们再去求它的损失就更公平了。由于我们只关心被正确分类的概率，即被分类为小鸡的概率肯定是越高越好，即越接近1越好。用log(p)表示损失，p在0-1之间，当p越来越接近1，损失越接近0；p越小损失越大（底数的选取不影响模型的比较）。为什么选取这个函数？可以理解为我们用指数函数进行一系列的变化，再用对数函数变回去（它们是反函数）。

因为log(p)的值是负数，所以在计算损失时还需要加上负号把损失的数值变为正数。

反向传播——梯度下降法

以上就是识别和分类的主要过程（前向传播），之前说过W和b是要更新的，如何更新就用到了反向传播。

梯度下降法

先以f(x)=x²为例：

我们很容易通过求导或者图像得到函数的最小值。如何使用梯度下降法找到函数的最小值呢？

梯度下降法是用来计算函数最小值的。它的思路很简单，想象在山顶放了一个球，一松手它就会顺着山坡最陡峭的地方滚落到谷底。如果运用梯度下降法的话，就可以通过一步步地滚动最终来到谷底，也就是找到了函数的最小值。

为了方便后面的学习，我找到了高数书上关于梯度的解释。

我的理解：梯度是一个向量，以曲面为例，在空间坐标系xyz中，梯度被分解到x和y上，合成的向量的方向就是曲面变化最快的那个方向，而值就是变化率。
还是以f(x)=x²为例，假设起点在x0 = 10处，也就是将球放在这里。

它的梯度是一维向量，在x轴方向：

正数表示它指向函数值增长最快的方向（那我们可以给梯度加一个负号得到的向量指向函数值减小最快的方向）：

将x0也看成向量，就可以进行向量的运算啦。通过和-∇f(x0)相加，得到新的向量x1，表示移动了一段距离。

其中，ɳ称为步长，通过它可以控制移的动距离。这里设置ɳ=0.2，则：

表示小球走到了x1 = 6的位置。看下图红色标注部分更容易理解梯度的概念，它这里是在x轴上的方向，梯度的维度是图像在坐标轴的投影，黄色虚线是小球在函数曲线上梯度下降的结果，不要混淆。

接下来再计算x1的梯度为12，仍以步长0.2向梯度的反方向走到x2 = 3.6处。以此类推，小球不断下落，横坐标（沿着梯度的方向）逐渐靠近最低点。

观察每一次梯度下降的模长||∇f(x)||是逐渐减小的，因此称这种方法叫做梯度下降法。由于最终梯度趋于0，那么解出的就是接近于最小值。
之前说到了步长用来控制每次移动的距离，不同的步长对结果也有很大的影响。我们设置的0.2是比较合适的，经过大概10次迭代就可以接近最小值。
如果设置步长太小，如ɳ=0.01，迭代 20 次后离谷底还很远，实际上 100 次后都无法到达谷底：

如果设置步长太大，如ɳ=1，这个时候会在两个点来回震荡：

继续加大步长，如ɳ=1.1，反而会越过谷底，不断上升：

类比三维图像，以下面的函数为例：

设初始点p0=(-3.5, -3.5)，步长为0.1，则梯度为(-7, -14)，朝梯度的反方向走下一个点p1为(-2.8, -2.1)。经过20次迭代基本上到达最低点。（附函数等高线示意图，中心点为曲面最低点）

至此，我对于梯度下降基本理解透彻了。但是我一直有一个疑问，就是对于复杂函数有多个极值点时，我们怎么确认它就是最小值呢？根据我查询资料发现，这正是梯度下降的痛点之一。

梯度下降有两大痛点：

基于梯度下降训练神经网络时，我们将冒网络落入局部极小值的风险，网络在误差平面上停止的位置并非整个平面的最低点。这是因为误差平面不是内凸的，平面可能包含众多不同于全局最小值的局部极小值。
此外，尽管在训练数据上，网络可能到达全局最小值，并收敛于所需点，我们无法保证网络所学的概括性有多好。这意味着它们倾向于过拟合训练数据。

如何解决和优化？毕竟这只是学习的开始，对梯度下降法有清晰的了解已经足够了，关于局部最小值和过拟合的处理我在后面进行进一步学习。

链式法则

反向传播是逐层进行的，梯度是一步步传的。就是在神经网络当中，由于W非常复杂，我们可能先聚焦某一部分特征，再一步一步添加条件，形如[(x*W1)W2]W3···。我们不能直接将W合并，需要一层一层解决。
这里用到一个复合函数求偏导的知识，称为链式法则。

链式法则是微积分中的求导法则，用于求一个复合函数的导数，是在微积分的求导运算中一种常用的方法。复合函数的导数将是构成复合这有限个函数在相应点的导数的乘积，就像锁链一样一环套一环，故称链式法则。

比如在函数f(x,y,z)=(x+y)z中，由于x和y在函数中较为复杂，不直接构成f，所以可以添加一个中间变量p=x+y，则函数变为f=p·z。此时再求偏导，使用链式法则，以x为例：

具体怎么传后续再继续学习。

分类器【核函数待补充】

通过得分函数，我们可以得到物体对应每个标签的得分。例如下图是由三张图片得到的分别对应三个标签的得分：

1. Softmax分类器

我们如何确定该物体属于哪一类？这就要使用分类器。前面已经讲过，可以利用Softmax分类器计算出物体对应每个标签的概率，选择最大概率（最大得分）作为物体的分类，同时还可以得到物体属于某一类别的概率。softmax可以直接端到端地训练分类，比较常用，但是注意类别数太多会崩。

2. SVM分类器

支持向量机(Support Vector Machine, SVM)，主要用于解决模式识别领域中的数据分类问题，属于有监督学习的一种。注意：SVM需要训练。

线性核SVM：一般应用于多分类。
非线性核SVM：一般应用于二分类问题。

支持向量机是从两类线性可分情况下的最优分类超平面中提出的，所谓最优分类超平面是指分类超平面不但能将两类数据样本无错误地分开，而且要使两类数据样本的分类间隔最大。这样可以保证获得的分类器既能很好地区分训练集中的数据样本，也能对未知类标号的数据样本有很好的泛化能力。

所谓分类间隔（margin）如图，假设分类超平面为H，H1和H2分别为通过两类数据样本中离分类超平面最近的点并且平行于分类超平面的平面，则H1和H2之间的距离叫做分类间隔，ω称为分类超平面H的法向量。

每个分类超平面（决策面）对应了一个线性分类器。我们可以把多分类问题化成多个二分类问题，对于每一个二分类问题都设置一个决策面。例如“小鸡、小兔、小狗”的三分类问题，我们可以分成3个二分类问题：“是/否属于小鸡”、“是/否属于小兔”、“是/否属于小狗”。

我们要找到一个最优分类超平面，即分类间隔最大，如何求出分类间隔以及最大的分类间隔？以二维空间举例，x1和x2是在超平面H1和H2上的两个向量，如图：

我们根据优化目标——使分类间隔最大，训练分类器参数，使得ω最小，等价为使得1/2 * ||ω||² 最小。

上述是训练集线性可分的理想情况，若训练集线性不可分，即无法完全恰好地用线性平面分类，则引入松弛变量ε：

松弛变量的作用是在数据集线性不可分时，使分类超平面更加鲁棒。惩罚参数C是某个指定的常数，实现控制错分样本的比例与算法复杂度之间的折中，C越大时对误分类的惩罚越大。

对于上述最小化的约束优化问题，可以通过构造Lagrange函数转化为它的对偶问题（最大化的约束优化问题），约束条件、优化目标、Lagrange构造过程、最优分类函数等暂略（公式详见我的书P126-P127）。

若原始特征空间中的分类问题是非线性的，可以通过某种非线性变换将原始特征空间中的非线性分类问题转换为一个高维空间中的线性分类问题，从而在新的空间中求取最优分类超平面。通过定义核函数 K(xi, xj) = φ(xi) · φ(xj)来实现，影射函数φ将训练样本影射到新的空间。常用的核函数以及核函数的原理暂略。

step5：神经网络部分详解

神经网络基础

首先需要了解以下五个概念：

神经元（Neuron）

就像形成我们大脑基本元素的神经元一样，神经元形成神经网络的基本结构。想象一下，当我们得到新信息时我们该怎么做。当我们获取信息时，我们一般会处理它，然后生成一个输出。类似地，在神经网络的情况下，神经元接收输入，处理它并产生输出，而这个输出被发送到其他神经元用于进一步处理，或者作为最终输出进行输出。

权重（Weights）

当输入进入神经元时，它会乘以一个权重。例如，如果一个神经元有两个输入，则每个输入将具有分配给它的一个关联权重。我们随机初始化权重，并在模型训练过程中更新这些权重。为零的权重则表示特定的特征是微不足道的。

偏差（Bias）

偏差是除了权重之外，另一个被应用于输入的线性分量被称为偏差。它被加到权重与输入相乘的结果中。基本上添加偏差的目的是来改变权重与输入相乘所得结果的范围的。这是输入变换的最终线性分量。

激活函数（Activation Function）

一旦将线性分量应用于输入，将会需要应用一个非线性函数。这通过将激活函数应用于线性组合来完成。激活函数将输入信号转换为输出信号。应用激活函数后的输出为f(a * W1 + b)，其中f()就是激活函数。

神经网络（Neural Network）

神经网络的目标是找到一个未知函数的近似值。

以上就是神经网络的五个重要概念。因为神经网络是一种仿生模型，我们可以从生物的角度去更好地理解：

一个神经元，是一个可以发射、接收脉冲信号的细胞。在细胞体有树突和轴突，树突接收其他神经元的脉冲信号，轴突将神经元的输出脉冲传递给其他神经元。一个神经元传递给不同神经元的输出是相同的，并且在突触部分发生信息的交换传递。无数个生物神经元的组合就形成了生物神经网络。

这样就比较好地将之前学的知识很好地串联起来。

宏观地看，神经网络还需要了解以下概念：

输入/输出/隐藏层（Input / Output / Hidden Layer）

输入层是接收输入那一层，本质上是网络的第一层。而输出层是生成输出的那一层，也可以说是网络的最终层。处理层是网络中的隐藏层。这些隐藏层是对传入数据执行特定任务并将其生成的输出传递到下一层的那些层。输入和输出层是我们可见的，而中间层则是隐藏的。

MLP（多层感知器）

单个神经元将无法执行高度复杂的任务。因此，我们使用堆栈的神经元来生成我们所需要的输出。在最简单的网络中，我们将有一个输入层、一个隐藏层和一个输出层。每个层都有多个神经元，并且每个层中的所有神经元都连接到下一层的所有神经元。这些网络也可以被称为完全连接的网络。

正向传播（Forward Propagation）

正向传播是指输入通过隐藏层到输出层的运动。在正向传播中，信息沿着一个单一方向前进。输入层将输入提供给隐藏层，然后生成输出。这过程中是没有反向运动的。

成本（损失）函数（Cost Function）

当我们建立一个网络时，网络试图将输出预测得尽可能靠近实际值。我们使用成本/损失函数来衡量网络的准确性。在运行网络时的目标是提高我们的预测精度并减少误差，从而最大限度地降低成本。最优化的输出是那些成本或损失函数值最小的输出。而成本或损失函数会在发生错误时尝试惩罚网络。

梯度下降（Gradient Descent）

梯度下降是一种最小化成本的优化算法。我们从一个点x开始，我们向下移动一点，即Δh，并将我们的位置更新为x-Δh，并且继续保持一致，直到达到底部。

学习率（Learning Rate）

学习率我理解就是梯度下降法中说的步长。

学习率作为监督学习以及深度学习中重要的超参数，其决定着目标函数是否能收敛到局部最小值以及何时收敛到最小值。合适的学习率能够使目标函数在合适的时间内收敛到局部最小值。它指导我们在梯度下降法中，如何使用损失函数的梯度调整网络权重的超参数。
简单来说，我们下降到成本函数的最小值的速率是学习率。我们应该非常仔细地选择学习率，因为它不应该是非常大的，以至于最佳解决方案被错过，也不应该非常低，以至于网络需要融合。

反向传播（Backpropagation）

当我们定义神经网络时，我们为节点分配随机权重和偏差值。一旦我们收到单次迭代的输出，我们就可以计算出网络的错误。然后将该错误与成本函数的梯度一起反馈给网络以更新网络的权重。最后更新这些权重，以便减少后续迭代中的错误。

是否可以理解为，神经网络宏观是正向传播的，但是在训练的过程中，需要无数个反向传播来实现。也可以理解为正向传播 + 反向传播 = 一个周期。

批次（Batches）

在训练神经网络的同时，不用一次发送整个输入，我们将输入分成几个随机大小相等的块。与整个数据集一次性馈送到网络时建立的模型相比，批量训练数据使得模型更加广义化。

周期（Epochs）

周期被定义为向前和向后传播中所有批次的单次训练迭代。这意味着1个周期是整个输入数据的单次向前和向后传递。
你可以选择你用来训练网络的周期数量，更多的周期将显示出更高的网络准确性，然而，网络融合也需要更长的时间。另外，你必须注意，如果周期数太高，网络可能会过度拟合。

丢弃（Dropout）

Dropout是一种正则化技术，可防止网络过度拟合套。顾名思义，在训练期间，隐藏层中的一定数量的神经元被随机地丢弃。这意味着训练发生在神经网络的不同组合的神经网络的几个架构上。你可以将Dropout视为一种综合技术，然后将多个网络的输出用于产生最终输出。

批量归一化（Batch Normalization）

就是在深度神经网络训练过程中使得每一层神经网络的输入保持相同分布的。

在学习以上的知识时，我有非常大的困惑，我觉得学的东西都很散，组装不起来。对我来说基础知识没有打好，我是没有心情和信息去进行更近一步地学习的，我需要知其然并且知其所以然。所以下面就是细节的学习和解惑，详细地学习每一个模块在整体中的作用。

激活函数

还是这张图片，细胞体的工作应该就是【得分函数】，那么已经算出来得分了，激活函数又是什么东西？在学习前先了解一下感知机：

感知机是一个有监督的学习算法。
感知机是一个二分类的线性模型，其输入是实例的特征向量，输出的是实例的类别，属于判别模型。

感知机相当于轴突，当细胞体计算出的得分函数大于某一阈值，会产生一个输出，详见下图，例如我们设置阈值为0，若得分大于0将y赋值为1，否则赋值为0，实现了以得分为依据的分类。

大致了解感知机之后，我们看激活函数。仍以上面感知机为例，激活函数可以理解为将感知机写成如下形式：

其中h(x)就是激活函数，将输入信号的总和转换为输出信号。我可以这样理解，激活函数的作用就是评价得分，将其格式化成后续需要的值。

激活函数的作用：在于决定如何来激活输入信号的总和

上面说到的感知机的激活函数就是一个阶跃函数，它以阈值为界，一旦输入超过阈值，就切换输出。
特别要注意神经网络的激活函数必须使用非线性函数。为什么呢？我们之前说过W不是一步到位的，我们把神经网络分为很多层，形如[(x*W1)W2]W3···，这些都是隐藏层。

如果激活函数为线性函数，不管如何加深层数，总是存在与之等效的“无隐藏层的神经网络”。比如激活函数h(x)=cx+t，我们有一个三层的神经网络y=h(h(h(x)))，计算得到y=c³x+c²t+ct+t，本质上这个函数还是y=ax+b的形式。
学完了激活函数之后，我们就知道神经网络的结构其实是这样的：

每一层隐藏层中都有激活函数起作用。

真实世界中的大多数系统是非线性的，若要模拟复杂系统，则必须借助非线性的激活函数。
根据通用近似定理(universal approximation theorem)，神经网络至少需要一层隐藏层和足够的神经元，利用非线性的激活函数，便可以模拟任何复杂的连续函数。

常用的激活函数

最常用的激活函数就是Sigmoid，ReLU和softmax

Sigmoid
Sigmoid是最常用的激活函数之一，它被定义为：

观察函数图像，我们与阶跃函数对比：

Sigmoid变换产生一个值为0到1之间更平滑的范围。我们可能需要观察在输入值略有变化时输出值中发生的变化。光滑的曲线使我们能够做到这一点，因此优于阶跃函数。
另外要注意，sigmoid函数会产生一种梯度消失现象。在函数值趋近于0时，即梯度为0，梯度不再进行传播和更新。
ReLU（整流线性单位）
最近的网络更喜欢使用ReLu激活函数来处理隐藏层。该函数定义为：

当X>0时，函数的输出值为X；当X<=0时，输出值为0。函数图如下图所示：

使用ReLU函数的最主要的好处是对于大于0的所有输入来说，它都有一个不变的导数值。常数导数值有助于网络训练进行得更快。此外，在使用sigmoid函数反向传播时，很容易就会出现梯度消失的情况，从而无法完成深层网络的训练，但ReLU不存在饱和问题，它在x>0的时候能够保持梯度不衰减，从而缓解梯度消失问题。随着训练的推进，部分输入小于0会导致权重无法更新（这种现象被称为“神经元死亡”），这样就造成了网络的稀疏性，并且减少了参数的相互依存关系，缓解了过拟合问题的发生。

Softmax
Softmax激活函数通常用于输出层，用于分类问题，在之前【结果概率——Softmax分类器】部分讲过它的原理。它与sigmoid函数是很类似的，唯一的区别就是输出被归一化为总和为1。
假设你正在尝试识别一个可能看起来像8的6。该函数将为每个数字分配值如下。我们可以很容易地看出，最高概率被分配给6，而下一个最高概率分配给8，依此类推……
Tanh
该函数定义为：

它的输出值落于-1到1的连续区间，一定程度上缓解了梯度消失，但是当输入较大或较小时，输出几乎是平滑的并且梯度较小，不利于权重更新。因为执行指数运算，所以存在计算量大的问题。
在一般的二元分类问题中，tanh激活函数函数常用于隐藏层，sigmoid用于输出层，但这并不是固定的，需要根据特定问题进行调整。
Leaky-ReLU
该函数定义为：

它在ReLU的基础上，给负数区间添加一个较小斜率的线性部分，使负数区间也能产生梯度调整值。
ELU
该函数定义为：

例如当α=1时，函数图像为：

ELU满足两个条件：一是输出的分布是零均值的，可以加快训练速度；二是激活函数是单侧饱和(一端无限接近0)的，可以更好的收敛。但是ELU的速度会慢一些。

————————————————————————————————————————————————————————————
注释：

零均值就是数据分布的均值约等于0。零均值化就是将一组数据，其中每一个都减去这组的平均值。例如，对[1、2、3、4、5]零均值化，先算出其均值为3，然后每一个数都减去3，得到[-2、-1、0、1、2]，就实现了零均值化。

这样做的优点是为了在反向传播中加快网络中每一层权重参数的收敛。可以避免Z型更新的情况，这样可以加快神经网络的收敛速度。

再详细解释一下Z型更新。以sigmoid函数为例：

假设我们的权重W是由W1和W2组成的。根据链式法则，在反向传播时，有：

其中f(x)是激活函数（这里是sigmoid）。我们接下来需要看这个公式的符号。损失函数对于f(x)的导数与W1和W2无关，这里仔细想想，也就是说在某一组Wi构成的f(Wx+b)中，∂L/∂f可能是正数也可能是负数，因为是W1和W2共同构成的，所以∂L/∂W1和∂L/∂W2中的∂L/∂f一定是同号的。然后我们再看∂f/∂W，（这里别人的推导我没看懂，因为涉及到矩阵的计算，我的思路可能不太对，欢迎指正）根据链式法则，∂f/∂W=∂f/∂(Wx+b) * ∂(Wx+b)/∂W,结合上面的导数图像可知∂f/∂(Wx+b)恒为正，而∂(Wx+b)/∂W的符号又取决于x，x恒为正（第一层的输入恒为正是因为像素取值范围在0-255，后面隐藏层的输入恒为正是因为激活函数sigmoid使输出恒为正）。也就是说∂L/∂W1和∂L/∂W2一定是同号的，要么都是正数要么都是负数，这取决于∂L/∂f的符号。

这就是Z型更新的现象。你可以发现它在趋近最优解的过程中，W1和W2的每次更新方向都是一致的，要么同时增加，要么同时减小。在同时增加的过程中，轨迹上扬，横坐标解近最优解但是竖坐标却距离最优解更远；在同时减小的过程中，竖坐标解近最优解但是横坐标却距离最优解更远。因此我们认为它是走了弯路的，所以更新的慢。如果我们零均值化后，W1和W2可能一正一负，从而能够一起朝着距离最优解更近的方向前进。至于它是怎么做到的，我认为暂时还没有必要去研究（因为真的找不到比较深入的教程，学起来耗时耗力，现阶段最重要的是初步学习，但如果有好心人愿意教一下我就更好了）。
————————————————————————————————————————————————————————————

总结——激活函数的选择

在隐藏层使用一般情况推荐的顺序：
ReLU/Leaky-ReLU > ELU > Tanh > Sigmoid
输出层激活函数的选择————以业务要求为导向：
①二分类问题（例如判断物体是否是猫猫）：使用sigmoid函数返回概率。
②多分类问题（返回物体是每个类别的概率）：使用softmax函数，概率总和为1。
③线性回归问题（预测绝对数值，例如身高、GDP）：直接使用线性函数。

激活函数与反向传播

在我的理解中，反向传播肯定是对一个损失函数去使用梯度下降的方法处理，找到损失函数的最小值。上面关于激活函数的学习中，很多次说到了激活函数会存在“梯度消失”的情况。激活函数是如何影响到反向传播的？
之前在讲反向传播的学习到了链式法则，给了我很大的启发。

在损失函数L(x)中，得到的输出是y6，所以我们计算得到损失为L(y6)，其中自变量是W和b。那么我们要得到函数图像L(y6)的最低点，可以使用梯度下降法对它求偏导。根据链式法则，我们可以把损失函数对W求偏导分解得到一个y6对W求偏导，而y6又可以向下概括……最终每一个激活函数h(x)都对求梯度起到了作用。学到这里，我更深刻地认识到神经网络真的是一层一层的。

过拟合问题

一直在说的"过拟合"究竟是什么？大概来说，过拟合是由于过分拟合了训练样本，而导致模型的泛化能力较差。有几个弹幕发言特别好理解：“我理解过拟合就是把训练集背下来了，而忽略了样本之间的内在关联。就跟平时背题会做，考试时换一道题就不会了”，还有"学的钻牛角尖了，然后就不会触类旁通了。"

惩罚力度对结果的影响

之前在损失函数部分说过，我们一般会在损失函数中再添加一项"正则化惩罚项"λR(W)，λ是一个比例系数，越大表示越不希望过拟合。

惩罚力度越小，训练出来的W可能更不均衡，会出现过拟合的现象。对于较大的λ边界更光滑，虽然在训练集中也存在一些错误，但是能够很好地应用。（不太清楚上图中这些数据点代表什么，可能是以特征值为坐标描出来的点。）

损失函数（成本函数）

之前了解到了损失函数的作用和在整个神经网络中的位置，那我就好奇，我们是必须选择市场上已有的损失函数吗？或是可以自己设计？那么如何设计呢？

最小二乘法
最小二乘法是比较简单的一种。将神经网络判断的结果，与标签标记的真实结果比较，把所有的差值都加起来。

由于计算梯度要对损失函数求导，绝对值求导很不方便，所以可以给它加一个平方。既然已经做了一些改变，那就干脆变得更简单，加一个系数1/2这样就可以在求导的时候把2约掉。得到以下损失函数：

同上，我们可以将成本函数定义为均方误差，写为：C= 1/m ∑(y–a)^2，其中m是训练输入的数量，a是预测值，y是该特定示例的实际值。
极大似然估计法
极大似然估计法（也称最大似然估计法），要求的就是似然函数的最大值。似然函数表示为：

其中C表示可能出现的结果，θ表示某一前提条件（决定了结果概率的属性）。当θ是一个固定值的时候，把所有C的可能取值都考虑进来，把它们对应的概率值加起来，最后的结果是归一的（但是注意θ不是归一的）。
例如有一枚质地不均匀的硬币，我们抛了10次，出现的结果为3次反面朝上、7次正面朝上。我们已知结果如何计算硬币质地的分布？即我们如何判断下一次抛硬币得到正反面的可能性？经验告诉我们，下一次抛硬币70%的可能性是正面朝上，30%的可能性是反面朝上，但是毕竟是经验，不具有说服性。我们接下来要验证一下。将问题化简，我们假设硬币质地正反面比例可能为9种情况：θ1=(1, 9), θ2=(2, 8), θ3=(3, 7), θ4=(4, 6), θ5=(5, 5), θ6=(6, 4), θ7=(7, 3), θ8=(8, 2), θ9=(9, 1)，抛10次硬币正反面次数可能出现11种情况：c1=(0, 10), c2=(1, 9), c3=(2, 8), c4=(3, 7), c5=(4, 6), c6=(5, 5), c7=(6, 4), c8=(7, 3), c9=(8, 2), c10=(9, 1), c11=(10, 0)，我们需要计算出在每种θ下得到c8=(7, 3)即“抛了10次，出现的结果为3次反面朝上、7次正面朝上”的可能性。

计算得到：

为了直观一点我绘制了一个折线图，可以看到，在θ7=(7, 3)处的值最大，也就是说已知结果为(7,3)时，最有可能的情况就是似然函数最大的位置。
学习完最大似然估计法的概念，如何运用到神经网络中？还是抛硬币的例子，可以把问题理解为我们已知抛了10次的结果C8，要求一个最可能的θ，那么在神经网络中，10次抛硬币的结果就对应数据集，θ对应W和b，我们要求的就是似然函数最大值时W和b的结果。我参考的文章是解析吴恩达视频中的似然函数，但是似然函数的表达式推导我没有看懂。
在似然函数中用对数能够简便计算，为什么要用对数运算呢？因为log函数是单调递增的，对原函数的值取对数，当原函数取到最大值时，值的对数函数也相应取到了最大值，不会影响我们求自变量。例如：

在这个式子中，我们抛了100次硬币，有60次都是正面，你会发现计算概率时的系数不见了，因为它不影响函数的图像，所以可以不把它写出来。对函数两边同时取对数：

我们要求最大值，就是求导数为0的情况：

利用对数函数，我们求导时不必再面对庞大的指数。
都说了我们这个叫做损失函数，往往都是求最小值，这个怎么求最大值？我的疑惑很好解决，其实面对最优化问题求最值时，确实更习惯求最小值，所以可以在函数前面加一个负号。

step6：深度学习与神经网络概念

此处作为后续学习的铺垫，有一些比较杂的知识总结在这里，可能会存在一些学习顺序的先后问题，可以在后面学习遇到问题时查阅。

1. backbone：

主干网络（大多时候指的是提取特征的网络），其作用就是提取图片中的信息，共后面的网络使用。这些网络经常使用的是resnet、VGG等，而不是我们自己设计的网络，因为这些网络已经证明了在分类等问题上的特征提取能力是很强的。在用这些网络作为backbone的时候，都是直接加载官方已经训练好的模型参数，后面接着我们自己的网络。

2. head：

head是获取网络输出内容的网络，利用之前提取的特征，head利用这些特征，做出预测。

3. neck：

neck是放在backbone和head之间的，是为了更好的利用backbone提取的特征。

4. bottleneck：

瓶颈的意思，通常指的是网络输入的数据维度和输出的维度不同，输出的维度比输入的小了许多，就像脖子一样变细了。经常设置的参数 bottle_num=256，指的是网络输出的数据的维度是256 。

5. Warm up：

Warm up指的是用一个小的学习率先训练几个epoch，这是因为网络的参数是随机初始化的，一开始就采用较大的学习率容易数值不稳定。

参考来源：

我居然3小时学懂了深度学习神经网络入门到实战，多亏了这个课程，看不懂你打我！！
什么是梯度下降法？
3.深度学习灵魂-神经网络之激活函数
06.激活函数relu
28.前向传播，反向传播和链式法则
激活函数及其选择
激活函数Tanh
什么是零均值？什么是零均值化？
归一化、标准化、零均值化作用及区别
“损失函数”是如何设计出来的？直观理解“最小二乘法”和“极大似然估计法”
如何通俗的理解最大似然估计法
监督学习与无监督学习
深度学习中backbone、head、neck等术语解释
关于深度学习中的分类器汇总，模型对类别概率计算输出代码。
分类器优缺点比较

【欢迎指正】

你可能感兴趣的:(笔记,计算机视觉,深度学习,人工智能)

C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
入门html这篇文章就够了 ξ流ぁ星ぷ132 html 前端
HTML笔记文章目录HTML笔记html介绍什么是htmlhtml的作用HTML标签介绍常用标签标签and标签and标签u标签del删除线br标签用于换行pre标签，预处理标签span标签div标签sub标签andsup标签hr标签h1,h2...h6标签：HTML5中的语义标签：特殊字符img标签a标签第一种用法：超链接第二种用法：锚点video标签表格标签：form标签input标签selec
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
vue3面试题(个人笔记) 武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
vue3比vue2有什么优势？性能更好，打包体积更小，更好的ts支持，更好的代码组织，更好的逻辑抽离，更多的新功能。描述Vue3生命周期CompositionAPI的生命周期：onMounted()onUpdated()onUnmounted()onBeforeMount()onBeforeUpdate()onBeforeUnmount()onErrorCaptured()onRenderTrac
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
swagger【个人笔记】撰卢笔记 java
文章目录swagger导入mave坐标在配置类(WebMvcConfiguration)中加入knife4j相关配置设置静态资源映射，主要是让拦截器放行swagger常用注解@Api(tags="\[描述这个类的作用]")@ApiModel(description="\[描述这个类的作用]")@ApiModelProPerty("描述这个类的作用")@ApiOperation("\[描述方法的作用
【个人笔记】负载均衡撰卢笔记负载均衡运维
文章目录nginx反向代理的好处负载均衡负载均很的配置方式均衡负载的方式nginx反向代理的好处提高访问速度进行负载均衡保证后端服务安全负载均衡负载均衡，就是把大量的请求按照我们指定的方式均衡的分配给集群中的每台服务器负载均很的配置方式upstreamwebservers{server192.168.100.128:8080server192.168.100.129:8080}server{lis
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
5G标准学习笔记14 - CSI--RS概述刘孬孬沉迷学习 5G 学习笔记信息与通信
5G标准学习笔记14-CSI–RS概述大家好~，这里是刘孬孬，今天带着大家一起学习一下5GNR中一个非常非常重要的参考信号------------------CSI-RS信号，CSI-RS不是持续发送，UE只能在网络明确配置了CSI-RS的情况下才能使用其进行信道测量。前言对于CSI-RS，肯定还离不开前面所说的CSI（channelstateinformation），前面也讲过CSI对于MIMO
5G标准学习笔记06-基于AI/ML波束管理刘孬孬沉迷学习 5G 学习笔记
5G标准学习笔记06-基于AI/ML波束管理前言前面对于孬孬学习了波束管理的概述，下面要进一步来看一下传统波束管理和现在3GPP中推动的AL/ML波束管理之前的区别联系。一、传统波束管理方法流程传统BM流程主要包括以下步骤：波束扫描（BeamSweeping）：gNB通过顺序发送多个窄波束（SSB或CSI-RS），覆盖整个服务区域，UE测量每个波束的信号质量（如L1-RSRP或L1-SINR）。波
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，