梯度下降算法综述

简介梯度下降算法：

梯度下降法是最常用的优化算法之一，也是迄今为止优化神经网络最常用的方法之一。同时，每个最先进的深度学习库都包含各种优化梯度下降算法的实现。然而，这些算法通常被称作黑盒优化器，因为很难找到对其优缺点的实际解释。本文旨在为读者提供有关优化梯度下降的不同算法的区别与联系，使得它更好的为我们所用。

梯度下降法是一种不断调整模型参数 $\theta$ 来最小化目标函数 $J(\theta )$ ，通过在目标函数 $\triangledown_{\theta }J(\theta)$ 梯度的相反方向更新参数来最小化目标函数 $J(\theta )$ ，学习率η决定了我们达到（局部）最小值的步骤的大小。换言之，我们沿着目标函数产生的曲面坡度的方向下坡，直到到达一个山谷。

介绍梯度下降算法的不同变体：

根据它们在计算目标函数梯度时所用的数据量不同。将梯度下降算法分为3种，“批量梯度下降算法”、“随机梯度下降算法”、“小批量梯度下降算法”。根据数据量的不同，我们在参数更新的准确性和执行更新所需的时间之间进行权衡。

批量梯度下降算法

Vanilla gradient descent,又名batch gradient descent(批量梯度下降算法),以下简称BGD,它在计算目标函数梯度时使用全部训练样本，参数更新公式为 $\theta = \theta - \eta \ast \triangledown_{\theta }J(\theta)$ ，通常要预先设定参数更新的迭代次数。因为我们需要计算整个数据集的梯度，以便只执行一次更新，批量梯度下降可能非常慢，并且对大数据集来说是很难处理的。批量梯度下降也不允许我们在线更新我们的模型。虽然很慢但往往这种方法参数更新的方向是快的方向。

然后我们按照梯度的方向更新参数，学习率决定我们参数更新的步伐。对于凸误差曲面，批量梯度下降保证收敛到全局最小值，对于非凸曲面保证收敛到局部最小值。

随机梯度下降算法

Stochastic gradient descent（随机梯度下降），以下简称SGD，它对每个训练示例 $x^{i}$ 和标签 $y^{i}$ 执行参数更新,遍历样本集，每遇到一个样本便更新一次参数。

批处理梯度下降对大型数据集执行冗余计算，因为它在每个参数更新之前重新计算类似示例的梯度。SGD通过一次执行一次更新来消除这种冗余。因此，它通常要快得多，也可以用于在线学习。但SGD执行频繁的高方差更新，导致目标函数剧烈波动，如下图所示：

当批量梯度下降收敛到参数所在的局部最小值时，一方面，SGD的波动使其能够跳到新的、可能更好的局部极小值。另一方面，这最终会使收敛到精确最小值变得复杂，因为SGD可能由于某个误差使得梯度更新过大跳过最小值点。然而，当我们缓慢地降低学习速率时，SGD表现出与批梯度下降相同的收敛行为，几乎可以肯定地分别收敛到非凸和凸优化的局部或全局最小值。总的来说BGD更新参数速度较慢，但每一步都能保证参数更新的较为准确，而SGD更新速度较快，但受误差数据影响较大，肯会出现较差的更新。

小批量梯度下降算法

Mini-batch gradient descent（小批量梯度下降算法）最终将两者优点兼得，并为每一个小批量n个训练示例执行更新：

具体做法是将样本集划分成若干个批次，每个批次常见的大小在50到256之间，但可能因不同的应用而有所不同，在每个批次上执行批量梯度下降算法。在训练神经网络时，小批量梯度下降是典型的选择算法，当使用小批量时，通常也使用SGD这个术语。

优化过程面临的一些挑战：

然而，小批量梯度下降算法并不能保证很好的收敛性，但它提供了一些需要解决的挑战：

选择一个合适的学习率是很困难的。学习速率太小会导致收敛速度非常慢，而学习速率太大则会阻碍收敛，并导致损失函数在最小值附近波动甚至发散。

学习速率表试图通过动态调整等方法在训练期间调整学习率，即根据预先定义的时间表降低学习率，或者当不同时期之间的目标变化低于阈值时。然而，这些时间表和阈值必须事先定义，因此无法适应数据集的特性。

此外，将相同的学习率应用于所有参数更新。如果我们的数据是稀疏的，并且我们的特征具有非常不同的频率，我们可能不希望将所有这些更新到相同的程度，而是对很少出现的特征执行更大的更新。

最小化神经网络常见的高度非凸误差函数的另一个关键挑战是避免陷入大量次最小。Dauphin等人认为困难实际上不是来自局部极小值（实际上局部极限值出现的概率是很低的，它要求每个维度在该带点都处于局部最小值，通常我们数据集的维度是较大的），而是来自鞍点，即一个维度向上倾斜，另一个维度向下倾斜的点。这些鞍点通常被一个具有相同误差的平台所包围，这使得SGD很难逃脱，因为梯度在所有维度都接近于零。

其中(0,0)就是一个鞍点：

常见的梯度优化算法：

Momentum

SGD在穿越沟壑时遇到了困难，即表面在一个维度上的曲线比在另一个维度上要陡得多，这在局部最优点附近很常见。在这些情况下，SGD在沟谷斜坡上振荡，而沿着谷底向局部最优方向缓慢前进;如下图所示，我们的参数在2个方向上的梯度一个较大，一个较小，这就造成这两个方向的总方向像黑色箭头那样，而实际上我们希望看到的方向为红色的箭头，因为沿着红色箭头可以更快到达我们的最优点。

黑色箭头很容易造成下列震荡的现象出现：

Momentum（动量）是一种有助于在相关方向上加速SGD并抑制振荡的方法，如下图所示。它通过在当前更新向量上添加过去更新向量的γ倍（γ也被称为动量项）来实现这一点（如上图所示，实际更新的方向会在最优更新方向上左右震荡，Momentum做法的好处是利用上一次更新方向来抵消一部分当前更新方向偏离最优更新方向的幅度，以达到减小震荡的目的。）：

动量项γ通常设置为0.9或者一个更小的值。

另外一种解释：

常规SGD的做法中，一个球沿着斜坡滚下山，小球滚动过程中在某些点的梯度为0，但该点可能不是全局最优点仅仅是局部最优点，于是小球便陷入该点，这显然不是我们希望看到。Momentum的做法给小球一个惯性能够成功越过这个局部最优点，从而可以成功的找到全局最优点。

Nesterov accelerated gradient

以下简称NAG，它是在Momentum基础上的改进。然而，一个球滚下山，盲目地沿着斜坡，是非常不令人满意的。我们希望有一个更聪明的球，一个知道它要去哪里的球，这样它就知道在再次上坡之前要减速。以下是NAG的梯度更新公式：

下面我将用一张图来解释上面的梯度更新公式，我们知道常规的Momentum做法是：每一次下降的方向为当前梯度方向和上一次梯度方向的总方向，那么既然这样，我为什么不提前走到超前点C呢,再计算C点的梯度下降方向，通过B->C的方向(即：上一次0.9倍A点梯度下降方)和C->D(即：C点梯度下降方向)，这两个方向的和便能到达实际下降点D，而不用去计算B的梯度下降反向。

而是为了得到C点的梯度方向，通过当前点B减掉0.9倍上一次梯度方向便得到C点，在计算C点的偏微分就拿到了C点的梯度下降方向。将C点的梯度下降方向与0.9倍A点的梯度下降方向的总方向，便可以成功到达实际点D。

对于NAG这个做法，很多文章给出的解释是，能够让算法提前看到前方的地形梯度，如果前面的梯度比当前位置的梯度大，那我就可以把步子迈得比原来大一些，如果前面的梯度比现在的梯度小，那我就可以把步子迈得小一些。这个大一些、小一些，都是相对于原来不看前方梯度、只看当前位置梯度的情况来说的。但相比传统的Momentum方法，NAG方法收敛速度明显加快，波动也小了很多。

Adagrad

Adagrad的做法是动态更新学习率，学习率与当前的时间成反比，与此同时学习率除以一个过去所有更新过梯度的均方，这样做的好处是如果前面的梯度都比较大会让梯度慢慢降低下来，如果前面的梯度都比较小会让我当前的梯度慢慢增加上去。

上面的梯度更新公式还可以写成如下形式：

在很多论文中，会在分母中加上一个 $\varepsilon$ ，它是一个平滑项，可避免被零除（通常为1e−8）。

看到这，可能都会有一个疑问，在梯度下降算法中我梯度比较大对应我的参数应该有较大的的更新；而在Adagrad表达式中，分子有一个很大的梯度表示要给参数一个较大的更新，但在分母上也有当前较大的梯度，又表示给我当前参数一个较小的更新，这不是矛盾嘛？

这其实不是矛盾的，下面通过直观方面和数学方面给出解释：

直观的解释：

比如我过去的梯度分别为0.001、0.001、0.003、0.002，这时我相比得到一个0.1较大的梯度，而分母记录了过去较小的梯度，分子作为当前最新的梯度，可以造成反差的效果。

数学方面的解释：

在参数 $\omega _{1}$ 方向上，损失函数图像坡度是比较小的，而在 $\omega _{2}$ 方向上坡度是比较大的；a点我有较小的梯度但同时距离最优点(0,0)是比较远的，而在c点拥有较大的梯度却距离最优点(0,0)是较远的，这显然不是合理的。Adagrad的表达式要表达的是在一点参数更新的幅度不仅与当前点的梯度成正比，还要和当前点所在的坡度成反比，坡度即该点的二次偏导，

而二次梯度可以用过去所有出现梯度的均方近似表示，这就不难理解Adagrad公式为什么是这样的了。

Adadelta

Adadelta是Adagrad的一个扩展，它试图降低它的激进型，来解决AdaGrad算法中存在的缺陷，下面来看看Adagrad存在的一些优缺点：

优点

学习率将随着梯度的倒数增长，也就是说较大梯度具有较小的学习率，而较小的梯度具有较大的学习率，可以解决普通的SGD方法中学习率一直不变的问题。

缺点

还是需要自己手动指定初始学习率，而且由于分母中对历史梯度一直累加，学习率将逐渐下降至0，并且如果初始梯度很大的话，会导致整个训练过程的学习率一直很小，从而导致学习时间变长。

改进方法一（Accumulate Over Window）：

在一个窗口w中对梯度进行求和，而不是对梯度一直累加。
因为存放 w 之前的梯度是低效的，所以可以用对先前所有梯度均值（使用RMS即均方根值实现）的一个指数衰减作为代替的实现方法。

更新公式如下：
① 将累计梯度信息从全部历史梯度变为当前时间向前的一个窗口期内的累积：

相当于历史梯度信息的累计乘上一个衰减系数 $\rhoρ$ ，然后用( $1 - \rhoρ$ )作为当前梯度的平方加权系数相加，这样做的好处让历史的梯度信息慢慢衰减，而非慢慢累积使得训练过程的学习率慢慢变小。

②然后将上述开方后，作为每次迭代更新后的学习率衰减系数：

即：

这种更新方法确实解决了对历史梯度一直累加而导致学习率一直下降的问题，但还是要人为确定初始的学习率。

改进方法二（Correct Units with Hessian Approximation）：

介绍这种方法前先引出二阶牛顿迭代公式。

二阶牛顿迭代公式：

牛顿法的基本思想：利用迭代点处的一阶导数（梯度）和二阶导数（Hessian矩阵）对目标函数进行二次函数近似，然后把二次模型的极小点作为新的迭代点，并不断重复这一过程，直至求得满足精度的近似最小值。

牛顿法的更新公式，基于二阶泰勒展开：

然后对上式求导，并令，得到更新公式：

我们知道在二阶泰勒展开式中，与 $x^{(0)}$ 越接近，该表达式越准确。并且，我们在前面介绍Adagrad的时候，Adagrad的表达式要表达的是在一点参数更新的幅度不仅与当前点的梯度成正比，还要和当前点所在的坡度成反比，坡度即该点的二次偏导。此时通过二阶优化算法如牛顿法，将二阶导数作为分母加入更新参数，使得在梯度变化过快方向相对梯度变化慢的方向更新尺度发生改变，从而解决病态问题。

AdaDelta算法改进方法二正是采用了这种思想：

$x_{t+1} - x_{t} = \Delta x \approx \frac{\frac{\partial f}{\partial x}}{\frac{\partial ^{2}f}{\partial x^{2}}}$

于是用RMS来近似：

$\frac{1}{\frac{\alpha ^{2}f}{\alpha x^{2}}} = \frac{\Delta x}{\frac{\alpha f}{\alpha x}} \approx -\frac{RMS[\Delta x]_{t-1}}{RMS[g]_{t}}$

然后：

$\Delta x = -\frac{RMS[\Delta x]_{t-1}}{RMS[g]_{t}}\cdot g_{t}$

注意：分子为 $RMS[\Delta x]_{t-1}$ 而不是 $RMS[\Delta x]_{t}$ ，此刻 $\Delta x_{t}$ 还没有计算出来。

总结AdaDelta算法梯度更新公式（不需要设置默认的学习速率）：

Adadelta参考自：这篇博客

RMSprop

RMSprop是Hinton在其课程中提出的一种未发表的自适应学习率方法。RMSprop和Adadelta都是在同一时间被独立提出来的，它们都是为了解决Adagrad急剧下降的学习率问题（Adagrad由于分母中对历史梯度一直累加，学习率将逐渐下降至0，并且如果初始梯度很大的话，会导致整个训练过程的学习率一直很小）。RMSprop实际上与我们上面推导的Adadelta的第一个更新向量相同：

RMSprop还将学习速率除以平方梯度的指数衰减平均值。Hinton建议将 $\gamma$ 设置为0.9，而学习速率 $\eta$ 的良好默认值为0.001。

Adam

自适应矩估计以下简称Adam，它是另一种计算每个参数的自适应学习率的方法。除了存储过去平方梯度的指数衰减平均值 $v_{t}$ （如Adadelta和RMSprop），Adam还保持了过去梯度 $m_{t}$ 的指数衰减平均值，类似于Momentum（动量）。Adam结合AdaGrad和RMSProp两种优化算法的优点。对梯度的一阶矩估计（First Moment Estimation，即梯度的均值）和二阶矩估计（SecondMoment Estimation，即梯度的未中心化的方差）进行综合考虑，计算出更新步长：

$m_{t}$ 和 $v_{t}$ 分别是梯度的一阶矩（平均值）和二阶矩（无中心方差）的估计值，因此该方法的名称。由于 $m_{t}$ 和 $v_{t}$ 被初始化为0的向量，Adam的作者观察到它们偏向于零，特别是在初始时间步长期间，尤其是当衰减率很小（即β1和β2接近1）时，即初始值影响较大，随着时间t的增加 $m_{t}$ 与 $v_{t}$ 增加缓慢。他们通过计算偏差修正的一阶矩和二阶矩估计值来抵消这些偏差：

初始阶段t=1,2...， $m_{t}$ 和 $v_{t}$ 都除以分母为一个小于1的一个较小值，可以保证 $m_{t}$ 和 $v_{t}$ 不会偏向于0。然后，他们使用这些来更新参数，正如我们在Adadelta和RMSprop中看到的一样，这产生了Adam更新规则：

提出者建议 $\beta _{1}$ 的默认值为0.9， $\beta _{2}$ 的默认值为0.999， $\varepsilon$ 的默认值为 $10^{-8}$ ；实践表明，Adam 比其他适应性学习方法效果要好。

AdaMax

Adamax是Adam的一种变体，我们知道在Adam，它更新规则中的 $v_{t}$ 根据过去梯度渐变 $v_{t-1}$ 和当前梯度绝对值 $\left | g_{t} \right |^{2}$ 渐变成反比缩放渐变：

更一般的形式：

通常太大的范数p是极其不稳定的，这就是为什么L1范数和L2范数在实践中比较常见的原因。然而， $\propto$ 范数一般也表现出稳定的行为，为此，作者提出了AdaMax并证明了在 $\propto$ 范数下 $v_{t}$ 收敛到了稳定的值。这里为了避免与Adam混淆，我们使用 $u_{t}$ 来表示这个稳定的值，可以进一步写成max()的形式：

现在用我们的 $u_{t}$ 定义Adamax的更新规则：

由于 $u_{t}$ 采用最大化过往的某一个梯度一定比例，所以，它不会出现偏向于0的情况发生，我们不需要对 $u_{t}$ 的偏差校正。良好的默认参数值是 $\eta$ =0.002、 $\beta _{1}$ =0.9和 $\beta _{2}$ =0.999。

Nadam

我们知道Adam可以看作是RMSprop和Momentum的组合，RMSprop贡献了过去平方梯度的指数衰减平均值 $v_{t}$ ，而动量则是过去梯度 $m_{t}$ 的指数衰减平均值。而我们现在要介绍的NAdam是NAG和Adam的结合体，为了将NAG合并到Adam中，我们需要修改它的动量项 $m_{t}$ 。

使用原始Momentum动量项 $m_{t}$ 更新规则：

将上述式子展开：

这种写法再一次证明了更新是朝着前一个动量矢量的方向迈出一步，再朝着当前梯度的方向迈出一步。NAG告诉我们在计算梯度之前用动量步长更新参数，从而在梯度方向上执行更精确的步骤。因此，我们只需修改梯度 $g_{t}$ 就是NAG：

接下来我们直接用 $m_{t-1}$ 来更新当前参数，而不是使用 $m_{t-1}$ 两次，一次用于更新梯度 $g_{t}$ ，第二次用于更新参数 $\theta _{t+1}$ ,上述式子写成：

我们现在使用当前动量向量 $m_{t}$ ，而不是在NAG那样动量向量 $m_{t-1}$ （上一次更新方向）来看的更远。为了给Adam添加NAG，我们可以类似地用当前动量向量替换先前的动量向量。

将上述式子展开：

而 $\frac{m_{t-1}}{1-\beta _{1}^{t}}$ 只是上一时间动量矢量 $m_{t-1}$ 的偏差校正估计值。因此，我们可以用 $\hat{m_{t-1}}$ 代替它：

同理我们现在使用当前动量向量 $m_{t}$ ，而不是在NAG那样动量向量 $m_{t-1}$ （上一次更新方向）来看的更远：

至此Nadam参数更新公式便得到了，如上式；上面的推导进一步说明了NAdam是NAG和Adam的结合体。

总结：

下列动图展示了上述几种梯度下降算法中使用不同的更新公式收敛速度：

参考论文：https://arxiv.org/pdf/1609.04747.pdf

上述都是阅读该参考文献的翻译和总结，第一次总结难免出错，请各位大佬指正，后面会继续研究以做到循序渐进。

斤斤计较的婚姻到底有多难？白心之岂必有为
很多人私聊我会问到在哪个人群当中斤斤计较的人最多？我都会回答他，一般婚姻出现问题的斤斤计较的人士会非常多，以我多年经验，在婚姻落的一塌糊涂的人当中，斤斤计较的人数占比在20～30%以上，也就是说10个婚姻出现问题的斤斤计较的人有2-3个有多不减。在婚姻出问题当中，有大量的心理不平衡的、尖酸刻薄的怨妇。在婚姻中仅斤斤计较有两种类型：第一种是物质上的，另一种是精神上的。在物质与精神上抠门已经严重的影响
情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
铭刻于星（四十二）随风至
69夜晚，绍敏同学做完功课后，看了眼房外，没听到动静才敢从书包的夹层里拿出那个心形纸团。折痕压得很深，都有些旧了，想来是已经写好很久了。绍敏同学慢慢地、轻轻地捏开折叠处，待到全部拆开后，又反复抚平纸张，然后仔细地一字字默看。只是开头的三个字是第一次看到，让她心漏跳了几拍。“亲爱的绍敏：从四年级的时候，我就喜欢你了，但是我一直不敢说，怕影响你学习。六年级的时候听说有人跟你表白，你接受了，我很难过，但
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说造命者说
底层逆袭到底有多难，不甘平凡的你准备好了吗？让吴起给你说说我叫吴起，生于公元前440年的战国初期，正是群雄并起、天下纷争不断的时候。后人说我是军事家、政治家、改革家，是兵家代表人物。评价我一生历仕鲁、魏、楚三国，通晓兵家、法家、儒家三家思想，在内政军事上都有极高的成就。周安王二十一年（公元前381年），因变法得罪守旧贵族，被人乱箭射死。我出生在卫国一个“家累万金”的富有家庭，从年轻时候起就不甘平凡
2020-01-25 晴岚85
郑海燕坚持分享590天2020.1.24在生活中只存在两个问题。一个问题是：你知道想要达成的目标是什么，但却不知道如何才能达成；另一个问题是：你不知道你的目标是什么。前一个是行动的问题，后一个是结果的问题。通过制定具体的下一步行动，可以解决不知道如何开始行动的问题。而通过去想象结果，对结果做预估，可以解决找不着目标的问题。对于所有吸引我们注意力，想要完成的任务，你可以先想象一下，预期的结果究竟是什
随笔 | 仙一般的灵气海思沧海
仙岛今天，我看了你全部，似乎已经进入你的世界我不知道，这是否是梦幻，还是你仙一般的灵气吸引了我也许每一个人都要有一份属于自己的追求，这样才能够符合人生的梦想，生活才能够充满着阳光与快乐我不知道，我为什么会这样的感叹，是在感叹自己的人生，还是感叹自己一直没有孜孜不倦的追求只感觉虚度了光阴，每天活在自己的梦中，活在一个不真实的世界是在逃避自己，还是在逃避周围的一切有时候我嘲笑自己，嘲笑自己如此的虚无，
想家爆米花机
也许不同于大家对家乡的思念，我对家乡甚至是疯狂的不舍。还未踏出车站就感觉到幸福，我享受这里的夕阳、这里的浓烈柴火味、这里每一口家常菜。我是宅女，我贪恋家的安逸。刚刚踏出大学校门，初出茅庐，无法适应每年只能国庆和春节回家。我焦虑、失眠、无端发脾气，是无法适应工作的节奏，是无法接受我将一步步离开家乡的事实。我不想承认自己胸无大志，选择再次踏上征程。图片发自App
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
OC语言多界面传值五大方式 Magnetic_h ios ui 学习 objective-c 开发语言
前言在完成暑假仿写项目时，遇到了许多需要用到多界面传值的地方，这篇博客来总结一下比较常用的五种多界面传值的方式。属性传值属性传值一般用前一个界面向后一个界面传值，简单地说就是通过访问后一个视图控制器的属性来为它赋值，通过这个属性来做到从前一个界面向后一个界面传值。首先在后一个界面中定义属性@interfaceBViewController:UIViewController@propertyNSSt
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
10月|愿你的青春不负梦想-读书笔记-01 Tracy的小书斋
本书的作者是俞敏洪，大家都很熟悉他了吧。俞敏洪老师是我行业的领头羊吧，也是我事业上的偶像。本日摘录他书中第一章中的金句：『一个人如果什么目标都没有，就会浑浑噩噩，感觉生命中缺少能量。能给我们能量的，是对未来的期待。第一件事，我始终为了进步而努力。与其追寻全世界的骏马，不如种植丰美的草原，到时骏马自然会来。第二件事，我始终有阶段性的目标。什么东西能给我能量？答案是对未来的期待。』读到这里的时候，我便
C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
小丽成长记（四十三）玲玲54321
小丽发现，即使她好不容易调整好自己的心态下一秒总会有不确定的伤脑筋的事出现，一个接一个的问题，人生就没有停下的时候，小问题不断出现。不过她今天看的书，她接受了人生就是不确定的，厉害的人就是不断创造确定性，在Ta的领域比别人多的确定性就能让自己脱颖而出，显示价值从而获得的比别人多的利益。正是这样的原因，因为从前修炼自己太少，使得她现在在人生道路上打怪起来困难重重，她似乎永远摆脱不了那种无力感，有种习
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
瑶池防线谜影梦蝶
冥华虽然逃过了影梦的军队，但他是一个忠臣，他选择上报战况。败给影梦后成逃兵，高层亡尔还活着，七重天失守......随便一条，即可处死冥华。冥华自然是知道以仙界高层的习性此信一发自己必死无疑，但他还选择上报实情，因为责任。同样此信送到仙宫后，知道此事的人，大多数人都认定冥华要完了，所以上到仙界高层，下到扫大街的，包括冥华自己，全都准备好迎接冥华之死。如果仙界现在还属于两方之争的话，冥华必死无疑。然而
爬山后遗症璃绛
爬山，攀登，一步一步走向制高点，是一种挑战。成功抵达是一种无法言语的快乐，在山顶吹吹风，看看风景，这是从未有过的体验。然而，爬山一时爽，下山腿打颤，颠簸的路，一路向下走，腿部力量不够，走起来抖到不行，停不下来了！第二天必定腿疼，浑身酸痛，坐立难安！
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S

梯度下降算法综述

目录：

简介梯度下降算法：

介绍梯度下降算法的不同变体：

批量梯度下降算法

随机梯度下降算法

小批量梯度下降算法

优化过程面临的一些挑战：

常见的梯度优化算法：

Momentum

Nesterov accelerated gradient

Adagrad

Adadelta

RMSprop

Adam

AdaMax

Nadam

总结：

你可能感兴趣的:(机器学习,概率统计,算法的数学基础,人工智能,机器学习,深度学习,算法)