CoreJT

吴恩达深度学习 | (8) 改善深层神经网络专项课程第一周学习笔记

课程视频

第一周PPT汇总

吴恩达深度学习专项课程共分为五个部分，本篇博客将介绍第二部分改善深层神经网络专项的第一周课程：深度学习的实用层面。本周主要讲解如何配置训练/验证/测试集，如何分析方差和偏差，如何处理高偏差或高方差或高偏差和高方差共存的问题，以及如何在神经网络中应用不同形式的正则化，如L2正则化、dropout等，加快神经网络训练的技巧，最后介绍了梯度检验。

1.训练/开发/测试集

2.偏差/方差

3.机器学习基础

4.正则化

5.为什么正则化可以减少过拟合？

6.Dropout正则化

7.理解Dropout

8.其他正则化方法

9.正则化输入

10.梯度消失和梯度爆炸

11.神经网络的权重初始化

12.梯度的数值逼近

13.梯度检验

14.关于梯度检验实现的标记

1.训练/开发/测试集

在配置训练、验证和测试数据集的过程中做出正确决策，会在很大程度上帮助我们创建高效的神经网络。

训练神经网络需要做的决策

需要设置的超参数有很多，即使是深度学习专家也不可能一下子设置好这些超参数，得到一个最优的神经网络。所以，应用机器学习是一个迭代的过程：

首先，有一个初始的想法，如隐层数量，隐层单元数量的设置等；然后，编码实现这个初始想法，并通过实验验证它的效果，根据实验效果有针对性的改进想法。以此不断循环迭代，直到构建出一个性能优良的神经网络。

训练/验证/测试集

应用机器学习是一个循环的过程，而循环的效率是影响整个项目进展的关键因素。而创建高质量的训练集、验证集和测试集有助于提高循环效率。

一般把数据集分为如下三部分：

训练集、验证集(交叉验证集)和测试集。训练集用于训练算法或模型；验证集用于模型选择，选择一个最优的模型（对应一组最优的超参数配置）；最后用测试集无偏评估算法的运行状况。

在机器学习的小数据时代(100、1000、10000条），传统的数据集划分一般把70%的数据作为训练集，30%作为测试集或者60%训练集、20%验证集、20%测试集。

在大数据时代，数据集的规模一般比较大(百万级以上），传统的划分方式不再适用。验证集是用来进行模型选择，要求尽可能在短时间内，在若干模型中选出效果最好一两个模型,假设有100w条数据，此时不再把其中的20%作为验证集，而是取其中的1w条数据即可。测试集主要用于最后无偏评估模型的性能，和验证集一样，1w条数据就足够了。那么此时的划分就是把98%的数据作为训练集，1%验证，1%测试。

当然也有其他的划分方式，可能把99.5%数据作为训练集，验证集和测试集各占0.25%或验证集0.4%、测试集0.1%。

训练集和测试集的分布不同

比如现有一个识别猫咪图片的应用程序，训练集采用的是从网页抓取的图片，测试集是用户通过应用程序上传的图片。显然这两部分图片来自不同的分布，一般来说网页上的图片分辨率高、制作精良；而用户上传的图片，可能是用手机随意拍摄的，质量不是很高。

实际上，在许多深度学习问题中，都会面临训练集和测试集数据分布不同的问题。因为训练需要大量的数据，此时一般在网页上抓取，而测试集一般是实际应用中的数据，如上例猫咪图片识别所示。

此时，需要遵循一条法则：确保验证集和测试集数据来自同一分布。因为要用验证集来评估不同的模型，尽可能的优化性能，遵循这条法则可以使机器学习算法变得很快(具体原因之后探讨)。

最后，没有测试集也是可以的，测试集主要提供对最后选定模型的无偏评估。如果不需要无偏评估，那么可以不需要设置测试集。

如果只有验证集，我们需要做的是，在训练集上训练，尝试不同的模型框架(不同的超参数),然后在验证集上评估这些模型，迭代并选出适用的模型。此时验证集已经涵盖了测试集，只是不再提供无偏性能估计。

如果在机器学习问题中，只有训练集和验证集，此时的验证集也会被叫做测试集。所以，当有人告诉你，只设置了训练集和测试集时，一定要确保验证集的存在(即，此时的测试集应该是验证集)。

2.偏差/方差

偏差和方差是两个易学难精的两个概念，很多机器学习研究者都想很深刻的理解这两个概念。即使你知道了这两个概念，但在实际的应用中也会遇到各种各样的问题。

在深度学习中一般分别考虑方差和偏差，不会考虑2者的权衡问题。

偏差和方差

如下所示是一个待分类数据集的可视化效果:

图1可能采用逻辑回归算法进行分类，决策边界是一条直线，非常简单，此时数据拟合不佳，称为高偏差或欠拟合；图3可能采用一个复杂模型如多隐层的神经网络，决策边界非常复杂，把异常样本也考虑在内，在训练集上分类非常精准，此时称为高方差或过拟合；图2的数据拟合程度介于图1和图3之间，比较适度，称为“just right”。

对于上图所示的包含两个特征的数据集，可以采用可视化的数据集和决策边界的方法，来判断偏差和方差；但对于高维数据，可视化非常困难，此时可以用其他指标来判断偏差和方差。

接下来还是以猫咪图片分类的例子进行说明：

对于这种高维数据，一般通过训练误差和验证误差这两个指标来判断偏差/方差：

假设训练集和验证集来自同一分布，且最优误差(人眼或其他高性能系统分类误差)非常小接近于0%(当不满足该前提假设时，以下的分析过程将更加复杂):

当训练误差和最优误差相差比较大时，则出现了高偏差（欠拟合）；当训练误差和验证误差相差比较大时，则出现了高方差（过拟合）。

偏差和方差都高的情况

如上图中的紫色决策边界所示。之所以说它是高偏差和高方差，是因为整体来看该决策边界大部分是直线，数据拟合程度比较低；而从局部来看，该决策边界又有很高的灵活度，拟合了两个异常样本，数据拟合程度又比较高。可能用2维数据来说明有些勉强，但在高维数据中，确实会出现有些区域高偏差，有些区域高方差的情况，整体来说，我们称其既是高偏差又是高方差。

3.机器学习基础

高偏差/方差问题的基本解决方案

首先通过模型在训练集上的表现(训练误差与最优误差的差距大小)来判断是否出现了高偏差。若是可以采用更“大”的神经网络（增加隐层数和隐层单元数）、训练更长时间以及采用不同的网络结构(不一定有效）来解决高偏差的问题（这是最基本的要求）；

若没有出现高偏差问题，则进一步通过模型在验证集上的表现（训练误差和验证误差的差距大小）来判断是否出现了高方差。若是增加更多的数据（如果可能）、采用正则化的方法以及采用不同的网络结构(不一定有效）来解决高方差问题。

然后进行循环迭代，再依次判断高偏差/方差问题，直到得到一个低偏差和低方差的模型。

注意：

1）高偏差和高方差是两个独立的问题，对应的解决方案不一样。一般通过模型在训练集和验证集上的表现判断是否出现高偏差或高方差问题，然后根据结果选择尝试部分方法。比如，模型如果出现了高偏差问题，那么增加更多数据其实没什么用。我们要明确模型到底出现了什么问题，高偏差/高方差/还是都有，从而选择一个最有效的解决方法。

2）在机器学习初期，关于方差和偏差权衡问题的讨论屡见不鲜，原因是你可以采取很多方法来增加偏差降低方差或降低偏差增加方差，所以要考虑2者的权衡；在深度学习初期，有很少工具可以做到只减少偏差或方差而不影响另外一个，但在现在的深度学习和大数据时代，只要正则化适度，增大网络结构可以在不影响方差的情况下降低偏差；获取更多数据可以在不影响偏差的情况下降低方差。我们现在有很多工具可以做到在减少偏差或方差的同时不对另外一方产生过多的不良影响。这是深度学习不需要考虑偏差/方差权衡的重要原因，也是其对监督学习问题大有裨益的重要原因。

4.正则化

正则化有助于帮助模型避免/缓解过拟合问题。

逻辑回归中的正则化

w是一个高维向量，b是一个实数，一般只对w（权重）进行正则化，因为其涵盖了绝大多数参数，当然也可以加上参数b，不过一般不加。

$\lambda$ 是正则化系数，使用Python编程时，避免和保留字冲突，一般使用lambd表示。

上式中采用的是L2正则化，这也是使用最广泛的，还有一种是L1正则化：

如果使用L1正则化，最终得到的w向量将会比较稀疏（向量中0比较多）。有人说这样有利于模型压缩，模型参数中0比较多可以减少存储内存，但实际上使用L1正则化会使模型参数比较稀疏，但并没有起到减少存储内存的效果。在实际应用中，越来越倾向于使用L2正则化。

神经网络中的正则化

与逻辑回归类似，也是在原始代价函数的基础上加上L2正则化项，不过我们称 $||W^{[l]}||_{F}^{2}$ 为弗洛贝尼乌斯范数不再是L2范数，它等于权重矩阵中每个元素的平方和：

代价函数：

依旧是只惩罚 $W^{[l]}$ 权重参数，不惩罚 $b^{[l]}$ 偏置参数。因为 $W^{[l]}$ 已经涵盖了绝大多数参数。

此时，反向传播计算的梯度 $dW^{[l]}$ 将包含原始反向传播梯度(不包含正则化，记做B1）和正则化梯度两部分：

L2正则化也被叫做权重衰减：

加入L2正则化项后，在进行梯度下降时，相当于把 $W^{[l]}$ 先乘以 $(1-\frac{\lambda \alpha }{m})<1$ ,再减去之前不加正则化时反向传播计算的梯度。会使权重参数相对变得更小，所以叫做权重衰减。

5.为什么正则化可以减少过拟合？

直观理解1

带L2正则化的代价函数：

下图是之前高偏差/方差的可视化效果：

假设现有一个非常复杂的神经网络结构(如下所示），它会产生如上图3所示的复杂决策边界（过拟合）：

当正则化系数 $\lambda$ 非常大时，要使代价函数最小，那么 $W^{[l]} \approx 0$ ，此时各隐层的隐藏单元将具有高度的对称性(计算的值都是一样的)，相当于只有一个隐藏单元起作用，如上图红色部分所示，神经网络的结构就会大大简化，虽然深度还在，但会无限接近于逻辑回归算法。可能会产生上图1中的高偏差现象（实际上，这种消除隐藏单元影响的情况是不会出现的，隐藏单元还会在，只不过影响较小了，简化网络结构）。

而当 $\lambda$ 非常小时，如 $\lambda =0$ 时，此时相当于不做正则化，神经网络结构非常复杂，那么就会产生上图3中的高方差现象。

那么，此时就会存在一个适中的 $\lambda$ 取值，使得分类效果恰好为上图2中的“just right”。

所以直观上讲，使用L2正则化，可以简化网络结构，降低高方差(过拟合）。如果设置一个合适的 $\lambda$ 将会达到一个理想的分类效果。

直观理解2

假设每个隐藏使用tanh作为激活函数：

当增大正则化系数 $\lambda$ 时，模型参数 $W^{[l]}$ 会变小(因为要使得代价函数变小),那么 $Z^{[l]}$ 也会相对变小：

通过tanh的图像，会发现当输入 $Z^{[l]}$ 比较小时，tanh的图像呈现线性。此时，相当于每个隐层都使用线性激活函数，之前曾讨论过，如果使用线性激活函数，那么再多的隐层也是没有意义的，相当于一个线性函数的效果。此时将不会出现复杂的决策边界，所以正则化会简化我们的模型，减少过拟合，如果 $\lambda$ 值适中的话，就会达到“just right”的状态。

如果代价函数中包含正则化项，绘制代价关于梯度下降迭代次数的曲线，会发现代价在每次迭代后都会减小，呈现单调递减的趋势；如果不包含的话，可能不会在每次迭代后都减小：

6.Dropout正则化

Dropout(随机失活)

假设左图中的复杂神经网络结构存在过拟合，dropout正则化做的工作是，在一次前向传播中，通过遍历神经网络中的每个节点，并且每个节点通过“掷硬币”的方式（设置一定的概率，上图中是0.5）决定去留，去掉的节点连同它的所有连线(参数)都从原结构中“消失”，以此来简化网络结构，反向传播时也只更新简化后结构中的参数。每次前向/反向传播失活的单元都是随机的，每次都面临不同的网络结构，不同样本面临的网络结构也是不同的。

实现dropout（反向随机失活）

下面举例说明如何在某一层运用dropout：

对于单个输入样本：

dl = np.random.rand(al.shape) < keep_prob
al = al*d1 #对应位置元素相乘
al /= keep_prob

dl是一个向量，与al同维，即大小是第l层的单元数。dl相当于一个开关，把它的元素随机初始为0-1之间的浮点数，设置一个保留概率keep_prob,若keep_prob=0.8，就是说dl中有20%的元素为0.

然后将第l层的激活输出al与dl对应位置元素相乘，同样会使al中20%的元素为0，相当于使20%的单元失活，简化网络结构，无论在前向还是反向传播中只考虑保留下的节点以及与其连接的参数。

为了保证第l层的激活输出al的期望(平均值)不发生太大变化，al要除以keep_prob.比如第l层有50个单元，keep_prob=0.8，则平均有10个神经元失活，也就是说al要减少20%的元素(20%的元素为0），此时为保证al的期望大体不变，弥补那20%的损失，所以让al除以keep_prob.早期版本的dropout没有除以keep_prob，导致测试阶段平均值的计算非常复杂。

对于m个输入样本：

Dl = np.random.rand(Al.shape) < keep_prob
Al = Al*D1 #对应位置元素相乘
Al /= keep_prob

Dl是一个矩阵，与Al同维，即大小是第l层的单元数乘以样本数m。Dl相当于一个开关，把它的元素随机初始为0-1之间的浮点数，设置一个保留概率keep_prob,若keep_prob=0.8，就是说Dl中有20%的元素为0.

然后将第l层的激活输出Al与Dl对应位置元素相乘，同样会使Al中20%的元素为0，相当于使20%的单元失活，简化网络结构，无论在前向还是反向传播中只考虑保留下的节点以及与其连接的参数。对于m个样本来说，每个样本随机失活的单元不尽相同，面临的网络结构是不同的。

为了保证第l层的激活输出Al的期望(平均值)不发生太大变化，Al要除以keep_prob.比如第l层有50*m个单元，keep_prob=0.8，则平均有10*m个神经元失活，也就是说Al要减少20%的元素(20%的元素为0），此时为保证Al的期望大体不变，弥补那20%的损失，所以让Al除以keep_prob.早期版本的dropout没有除以keep_prob，导致测试阶段平均值的计算非常复杂。

在测试阶段做预测

测试阶段不使用dropout(keep_prob=1),在训练阶段，al /= keep_prob保证了在测试阶段不必执行dropout来调整数值范围，激活函数输出期望大体不变，没必要在测试阶段额外添加尺度参数：

7.理解Dropout

对于一个单神经元的网络结构：

实施dropout后，它会使某些输入单元失活，那么此时对于上图中紫色的单元来说，它不能完全依靠其中的任何一个特征，因为每个特征都有可能失活，所以不会把某一个输入单元的权重设置的很大，相反而是把权重值分散，每个权重都比较小。

dropout的功能与L2正则化类似，简化网络结构，使每个参数不至于过大，都比较小，防止过拟合。

对于一个复杂的神经网络结构：

1）如果使用dropout，需要设置一个超参数keep_prob

2) 一般输入层不使用dropout，即keep_prob=1,如果在输入层使用dropout，keep_prob应该接近于1，如0.90

3）每一层的keep_prob可以不相同。一种做法是，如果觉得某一层更容易出现过拟合，比如参数比较多，可以把该层的keep_prob设置的小一些，其他层大一些，不过这样在交叉验证时，搜索超参数会更复杂；也可以在某些层使用dropout，且这些层的keep_prob相同，某些层不使用。

dropout在计算机视觉中使用非常频繁，几乎成了必选，因为没有足够的数据，模型又比较复杂，容易出现过拟合。

dropout是一种正则化方法，用于解决过拟合，如果算法没有出现过拟合，不要使用。

dropout的缺点，每次迭代都会随机使一些单元失活，导致我们所优化的代价函数J没有明确的定义，所以不能应用梯度检验或代价函数随迭代次数的变化曲线进行调试。一般，先关闭dropout(keep_prob=1),再进行梯度检验或绘制曲线进行调试，如果梯度检验没有问题或代价函数J随迭代次数单调递减，再打开dropout，期望dropout的过程不会引入bug。

8.其他正则化方法

数据增强

可以通过增加训练数据的方式，解决过拟合问题。不过额外增加训练数据有时候成本会很高，也很耗时，可以通过数据增强的方式来增加训练数据。

比如，你在做猫咪图片分类的任务，可以对原始训练集中的猫咪图片采取如下操作：

1）对猫咪图片进行水平翻转

2）对猫咪图片进行任意裁剪，如旋转某个角度，放大后再裁减。

当然还有很多类似的人工增加数据的操作，虽然这样可能会使训练集出现冗余，不如额外收集的猫咪图片好；但是这样做几乎没有任何代价，且容易操作，扩展数据集的速度快，比额外收集数据成本低得多。

但要注意对于人工增加的图片要进行检验，确保这些图片仍然是猫咪。

对于光学字符识别，可以对训练集中的字符进行适当的旋转扭曲，并把处理过的字符添加到训练集中，以此来扩展数据集：

数据增强可以作为正则化方法来使用，实际上功能上也与正则化相似。

Early stopping

Early stopping：提前终止训练神经网络

在使用梯度下降法时，绘制出训练误差（模型在训练集上的代价函数值）和验证误差（模型在验证集上的代价函数值）随迭代次数的变化曲线。通常会发现验证误差先呈现下降趋势，然后在某个节点后上升。Early stopping就是在验证集误差开始变大的节点处提前停止训练。

原理：

当梯度下降刚开始迭代时，参数W接近于0，因为随机初始化参数W的值很小；在经过多次迭代和训练后，参数W会越来越大。所以Early stopping要做的就是在中间点停止迭代过程，选择一个F范数较小的参数W，与L2正则化类似选择参数W范数较小的神经网络，减少过拟合。

缺点：

机器学习问题一般包括两个步骤：一是利用优化算法(梯度下降或高级优化算法)最小化代价函数J；二是减少模型的过拟合，可以采用正则化、数据增强等方法。但随着机器学习超参数的激增，选出可行的算法越来越困难。但是，如果用一组工具来优化代价函数，此时只考虑参数W、b，使得代价函数越小越好，其他不关注；使用另一组工具来减少过拟合，会使问题变得简单。这个也被称作正交化原理，在一个时间做一个任务。

Early stopping的主要缺点使你不能独立考虑这两个问题，因为提早终止梯度下降，也就停止了优化代价函数J，这就造成代价函数的值不够小，同时又希望不要出现过拟合。所以你没有采取不同的方式来解决两个问题，而是用一种方法同时解决两个问题。这样会使要考虑的东西变得复杂。

如果不使用Early stopping，可以采用L2正则化。训练神经网络的时间就可能更长，这会使超参数空间更容易分解和搜索，缺点是必须尝试大量的 $\lambda$ 取值，导致搜索大量 $\lambda$ 值的计算代价太高。而Early stopping的优点是仅运行一次梯度下降过程，就可以找出W的较小值中间值和较大值，不用像L2正则化那样尝试许多 $\lambda$ 值。

个人更倾向于L2正则化，当然要负担搜索大量 $\lambda$ 值的计算代价；Early stopping也可以获得类似效果，不必搜索 $\lambda$ 值。

9.正则化输入

正则化输入就是对输入进行归一化，可以加快神经网络的训练速度。

规范化训练集

假设我们的训练集有两个输入特征，即输入特征向量x是2维的。

归一化输入包括两步：

1）零均值化：对特征向量 $x^{(i)}$ 每一维求均值，每一维减去各自均值。

如上图所示，x1和x2的均值都为0，不过x1的方差明显比x2大。

2）归一化方差：对特征向量 $x^{(i)}$ 每一维求方差， $\sigma ^{2}$ 和 $x^{(i)}$ 是同维向量。再把所有数据都除以 $\sigma ^{2}$ 。

最后处理完如上图所示，x1和x2的均值为0，方差为1.

注意：如果对训练集进行规范化，测试集也要进行同样的规范化操作。对测试集进行规范化时，使用的均值 $\mu$ 和方差 $\sigma ^{2}$ 为规范化训练集时计算出来的。

为什么规范化输入

代价函数：

假设w，b都是实数，如果不规范化输入，输入特征向量x各个维度的取值范围可能相差很大，可视化代价函数会如下图所示：

轮廓图：

如果不规范化输入，代价函数的轮廓图会比较狭长。如果使用梯度下降法优化代价函数，需要一个较小的学习率，经过多次迭代才能达到最小值。

如果规范化输入，代价函数图像会比较对称，此时会得到一个更圆的球形轮廓：

使用梯度下降法优化代价函数时，无论从哪个位置开始，都能直接找到最小值，可以在梯度下降法中设置一个较大的步长，不用像之前那样反复迭代。

实际上w是一个高维向量，用上述2维图来直观理解可能不太准确。但是规范化输入，使输入特征的取值范围相近，会使代价函数优化起来更简单快速。

如果各个输入特征的取值范围相差很大，归一化输入非常重要；如果各个输入特征本身取值范围就比较接近，归一化输入也没什么危害。总之，需要对输入进行归一化，加快学习算法的训练速度。

10.梯度消失和梯度爆炸

当你在训练深层网络时，梯度有时会非常大或非常小甚至以指数方式减小，这加大了训练神经网络的难度。可以通过更明智的随机初始化参数，来减缓这个问题。

梯度消失/爆炸

假设你正在训练一个很深的神经网络，如下所示，假设每个隐层有两个单元(当然也可以有多个单元）：

为了简单起见，假设每个隐层使用线性激活函数，且不考虑偏置参数：

那么前向传播最终得到的输出 $\hat y$ 等于：

忽略最后一个维度不同的权重矩阵，初始化其他权重矩阵比单位矩阵I（对角矩阵）大一些：

如果层数L非常大，那么此时神经网络的输出 $\hat y$ 将呈指数级增长(忽略 $W^{[L]}$ )：

相反地，如果初始化其他权重矩阵比单位矩阵I小一些：

如果层数L非常大，那么此时神经网络的输出 $\hat y$ 将呈指数级减小(忽略 $W^{[L]}$ )：

如果输入特征x1=x2=1，那么经过每层的激活函数输出后会变成1/2，1/4，1/8..., $1/2^{L}$ ,呈现指数减小.

之前论述了前向传播中激活函数输出将呈现指数增加或减小，对于反向传播中的梯度来说一样，也会呈现指数增加或减小，从而导致训练非常困难。尤其是梯度和L相差指数级，梯度下降法的步长会非常小，梯度下降法将花费很长时间来学习。

11.神经网络的权重初始化

对于梯度爆炸/消失问题有一个不完整的解决方案，合理的初始化权重参数矩阵，使其既不比单位矩阵I过大也不比单位矩阵I过小，从而减缓二者的产生。

对于逻辑回归来说：

如果输入特征数量n很大，为了使z不过大也不过小，一种做法是使 $w_{i}$ 变小。

逻辑回归可以看作是一个简单的神经网络，对于复杂神经网络结构也是如此，需要合理的初始化权重参数矩阵。

1）如果使用ReLU激活函数，权重参数矩阵一般如下初始化：

首先初始化 $W^{[l]}$ 为 $(n^{[l]},n^{[l-1]})$ 的矩阵，矩阵中的值服从标准高斯分布，然后再乘以 $\sqrt {(\frac{2}{n^{[l-1]}})}$ （ $n^{[l-1]}$ 为输入单元数量）。

2）如果使用tanh激活函数，权重矩阵初始化一般最后乘以 $\sqrt {(\frac{1}{n^{[l-1]}})}$ （ $n^{[l-1]}$ 为输入单元数量）

3）也有可能看到，权重矩阵初始化最后乘以 $\sqrt {(\frac{2}{n^{[l-1]}+n^{[l]}})}$

12.梯度的数值逼近

对梯度进行数值逼近，把梯度近似值和实际计算的梯度进行比较，从而检查反向传播计算的梯度是否正确。

单边公差

$f(\Theta )$ 图像：

单边公差就是把 $f(\Theta )$ 在 $\Theta$ 处的导数近似为，图中绿色三角形的高宽比，即：

假设 $\Theta =1,\varepsilon =0.01$ :

误差： $O(\varepsilon )$

双边公差

双边公差就是把 $f(\Theta )$ 在 $\Theta$ 处的导数近似为，图中大绿色三角形的高宽比，即：

假设 $\Theta =1,\varepsilon =0.01$ ：

误差： $O(\varepsilon^{2} )$

由上可见，双边公差比单边公差的误差小，而且二者的计算代价几乎一样，所以实际进行梯度检验时使用的是双边公差作为梯度的近似值。

导数的数学定义，就是 $\varepsilon$ 趋于无穷小时的单边或双边公差：

13.梯度检验

神经网络的梯度检验

1）把神经网络的所有参数拉伸为一个大的向量 $\Theta$

2）把神经网络的所有参数的梯度拉伸为一个大的向量 $d\Theta$

3）用双边公差计算参数的近似梯度，得到一个与 $d\Theta$ 同维的向量 $d\Theta_{approx}$ :

4）比较 $d\Theta$ 和 $d\Theta_{approx}$ ：

14.关于梯度检验实现的标记

实现梯度检验的注意事项

1）不要在训练中使用梯度检验，它只用于调试。计算参数的近似梯度 $d\Theta_{approx}$ 非常慢，用反向传播计算参数的梯度比较快，所以训练过程中不要使用梯度检验来计算参数的梯度，它只用来调试。

2）如果梯度检查失败，要查看 $d\Theta_{approx}$ 和 $d\Theta$ 中的每一项来定位bug，比较 $d\Theta_{approx}[i]$ 和 $d\Theta[i]$ .看看哪几项导致二者的差距很大，然后这几项来自哪一层的参数( $dW^{[l]},db^{[l]}$ )计算的梯度存在bug。

3）执行梯度检验时，如果使用了正则化，不要忘记正则化项

4）不要同时使用dropout和梯度检验。dropout会使一些节点随机失活，此时代价函数J没有明确的定义。一般先关闭dropout(keep_prob=1),然后进行梯度检验，无误后再打开dropout。

5）在随机初始化参数后，运行一次梯度检验；然后在神经网络训练一段时间后(经过很多次迭代后),再运行一次梯度检验。因为在参数w，b接近于0时(刚随机初始化后),梯度下降的实施是正确的，即反向传播的实施是正确的；运行梯度下降一段时间内，参数w，b会增大，反向传播计算的结果可能越来越不准确；反复训练迭代后，参数w，b可能又会减小，反向传播的实施可能又比较准确了。

你可能感兴趣的:(吴恩达深度学习)

吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
吴恩达深度学习笔记(24)-为什么要使用深度神经网络？极客Array
为什么使用深层表示？（Whydeeprepresentations?）我们都知道深度神经网络能解决好多问题，其实并不需要很大的神经网络，但是得有深度，得有比较多的隐藏层，这是为什么呢？我们一起来看几个例子来帮助理解，为什么深度神经网络会很好用。首先，深度网络在计算什么？如果你在建一个人脸识别或是人脸检测系统，深度神经网络所做的事就是，当你输入一张脸部的照片，然后你可以把深度神经网络的第一层，当成一
吴恩达深度学习-L1 神经网络和深度学习总结向来痴_ 深度学习人工智能
作业地址：吴恩达《深度学习》作业线上版-知乎(zhihu.com)写的很好的笔记：吴恩达《深度学习》笔记汇总-知乎(zhihu.com)我的「吴恩达深度学习笔记」汇总帖（附18个代码实战项目）-知乎(zhihu.com)此处只记录需要注意的点，若想看原笔记请移步。1.1深度学习入门我们只需要管理神经网络的输入和输出，而不用指定中间的特征，也不用理解它们究竟有没有实际意义。1.2简单的神经网络——逻
神经网络与深度学习 Neural Networks and Deep Learning 课程笔记第一周林间得鹿吴恩达深度学习系列课程笔记深度学习神经网络笔记
神经网络与深度学习NeuralNetworksandDeepLearning课程笔记第一周文章目录神经网络与深度学习NeuralNetworksandDeepLearning课程笔记第一周深度学习简介什么是神经网络使用神经网络进行监督学习为什么神经网络会兴起本文是吴恩达深度学习系列课程的学习笔记。深度学习简介什么是神经网络深度学习一般是指训练神经网络。那么什么是神经网络？课程以房价预测的例子来说明
学习笔记1《吴恩达深度学习》Deep Learning 木懋懋深度学习
P11.1.1欢迎Welcome深度学习改变了传统互联网业务，例如网络搜索和广告，但是深度学习同时也使得许多新产品和企业以很多方式帮助人们，从获得更好的健康关注，深度学习做得非常好的一个方面就是读取X光图像，到生活中的个性化教育，到精准化农业，甚至到驾驶汽车以及其他一些方面。如果你想要学习深度学习的这些工具，并应用它们来做这些令人窒息的操作，就学习这门课程。在接下来的十年中，我认为我们所有人都有机
吴恩达深度学习-学习笔记p1-p6 丢了橘子的夏天深度学习学习笔记
哔哩哔哩网站视频-[双语字幕]吴恩达深度学习deeplearning.ai网站：up主：mHarvey，视频：[双语字幕]吴恩达深度学习deeplearning.ai一.p11.1欢迎二.p21.2什么是神经网络1.举例：根据面积预测房价假设有六个房子的房屋面积和价格，根据这个数据集，房屋面积预测房价的函数，这些是一个简单的神经网络神经元的功能就是输入面积完成线性运算，取不小于0的值，最后得到预测
吴恩达深度学习笔记(15）-浅层神经网络之神经网络概述极客Array
神经网络概述（NeuralNetworkOverview）从今天开始你将学习如何实现一个神经网络。这里只是一个概述，详细的在后面会讲解，看不懂也没关系，先有个概念，就是前向计算然后后向计算，理解了这个就可以了，有一些公式和表达在后面会详细的讲解。在我们深入学习具体技术之前，我希望快速的带你预览一下后续几天你将会学到的东西。现在我们开始快速浏览一下如何实现神经网络。之前我们讨论了逻辑回归，我们了解了
【吴恩达深度学习】— 参数、超参数、正则化 Sunflow007
32.jpg1.参数VS超参数1.1什么是超参数（Hyperparameters）？比如算法中的learningrate（学习率）、iterations(梯度下降法循环的数量)、L（隐藏层数目）、（隐藏层单元数目）、choiceofactivationfunction（激活函数的选择）都需要你来设置，这些数字实际上控制了最后的参数W和b的值，所以它们被称作超参数。实际上深度学习有很多不同的超参数，
交并比（Intersection over union）双木的木吴恩达深度学习笔记深度学习知识点储备笔记算法机器学习 python 深度学习计算机视觉
来源：Coursera吴恩达深度学习课程如何判断目标检测算法运作良好呢？接下来，你将了解到并交比（intersectionoverunion）函数，可以用来评价目标检测算法。交并比（loU）函数做的是计算两个边界框交集和并集之比。两个边界框的并集是这个区域，就是属于包含两个边界框区域（绿色阴影表示区域），而交集就是这个比较小的区域（橙色阴影表示区域），那么交并比就是交集的大小，这个橙色阴影面积，然
吴恩达深度学习笔记(82)-深度卷积神经网络的发展史极客Array
为什么要探索发展史(实例分析)？我们首先来看看一些卷积神经网络的实例分析，为什么要看这些实例分析呢？上周我们讲了基本构建，比如卷积层、池化层以及全连接层这些组件。事实上，过去几年计算机视觉研究中的大量研究都集中在如何把这些基本构件组合起来，形成有效的卷积神经网络。最直观的方式之一就是去看一些案例，就像很多人通过看别人的代码来学习编程一样，通过研究别人构建有效组件的案例是个不错的办法。实际上在计算机
吴恩达深度学习课程作业--C1W2 HELLOTREE1
1.3-Reshapingarraysv=v.reshape((v.shape[0]*v.shape[1],v.shape[2]))#v.shape[0]=a;v.shape[1]=b;v.shape[2]=c
吴恩达深度学习学习笔记-7建立神经网络猪猪2000 吴恩达深度学习学习笔记神经网络深度学习人工智能机器学习
1.训练神经网络训练神经网络时，需要做许多决策。例如，有多少层网络每层含有多少个隐藏单元学习率各层采用哪些激活函数…这些决策无法一次决定好，通常在项目启动时，我们会先有一个初步想法，然后编码，并尝试运行这些代码，再根据结果完善自己的想法，改变策略。2.train/dev/testsets通常把数据分为训练集，验证集，测试集。我们用训练集数据训练模型，用验证集做holdoutcrossvalidat
【吴恩达深度学习】Keras tutorial - the Happy House 深海里的鱼(・ω<)★ 人工智能机器学习深度学习 keras 深度学习 tensorflow
Kerastutorial-theHappyHouseWelcometothefirstassignmentofweek2.Inthisassignment,youwill:LearntouseKeras,ahigh-levelneuralnetworksAPI(programmingframework),writteninPythonandcapableofrunningontopofsever
吴恩达深度学习第二课-第一周笔记及课后编程题 Giraffeee_ 吴恩达深度学习深度学习人工智能机器学习
笔记训练_开发_测试集小数据时代训练集/测试集的分配比例大致遵循70%/30%或训练集/开发集（或crossvalidationset）/测试集的分配比例大致遵循60%/20%/20%大数据时代只要开发集能够确定哪一个算法/模型有更好的表现，测试集能够无偏评估模型的性能，就称赋予了开发集、测试集足够的数据量了；训练集将被赋予更大比重的数据量。如：训练集/开发集/测试集的比率为98%/2%/2%注：
吴恩达深度学习--神经网络的优化(1) Kangrant 吴恩达深度学习
1.训练集，验证集，测试集选择最佳的Train/Dev/Testsets非常重要。除此之外，构建神经网络时，需要设置的参数很多：神经网络层数，神经元个数，学习率的大小。激活函数的选择等等。实际上很难第一次就确定好这些参数，大致过程是：先确定初始参数，构建神经网络模型，然后通过代码实现该模型，之后进行试验确定模型的性能。根据性能再不断调整参数，重复上述过程，直到让神经网络模型最优。由上述可知，深度学
计划1 JLcucumber
1.吴恩达DL2021(强推|双字)2021版吴恩达深度学习课程Deeplearning.ai_哔哩哔哩_bilibiliPart1神经网络与深度学习（6+19+12+8）共45Part2训练、开发、测试集（14+10+11）共35Part3机器学习策略（13+11）共24Part4计算机视觉（11+14+14+(5+6)）共50Part5序列模型（12+10+15）共372.经典网络模型论文ht
吴恩达深度学习笔记(50)-超参数训练的实践极客Array
超参数训练的实践：PandasVSCaviar（Hyperparameterstuninginpractice:Pandasvs.Caviar）到现在为止，你已经听了许多关于如何搜索最优超参数的内容，在结束我们关于超参数搜索的讨论之前，我想最后和你分享一些建议和技巧，关于如何组织你的超参数搜索过程。如今的深度学习已经应用到许多不同的领域，某个应用领域的超参数设定，有可能通用于另一领域，不同的应用领
2019年上半年收集到的人工智能迁移学习干货文章城市中迷途小书童
2019年上半年收集到的人工智能迁移学习干货文章迁移学习全面指南：概念、项目实战、优势、挑战迁移学习：该做的和不该做的事深度学习不得不会的迁移学习TransferLearning谷歌最新的PlaNet对强化学习以及迁移学习的意义及启发迁移学习时间序列分类如何提高强化学习的可靠性？迁移学习之最大分类器差异的无监督域适应吴恩达深度学习笔记(67)-迁移学习（Transferlearning)深度学习不
吴恩达深度学习intuition Karen_Yu_ 机器学习
这里是看吴恩达课程的一些记录和联想（因为以前听过，因此不会很细致，只做个人记录）课程链接首先提到trainingset,validationset(devset)，testset的分割问题。老师提到，最常用的划分方法传统方法是三七分（也就是training70%，validation+test30%，一般而言validation20%test10%），同时，这也是应对数据集不太大的时候的方法。也可
吴恩达深度学习笔记（2）-什么是神经网络（Neural Network）极客Array
什么是神经网络？(WhatisaNeuralNetwork)我们常常用深度学习这个术语来指训练神经网络的过程。有时它指的是特别大规模的神经网络训练。那么神经网络究竟是什么呢？在这个视频中，会讲解一些直观的基础知识。首先，让我们从一个房价预测的例子开始讲起。假设你有一个数据集，它包含了六栋房子的信息。所以，你知道房屋的面积是多少平方英尺或者平方米，并且知道房屋价格。这时，你想要拟合一个根据房屋面积预
吴恩达深度学习笔记(28)-网络训练验证测试数据集的组成介绍极客Array
从今天开始我们进入新的一个大方向了，改善深层神经网络：超参数调试、正则化以及优化，首先进入深度学习的一个新层面，先认识下在深度学习中的数据集的分类。之前可能大家已经了解了神经网络的组成的几个部分，那么我们将继续学习如何有效运作神经网络，内容涉及超参数调优，如何构建数据，以及如何确保优化算法快速运行，从而使学习算法在合理时间内完成自我学习。训练，验证，测试集（Train/Dev/Testsets）在
吴恩达深度学习-序列模型 3.10触发字监测 + 课程总结 prophet__
今天学习的是触发字检测，这个说起来可能有点学术，但是简单来说就是。hey,siri!然后你的手机就会亮起来，这就是触发字检测。首先，关于触发字检测还处于发展阶段，并没有一个以绝对优势取胜的算法。如果我们想建立一个算法，那么我们首先要知道数据集如何进行标记，如果从简单的结果来想，我们可以在每次完成一次触发字之后的那个时间设置为1，其他时间设置为0。但这样做是有一些问题的，因为大部分时间是不会触发的，
深度学习记录--矩阵维数蹲家宅宅深度学习记录深度学习矩阵人工智能
如何识别矩阵的维数如下图矩阵的行列数容易在前向和后向传播过程中弄错，故写这篇文章来提醒易错点顺便起到日后查表改错的作用本文仅作本人查询参考(摘自吴恩达深度学习笔记)
吴恩达深度学习笔记(36)-神经网络的梯度消失/梯度爆炸极客Array
梯度消失/梯度爆炸（Vanishing/Explodinggradients）训练神经网络，尤其是深度神经所面临的一个问题就是梯度消失或梯度爆炸，也就是你训练神经网络的时候，导数或坡度有时会变得非常大，或者非常小，甚至于以指数方式变小，这加大了训练的难度。这节课，你将会了解梯度消失或梯度爆炸的真正含义，以及如何更明智地选择随机初始化权重，从而避免这个问题。假设你正在训练这样一个极深的神经网络，为了
吴恩达深度学习笔记(45)-Adam 优化算法(Adam optimization) 极客Array
Adam优化算法(Adamoptimizationalgorithm)在深度学习的历史上，包括许多知名研究者在内，提出了优化算法，并很好地解决了一些问题，但随后这些优化算法被指出并不能一般化，并不适用于多种神经网络，时间久了，深度学习圈子里的人开始多少有些质疑全新的优化算法，很多人都觉得动量（Momentum）梯度下降法很好用，很难再想出更好的优化算法。所以RMSprop以及Adam优化算法，就是
吴恩达深度学习（六）带刺的小花_ea97
超参数调整第一课：调整过程调整神经网络的过程包含了对许多不同超参数的设置，那么怎么样为这些参数找到比较合适的设定值呢？准则和系统化进行超参数设置的技巧将帮助你更加快速有效的获得合适的超参数。在深度神经网络训练中，面对大量的超参数，包括学习速率α、动量超参数β1、Adam优化算法中的超参数β2和ε、网络层数以及每层网络中隐藏单元的数量、学习率衰减情况下不可能只有单一的学习率、mini-batch的大
2023-11-21时间记录多喝开水少熬夜学习计划与实际学习
2023-11-21时间记录期望：学Linux听英语课程深度学习阅读书籍，也可以练练字今天干了什么2023-11-21时间记录8:30（下床）10:00（开始学习）学习输出8:30（下床）洗漱煮蛋，9:45出门10:00（开始学习）10:00-11:30英语听力吴恩达深度学习deeplearning.ai+社交间歇休息：吃午饭+锻炼（走圈25min）14:00-15:30：学Linux-thrif
吴恩达深度学习Course1-Week(3) 木心 DeepLearning 神经网络深度学习机器学习
吴恩达深度学习Course1-Week(3)文章目录吴恩达深度学习Course1-Week(3)一、什么是神经网络NeuralNetwork?（1）由逻辑回归到神经网络（2）神经网络的符号规定（3）向量化Vectorization（4）向量化后伪编程Programing二、激活函数ActiveFunction（1）常用的四种激活函数（2）四种激活函数的导数Derivatives三、梯度下降法Gra
吴恩达深度学习Course1-Week(1)(2) 木心 DeepLearning 深度学习神经网络机器学习
吴恩达深度学习Course1-Week(1)(2)文章目录吴恩达深度学习Course1-Week(1)(2)一、影响神经网络的性能的因素二、逻辑回归(logisticregression)中的一些符号(Notation)规定三、逻辑回归中的激活函数四、损失函数(lossfunction)与成本函数(costfunction)五、梯度下降法(GradientDescent)六、前向传播(forwar
吴恩达深度学习Course2-Week(1) 木心 DeepLearning 深度学习机器学习
吴恩达深度学习Course2-Week(1)文章目录一、Train/Dev/Test二、为什么双边导数的定义精度更高？三、机器学习基本方法BasicRecipeforMachineLearning一、Train/Dev/Test交叉验证集(Holdoutcrossvalidationset/Developmentset)与测试集(Testset)最好是同一分布。在一些情况下，没有测试集也没关系，测
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开