wutao02

神经网络介绍--数据预处理、权重初始化及正则化

目录
数据和模型的处理
- 数据预处理
  - 减去平均值
  - 规范化(normalization)
  - PCA和白化(whiten)
  - 常见的陷阱
- 权重初始化
  - 陷阱：全零初始化
  - 使用小随机数初始化
  - 用1 / sqrt（n）标准化方差
  - 稀疏初始化
  - 初始化偏差
  - 批量标准化
正则化
- L2正则化
- L1正则化
- 最大范数约束
- Dropout
损失函数
- 分类问题
- 属性分类
- 回归
- 结构化预测
小结

数据和模型的处理

在前面的章节中，我们介绍了神经元模型，它计算输入和权重的点积后对其使用非线性函数，以及分层结构的神经网络。总之，这些选择定义了“得分函数”的新形式，我们已经扩展了简单线性映射的形式。具体而言，神经网络执行一系列线性映射并交织着非线性函数。在本节中，我们将讨论关于数据预处理，权重初始化和损失函数的选择。

数据预处理

有三种常见的数据预处理的方式，我们假设数据矩阵 X 的大小为 [N×D] （ N 是数据的数量， D 是它们的维数）。

减去平均值

是最常见的预处理形式。这个方法减数据中每个单独特征的平均值，它的几何解释是能够将数据的中心向原点靠近。在numpy中，这个操作可以这样实现：X -= np.mean（X，axis = 0）。特别是处理图像数据时，为了方便，从所有像素中减去单个值是很常用的预处理方式（例如，X -= np.mean（X）），或者也能在三个颜色通道上分别处理。

规范化(normalization)

是指规范化数据分布范围，使其具有大致相同的规模。有两种常见的方法来实现这种处理。一是将每个维度除以它的标准偏差（当数据均值为0时)：（X /= np.std（X，axis = 0））。另一种方式是将每个维度规范化，使每个维度最小值和最大值分别为-1和1。只有不同的输入特征具有不同的尺度时（或单位），应用这种预处理才有意义，但它们应该对学习算法来说基本上同样重要。在处理图像的情况，像素的尺寸已经大致相等（范围从0到255），因此不必严格执行这个预处理步骤。

图1 常见的数据预处理流水线。左：原始的2维输入数据。中间：通过减去每个维度的平均值，数据以零为中心。数据云现在集中在原点周围。右图：每个维度都是根据其标准差缩放。红线表示数据的范围，它们在两个维度的范围是相等的。

PCA和白化(whiten)

是预处理的另一种形式。在这个过程中，数据首先如上所述居中处理。然后，我们可以计算协方差矩阵，告诉我们关于数据的相关性：

＃大小为[N×D]的输入数据矩阵X
X - = np.mean（X，axis = 0）＃零中心数据（重要）
cov = np.dot（X.T，X）/ X.shape [0]＃获得数据协方差矩阵

数据协方差矩阵的（i，j）元素包含数据的第i维和第j维之间的协方差,这个矩阵的对角线包含了数据的方差。此外，协方差矩阵是对称的和半正定的。我们可以计算数据协方差矩阵的SVD分解：U，S，V = np.linalg.svd（cov）。U的列是特征向量，S是奇异值的一维数组。为去除数据的相关性，我们将原始数据（以零为中心）投影到特征向量上：Xrot = np.dot（X，U）＃解除关联数据。
注意U的列是一组正交向量（范数为1，并且彼此正交），所以它们可以被看作是基向量。因此投影相当于数据的旋转，使得特征向量作为新的坐标轴。如果我们要计算Xrot的协方差矩阵，我们会发现它是对角的。 np.linalg.svd的很棒的一个特性是在其返回值U中，特征向量列按其特征值排序。我们可以通过只使用前几个特征向量来减少数据的维度，并丢弃数据方差很小的维度。这有时也被称为主成分分析（PCA）降维：

Xrot_reduced = np.dot（X，U [：，：100]）＃Xrot_reduced变成[N×100]
在这个操作之后，我们可以将大小为[N×D]的原始数据集缩小到[N×100]的大小，得到包含最多方差的数据的100个维度。通常情况下，您可以通过PCA简化数据集，从而节省训练线性分类器或神经网络的空间和时间。
在实践中可能用上的最后一个转换方法是白化。白化操作将基于特征向量的数据除以每个维度的特征值以规范化。这种变换的几何解释是，如果输入数据是一个服从高斯分布的多重变量，那么白化数据将数据转化为具有零均值和单位协方差矩阵的高斯变量。以下代码可以实现白化：

＃白化数据：
＃除以特征值（其是奇异值的平方根）
Xwhite = Xrot / np.sqrt（S + 1e-5）

警告：放大噪音。请注意，我们添加1e-5（或一个小常数）以防止被零除。这种转变的一个弱点是，它可能会放大数据中的噪音，因为它将所有维度（包括大部分是噪音的不相关维度）延伸到输入中具有相同大小。实际上，这可以通过更强的平滑（即增大1e-5的值）来缓解。

图2 PCA /白化。左：原始2维输入数据。中间：执行PCA后。数据以零为中心，然后旋转到数据协方差矩阵的特征基向量中。这使数据去相关（协方差矩阵变成对角线）。右图：每个维度都是根据特征值进行缩放的，将数据协方差矩阵转换为单位矩阵。在几何上，这对应于将数据拉伸和压缩成各向同性的高斯斑点。

我们也可以尝试用CIFAR-10的图像对这些转换进行可视化。 CIFAR-10的训练集大小为50,000 x 3072，其中每个图像都被拉伸成3072维的行向量。然后，我们可以计算[3072 x 3072]协方差矩阵并计算其SVD分解（操作相对费时）。计算出的特征向量看起来像什么？可视化可能有所帮助：

图3 左：一组49个图像。从左数第二个：3072个特征向量中的前144个。顶部特征向量解释了数据中的大部分变化，我们可以看到它们对应于图像中的较低频率。右起第二个：使用之前展示的144个特征向量，用PCA对49个图片降维。也就是说，不是将每个图像表示为3072维矢量，其中每个元素是某个位置和通道处特定像素的亮度，而是仅用144维矢量表示，每个图片计算它的144个特征向量，然后合起来组成图像。为了可视化144个数字中保留的图像信息，我们必须回到基于3072个数字的“像素”中。由于U是一个旋转，所以可以通过乘以 U.transpose（）[：144 ,:]来实现，然后将生成的3072个数字可视化为图像。您可以看到图像稍微模糊，反映了顶部特征向量捕捉较低频率的事实。但是，大部分信息仍然保留。右图：“白化”的可视化表示，144个维度的每个维度的变化都被压缩至相等长度。通过乘以 U.transpose（）[：144，：]，将白化的144个数字旋转回图像像素。较低的频率（占绝大多数的变化）变得可以忽略不计，而较高的频率（其原先相对较小的变化）则被放大了。

为了完整性，我们在这里提到了PCA和白化，但是在实际中，这些转化不适用于卷积网络。然而，将数据转化为零中心数据非常重要，每个像素的规范化也很常见。

常见的陷阱

关于预处理的重要一点是任何预处理统计数据（例如数据平均值）只能在训练数据上计算，然后应用到验证/测试数据。计算平均值并从整个数据集中的每个图像中减去平均值，然后将数据分割成train / val/test分割是错误的。平均值只能在训练数据上计算，然后从所有数据（train / val / test）中减去相同的平均值。

权重初始化

我们学会如何构建神经网络架构，以及如何预处理数据。在我们开始训练网络之前，我们必须初始化它的参数。

陷阱：全零初始化

让我们从不应该做的事开始。请注意，我们不知道在训练好的网络中每个权重的最终值应该是多少，但通过正确的数据规范化，大约一半的权重是正数一半是负数的假设是合理的。一个合理的观点可能是将所有初始权重设置为零，我们认为这是期望中的“最佳猜测”。这是错误的，因为如果网络中的每个神经元计算出相同的输出，那么它们也将在反向传播期间计算相同的梯度并且进行完全一样的参数更新。换句话说，如果它们的权重被初始化为相同，那么神经元之间就不能打破参数的对称性。

使用小随机数初始化

我们仍然希望权重非常接近零，但正如我们上面所论述的那样，不能是相同的零。作为一种解决方案，通常将神经元的权重初始化为小数值，并参照这样做打破对称性。这个想法是，神经元在开始时都是随机且独特的，所以他们将计算不一样的权重更新，并将自己作为为完整网络的不同部分。一个权重矩阵的实现可能看起来像 W=0.01∗np.random.randn（D，H），其中randn是来自零均值、方差为1的高斯分布取样。通过这个公式，每个神经元的权向量被初始化为从多维高斯向量采样的一个随机向量，所以神经元指向输入空间的随机方向。取样也可以是平均分布的，但这对实践中的最终表现影响相对较小。

警告：数字越小不一定越好。例如，具有非常小权重的神经网络层将在反向传播期间在其数据上计算非常小的梯度（因为该梯度与权重的值成比例）。这会大大减少通过网络后向传播时“梯度信号”，并且可能成为深度网络的关注点(译注？？？)。

用1 / sqrt（n）标准化方差

上述方法的一个问题是，随机初始化神经元输出的方差会随着输入数量增长的增长。事实证明，我们可以将每个神经元输出的方差标准化为1，方法是将其权重向量乘以输入数量的平方根。也就是说，推荐的启发式方法是将每个神经元的权向量初始化为：w = np.random.randn（n）/ sqrt（n），其中n是其输入的数量。这确保了网络中的所有神经元最初具有大致相同的输出分布,经验证明这能提高模型的收敛速度。

推导如下：考虑权重w和输入x之间的内积 s=Σniwixi ，s是非线性激活之前的神经元的原始激活值。我们可以得到s的方差：

V a r (s) = V a r (Σ n i w i x i)

= Σ n i V a r (w i x i)

= Σ n i [E (w i)] 2 V a r (x i) + [E (x i)] 2 V a r (w i) + V a r (x i) V a r (w i)

= Σ n i V a r (w i) V a r (x i)

= (n V a r (w)) V a r (x)

在推导的前两个步骤中我们使用了方差的性质。第三步中，我们假定输入和权重的均值为0，所以 E[xi]=E[wi]=0 。需要注意的是，通常实际不是这种情况：例如，ReLU单元具有正的平均值。在最后一步，我们假设所有wi，xi都是独立分布的。从这个推导我们可以看出，如果我们想要s具有与其输入x相同的方差，那么在初始化期间我们应该确保每个权重的方差w是 1/n 。由于 Var（aX）=a2Var（X） ,对于一个随机变量X和一个标量a，这意味着我们用 a=1/n‾√ 缩放变量，就能使其方差为1 / N。因此，我们初始化w = np.random.randn（n）/ sqrt（n）。
在Glorot等人的“Understanding the difficulty of training deep feedforward neural networks”中进行了类似的分析。在文章中，作者建议初始化形式 Var（w）=2/（nin+nout），其中 nin，nout 是前一层和下一层中的单元数。这是基于对反向传播梯度的妥协和等效分析。近期关于此主题的论文有“Delving Deep into Rectifiers: Surpassing Human-Level Performance on ImageNet Classification ”，文章推导出专门针对ReLU神经元的初始化，得出网络中神经元的方差应为 2.0/n 。这给出了初始化 w = np.random.randn（n）* sqrt（2.0 / n），这是现在推荐在采用ReLU神经元的神经网络的使用的初始化方法。

稀疏初始化

解决未校准方差问题的另一种方法是将所有权重矩阵设置为零，但是为了打破对称性，每个神经元随机连接（和上文类似，权重从高斯分布中抽样）到它下面的固定数量的神经元。连接的神经元数典型的取值为小于10。

初始化偏差

将偏差初始化为零是可能的也是常见的，因为打破不对称是由权重中的小随机数完成的。对于ReLU非线性，有些人喜欢对所有偏差初始化为一小的常数值，例如0.01，因为这可以确保所有ReLU单位在开始时激活并因此获得并传播一些梯度。然而，目前尚不清楚这是否能够提供一致的改进（实际上有些结果似乎表明这种情况表现较差），仅使用0偏差初始化更为常见。

在实践中，目前的建议是使用ReLU单位并使用w = np.random.randn（n）* sqrt（2.0 / n），如He等人所述。

批量标准化

Ioffe和Szegedy最近开发的称为批量标准化（Batch Normalization）的技术通过在训练开始时强制整个网络中的参数使用单位高斯分布来初始化神经网络，从而减少了许多麻烦。仔细观察发现这是有可能的，因为标准化是一个简单可微的操作。在实现中，应用这种技术通常相当于在完全连接的层（或卷积层，我们很快就会看到）之后，在非线性之前插入 BatchNorm 层。我们不在这里展开这种技术，它在相关文章中有很好的描述。但请注意，在神经网络中使用批量标准化已经成为一种非常普遍的做法。在实践中，使用批量标准化的网络比不好的初始化的具有更好的鲁棒性。此外，批量标准化可以解释为在网络的每一层进行预处理，但是以可微的方式集成到网络本身中。

正则化

有几种方法可以控制神经网络防止过拟合的能力：

L2正则化

也许是正则化最常见的形式。它可以通过直接在目标中惩罚所有参数的平方来实现。也就是说，对于网络中的每个权重 w ，我们将 12λw2 添加到目标中，其中λ是正则化强度。通常在前面看到 12 的因子，因为这样做的话，参数w的这个项的梯度就是λw而不是2λw。 L2规则化的直观解释是严重惩罚峰值大的权重，而偏向于比较均匀的权重。正如我们在线性分类部分所讨论的那样，由于权重和输入之间的乘法交互作用，L2正则化具有很好的特性，即鼓励网络对所有输入都使用一些，而不是过度使用某些输入。最后，请注意，在梯度下降参数更新时，使用L2正则化最终意味着每个权重都线性衰减至0： W+=−λ∗W 。

L1正则化

是另一种相对常见的正则化形式，其中对于每个权重w，我们将λ|w|添加到目标中。也可以将L1正则化与L2正则化结合起来：λ1|w|+λ2w2（这被称为Elastic net regularization）。 L1正则化具有令人感兴趣的性质，它导致权重向量在优化期间变稀疏（即非常接近零）。换句话说，具有L1正则化的神经元最终只使用其最重要输入的稀疏子集，并且对“噪声”输入几乎不变。相比之下，来自L2正则化的最终权重向量通常是弥散的，权重值较小。在实践中，如果你不关心特征的选择，那么L2正则化可以比L1提供更好的性能。

最大范数约束

正则化的另一种相对常见的形式，它对每个神经元的权重执行绝对上限，并使用投影梯度下降来实现这种约束。在实践中，这相应于正常执行参数更新，然后强制每个神经元的权向量 ||w||2<c 。 c的典型值约为3或4,有人在使用这种形式的正则化时称其是有效的。其吸引人的特性之一是，即使学习率设置得太高，网络也不会“爆炸”，因为更新总是有界的。

Dropout

是Srivastava等人最近引入的非常简单有效的正则化技术。：Dropout: A Simple Way to Prevent Neural Networks from Overfitting（pdf）。训练时，Dropout让神经元以概率p（超参数）为活动的，否则将其设置为0来实现的，如图3所示。

图3 从Dropout报告中摘取的图表说明了这个想法。在训练期间，丢失可以被解释为在完整的神经网络中对神经网络进行采样，并且仅更新采样网络的参数。（然而，可能采样网络的参数并不是独立的，因为它们可能共享参数）。在测试时不使用Dropout，因为预测结果为所有子网络整体的平均预测（后文介绍集成模型时会提到）。

示例中的3层神经网络Dropout的普通实现如下：

"""Dropout: 不推荐的实现 """

p = 0.5 # 丢弃神经元的概率

def train_step(X):
  """ X contains the data """

  # 前向传播
  H1 = np.maximum(0, np.dot(W1, X) + b1)
  U1 = np.random.rand(*H1.shape) < p # first dropout mask
  H1 *= U1 # drop!
  H2 = np.maximum(0, np.dot(W2, H1) + b2)
  U2 = np.random.rand(*H2.shape) < p # second dropout mask
  H2 *= U2 # drop!
  out = np.dot(W3, H2) + b3

  # backward pass: compute gradients... (not shown)
  # perform parameter update... (not shown)

def predict(X):
  # ensembled forward pass
  H1 = np.maximum(0, np.dot(W1, X) + b1) * p # NOTE: scale the activations
  H2 = np.maximum(0, np.dot(W2, H1) + b2) * p # NOTE: scale the activations
  out = np.dot(W3, H2) + b3

在train_step函数中，在第一个隐藏层和第二个隐藏层上执行了两次Dropout操作。我们也可以在输入层执行Dropout操作，这样就需要给输入X创建一个二进制掩码。反向传播则必须考虑生成的掩码U1，U2。

至关重要的是，在predict函数中，我们不使用Dropout，但是我们对两个隐藏层得出输出都要执行一个p的缩放。这一点很重要，因为在测试时所有神经元都被激活，但是我们希望测试时神经元的输出与训练时期的输出期望相同。例如，在 p=0.5 的情况下，神经元在测试时必须将他们的输出减半，使得其输出期望与训练时相同。考虑神经元x的输出（在Dropout之前），执行Dropout时,因为神经元的输出将以概率1-p被设置为零,因此这个神经元的期望输出将变成 px+（1−p）0 。在测试时，当我们保持神经元始终处于活动状态时，我们必须调整 x→px 以保持相同的期望输出。可以看出，在测试时执行这种衰减类似于遍历所有可能的子网络(指数级),并计算集成模型的预测结果。

这个方法的缺点在于我们必须在测试时间通过p来缩放激活值。由于测试时对性能要求很高，因此最好使用反向Dropout(inverted Dropout)，它在训练时执行缩放，而在测试时间不做任何缩放。此外，当你调整在哪些神经元中应用Dropout时，预测代码无需更改。反向Dropout的实现如下：

"""
Inverted Dropout: Recommended implementation example.
We drop and scale at train time and don't do anything at test time.
"""

p = 0.5 # probability of keeping a unit active. higher = less dropout

def train_step(X):
  # forward pass for example 3-layer neural network
  H1 = np.maximum(0, np.dot(W1, X) + b1)
  U1 = (np.random.rand(*H1.shape) < p) / p # first dropout mask. Notice /p!
  H1 *= U1 # drop!
  H2 = np.maximum(0, np.dot(W2, H1) + b2)
  U2 = (np.random.rand(*H2.shape) < p) / p # second dropout mask. Notice /p!
  H2 *= U2 # drop!
  out = np.dot(W3, H2) + b3

  # backward pass: compute gradients... (not shown)
  # perform parameter update... (not shown)

def predict(X):
  # ensembled forward pass
  H1 = np.maximum(0, np.dot(W1, X) + b1) # no scaling necessary
  H2 = np.maximum(0, np.dot(W2, H1) + b2)
  out = np.dot(W3, H2) + b3

在引入Dropout的概念后，人们进行了大量的研究，试图了解它在实践中的如此有效的原因，以及它与其他正则化技术的关系。有兴趣的读者可以进一步阅读：

Srivastava等人的Dropout论文。
“Dropout Training as Adaptive Regularization ：“研究表明，将输入数据根据Fisher information matrix 的估计缩放后，Dropout一阶等价于 L2 正则化”。
前向传播的噪音。更广泛的来说，Dropout属于在前向传播中引入随机行为的一种方法。理论分析中，噪音的作用会减小（比如Dropout测试时乘以p），通过采样，随机执行多个前向传播然后对它们的结果进行平均，同样也减小了噪音。在这个方向上的其他研究有DropConnect，文中将一个随机权重的子集在正向传递期间设置为0。剧透一下，卷积神经网络还利用了stochastic pooling, fractional pooling, and data augmentation等方法。稍后我们将详细介绍这些方法。

偏差正则化。正如我们在“线性分类”部分中已经提到的那样，偏差参数正则化并不常见，因为它们不和数据通过乘法产生相互作用。但是，在实际应用中（并且具有适当的数据预处理），正则化偏差很少会导致性能显著变差。这很可能是因为与所有权重相比，偏差项的数量非常少，所以如果分类器需要正则化偏差来获得更优的数据损失，那么对偏差正则化也是能够接受的。

逐层正则化。对不同的层采用不同的正则化强度（除了输出层）不太常见。关于这个想法的结果的文献也不多。

在实践中：使用交叉验证的全局L2正则化是最常见的。将其与在所有层之后应用Dropout相结合也很常见。 p = 0.5是一个合理的默认值，但可以根据交叉验证进行调整。

损失函数

我们已经讨论了正则化损失，这可以当作对模型复杂性的一种惩罚。目标函数的第二部分是数据损失(data loss)，数据损失在监督学习问题中用来衡量预测结果（例如分类中的类别分数）和样本实际标签之间的一致性。数据损失取为每个样本数据损失的平均值。也就是说， L=1NΣNiLi 其中N是训练数据的数量。让我们缩写 f=f（xi;W）作为神经网络中输出层的激活函数。在实践中可能需要解决几种类型的问题：

分类问题

是我们迄今为止详细讨论过的问题。在这里，我们假设每个样本都有一个样本数据集和一个正确的标签。在这种情况下，最常见的两种损失函数之一是SVM：

L i = Σ j \neq y, i m a x （ 0 ， f j - f y i + 1 ）

有些人研究表明，用平方hind损失获得了更好的性能（即使用

max（0，fj−fyi+1)2 m a x （ 0 ， f j − f y i + 1 ) 2 ）。第二个常见选择是使用交叉熵损失的Softmax分类器：

L i = - l o g （ e f y i Σ j e f j ）

当样本类别数量非常多时，这种损失函数就会出现问题。因此，当标签集非常大时（例如英文字典中的单词或包含22000个类别的ImageNet），使用 Hierarchical Softmax可能会有所帮助。Hierarchical softmax将标签分解成树。每个标签可以表示为沿着树的路径，在树的每个节点处训练Softmax分类器来消除左右分支之间的歧义(译注：？？？)。分类器的性能受树的结构影响很大，而这通常又与具体问题相关。

属性分类

上述两种损失都假定只有一个正确的标签 yi 。但是如果 yi 是一个二元向量，那么每个样本都可能有或没有某一特定属性，而且这些属性不是唯一的。例如，Instagram上的图片可以被认为是来自所有主题标签中的特定标签子集，而图像可能包含多个标签。在这种情况下，一个好方法是为每个属性单独构建一个二元分类器。例如，每个类别的二元分类器将独立采用以下形式：

L i = Σ j m a x （ 0, 1 - y i j f j ）

求和遍历所有类别j，

yij y i j 是+1或-1取决于第i个示例是否标记有第j个属性，当类别被预测为是时，向量

fj f j 将是正的,否则为负。请注意，如果正样本的分数低于+1，或者负数示例的分数高于-1，则累计损失。

这种损失的替代方法是独立训练每个属性的逻辑回归分类器。二元逻辑回归分类器只有两个类（0,1），并计算类1的概率为：

P （ y = 1 | x; w, b ） = 1 1 + e - （ w T x + b ） = σ （ w T x + b ）

由于类1和0的概率总和为1，所以类0的概率是

P （ y = 0 | x; w, b ） = 1 - P （ y = 1 | x; w, b ）

。因此，如果

σ（wTx+b）>0.5 σ （ w T x + b ） > 0.5 ，则将例子分类为正例（y = 1），或者等价地如果wTx + b> 0，则将例子分类为正例。损失函数使这个概率的对数似然最大化。简化为：

L i = Σ j y i j l o g (σ (f j)) + （ 1 - y i j) l o g (1 - σ (f j))

其中标签

yij y i j 被假定为1（正）或0（负），

σ（⋅） σ （ ⋅ ）是sigmoid函数。上面的表达式可能看起来很可怕，但f上的梯度实际上非常简单直观：

∂Li/∂fj=yij−σ（fj） ∂ L i / ∂ f j = y i j − σ （ f j ）。

回归

是预测实值的任务，例如房屋价格或图像中某物的长度。对于这项任务，计算预测值与真实值之间的损失是很常见的，L2范数或L1范数也同样常见。计算单个样本损失的L2范数的平方将有如下的形式：

L i = | | f - y i | | 22

L2范数取平方的原因是为了在不改变最优参数结果的情况下，让梯度变得更简单，因为平方是单调操作。 L1范数则将每个维度的绝对值相加：

L i = | | f - y i | | 1 = Σ j | f j - (y i) j |

其中

Σj Σ j 是所需预测的所有维度的总和(如果有多于一个的预测量)。以第i个例子的第j个维度为例，

δij δ i j 表示真实值和预测值之间的差值，这个维度的梯度（即

∂Li/∂fj ∂ L i / ∂ f j ）,求导很容易就能得到其结果，对于L2结果为

δij δ i j ,L1则为

sign(δij) s i g n ( δ i j ) (符号)。也就是说，梯度将直接与误差成比例，或者它将是仅继承误差的符号。

注意事项：要注意，L2损失比Softmax等更加稳定的损失更难优化。直观地说，它需要网络为每个输入（及其增量）准确输出一个正确的值。请注意，Softmax并非如此，每个分数的精确值并不重要：只要它们的大小是匹配的就行（例如，二分类问题中，评分[1,2]与评分[0.1,0.2]是一样的）。此外，L2损失鲁棒性较弱，因为异常值可能会产生很大的梯度。当面临回归问题时，首先考虑是不是绝对不能将问题转化为分类问题。例如，如果您要预测某个产品的星级评分，那么使用5个独立分类器评估1-5星而非回归可能会更好。分类有很多额外的好处，它可以给你一个回归输出的分布，而不仅仅是单一的输出，而不输出其置信程度。如果您确定分类是不合适的，请使用L2，但要小心：L2更脆弱，并且在网络中使用Dropout（特别是在L2之前的层中）并不是一个好主意。

结构化预测

结构化损失是指标签可以是任意结构（如图形，树或其他复杂对象）的情况。通常还假定结构的空间非常大，并且不易枚举。结构化支持向量机损失背后的基本思想是要求在正确的结构 yi 和得分最高的不正确结构之间有一个间隔。这个问题一般无法作为梯度下降的简单无约束优化问题来解决。相反，通常需要设计特殊求解方法，以便可以利用结构空间的特定条件。我们简要地提一下这个问题，但这些细节超出了课堂范围。

小结

综上所述：

我们推荐的预处理方式是将数据居中使其具有零均值，并将每个特征归一化为[-1,1]范围
用标准差为 2N‾‾√ 的高斯分布来初始化权重，其中n是神经元输入的数量。在numpy中： w = np.random.randn（n）* sqrt（2.0 / n）。
使用L2正则化和Dropout（反转版本）
使用批量标准化
我们讨论了可能在实践中执行的不同任务，以及每项任务最常见的损失函数
我们现在学会了如何预处理数据并初始化模型。在下一节中，我们将学习如何监控学习过程及其动态。

你可能感兴趣的:(算法学习,神经网络,机器学习,公开课)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
准备胡珊珊乐平九小
尊敬的各位领导、各位同仁们：大家上午好！我是来自乐平九小的胡珊珊。今天很高兴能有机会给大家做“智慧作业”应用培训。说到“智慧作业”我感触颇多，我是在智慧作业中成长起来的，我也时常以自己是一名“智慧作业人”自居。早在2020年疫情期间，学校电教处周光杰主任在学校群里发出智慧作业抢题通知，我看了有些心动，一节微课相当于一次省级公开课，这对于我们普通老师是多么难得的机会啊。但想归想，我也不会用软件啊，再
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
经济金融学公开课学习总汇（九）佳佳爱科技AITech
本章内容：1.什么是金融风险2.什么是风险偏好与满意度，人都是风险厌恶吗3.单一投资还是多元投资4.无差别曲线金融风险：金融风险是指金融变量的各种可能值偏离期望的可能性以及幅度，所以风险不是说，一定会发生概率的亏损或者偏离回报，它也有可能发生超额的回报作为理财的投资人，我们一般只关注系统风险（经济环境不好造成房市大跌等）。还有非系统性风险（购买理财，卷款跑路等）。其中系统风险是可分散的风险；后者是
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
神经网络传递函数sigmoid,神经网络传递函数作用快乐的小荣荣神经网络机器学习深度学习人工智能
神经网络传递函数选取不同会有特别大差别嘛？只是最后一层，但前面层是非线性，那么可能存在区别不大的情况。线性函数f(a*input)=af(input),一般来说，input为向量，最简化情况下，可以假设input的各个维度，a1=a2=a3。。。意味着你线性层只是简单的对输入做了scale~而神经网络能起作用的原因，在于通过足够复杂的非线性函数，来模拟任何的分布。所以，神经网络必须要用非线性函数。
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
Python和R均方根误差平均绝对误差算法模型亚图跨际 Python 交叉知识 R 回归模型误差指标归一化均方根误差生态状态指标神经网络成本误差气体排放气候模型多项式拟合
要点回归模型误差评估指标归一化均方根误差生态状态指标神经网络成本误差计算气体排放气候算法模型Python误差指标均方根误差和平均绝对误差均方根偏差或均方根误差是两个密切相关且经常使用的度量值之一，用于衡量真实值或预测值与观测值或估计值之间的差异。估计器θ^\hat{\theta}θ^相对于估计参数θ\thetaθ的RMSD定义为均方误差的平方根：RMSD⁡(θ^)=MSE⁡(θ^)=E((θ^−θ
两种方法判断Python的位数是32位还是64位 sanqima Python编程电脑 python 开发语言
Python从1991年发布以来，凭借其简洁、清晰、易读的语法、丰富的标准库和第三方工具，在Web开发、自动化测试、人工智能、图形识别、机器学习等领域发展迅猛。 Python是一种胶水语言，通过Cython库与C/C++语言进行链接，通过Jython库与Java语言进行链接。 Python是跨平台的，可运行在多种操作系统上，包括但不限于Windows、Linux和macOS。这意味着用Py
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性 aehrutktrjk 人工智能 easyui 前端 python
使用最大边际相关性(MMR)选择示例：提高AI模型的多样性和相关性引言在机器学习和自然语言处理领域，选择合适的训练示例对模型性能至关重要。最大边际相关性(MaximalMarginalRelevance,MMR)是一种优秀的示例选择方法，它不仅考虑了示例与输入的相关性，还注重保持所选示例之间的多样性。本文将深入探讨如何使用MMR来选择示例，以提高AI模型的性能和泛化能力。什么是最大边际相关性(MM
LangChain集成指南:如何利用多样化的AI提供商 aehrutktrjk 人工智能 langchain python
LangChain集成指南:如何利用多样化的AI提供商引言在人工智能和机器学习领域,LangChain已成为一个强大而灵活的框架,允许开发者轻松集成各种AI服务提供商。本文将深入探讨LangChain的集成能力,介绍如何利用不同的AI提供商来增强你的应用程序,并提供实用的代码示例。LangChain集成概览LangChain支持多种AI提供商的集成,这些集成可以分为两类:独立包集成:这些提供商有独
机器学习VS深度学习 nfgo 机器学习
机器学习（MachineLearning,ML）和深度学习（DeepLearning,DL）是人工智能（AI）的两个子领域，它们有许多相似之处，但在技术实现和应用范围上也有显著区别。下面从几个方面对两者进行区分：1.概念层面机器学习：是让计算机通过算法从数据中自动学习和改进的技术。它依赖于手动设计的特征和数学模型来进行学习，常用的模型有决策树、支持向量机、线性回归等。深度学习：是机器学习的一个子领
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开