酸辣土豆

深度学习

神经网络中的Epoch，Iteration，Batchsize
反向传播
CNN本质和优势
局部卷积（提取局部特征）
权值共享（降低训练难度）
Pooling（降维，将低层次组合为高层次的特征）
多层次结构
鞍点的定义和特点
若某个一阶导数为0的点在至少一个方向上的二阶导数小于0，那它就是鞍点。
**最优点和鞍点的区别：**在于其在各个维度是否都是最低点，只要某个一阶导数为0的点在某个维度上是最高点而不是最低点，那它就是鞍点。
神经网络数据处理方法有哪些
中心化/零均值（zero-center）：每一个数据减去每一维数据的平均值
归一化（Normalization）：每一个数据除以每一维的标准差
神经网络怎么进行参数初始化
全置为0，前向传播结果为0，反向同样为0，无法更新。
置为很小的数，W=0.01*np.random.rand(D,H)，这种初始化方法在神经网络的层数很少时可以使用，层数多了就会出现问题，最后参数全部为0，首先在前向传播过程中输出为h(wx+b)因为w很小，所以输出很小，同时反向传播过程中梯度的变化也很小，那么参数的改变也很小，在不断的正向传播乘很小的数，反向传播又几乎不变的情况下，最后w会越来越小，趋近于0，出现梯度弥散现象。
Xavier初始化
He初始化
为什么weights初始化要非对称？
如果对称初始化，假设weights全是1，则对于每个神经元的输出结果相同；经历过BP反向传播后，weights的各个位置得到的是相同的更新。因此无论网络训练多少轮，对于每一层中的各个神经元，weights都是相同的，无法学习（提取）到不同的特征。
为什么weights初始化不能全为0？
为什么初始化值不能太大？
对于sigmoid、tanh激活函数，初始化值太大，使得流入激活函数的值过大，造成饱和现象，当反相传播时，会使得梯度极小，导致梯度弥散。（ReLU函数不受此影响）
为什么初始化值不能太小？
初始化太小时，经过多层网络，输出值变得极小，在反向传播时也会使得梯度极小，导致梯度弥散。（ReLU函数也受此影响！）
Xavier初始化
Xavier初始化的基本思想是，若对于一层网络的输出和输出可以保持正态分布且方差相近，这样就可以避免输出趋向于0，从而避免梯度弥散情况。
He初始化
He初始化基本思想是，当使用ReLU做为激活函数时，Xavier的效果不好，原因在于，当RelU的输入小于0时，其输出为0，相当于该神经元被关闭了，影响了输出的分布模式。

因此He初始化，在Xavier的基础上，假设每层网络有一半的神经元被关闭，于是其分布的方差也会变小。经过验证发现当对初始化值缩小一半时效果最好，故He初始化可以认为是Xavier初始/2的结果。

卷积
卷积的反向传播
CNN模型所需的 FLOPs和参数量 怎么计算
乘加算1次，有bias则加1
池化：平均池化、最大池化
池化层的反向传播
mean pooling的前向传播就是把一个patch中的值求取平均来做pooling，那么反向传播的过程也就是把某个元素的梯度等分为n份分配给前一层，这样就保证池化前后的梯度（残差）之和保持不变，还是比较理解的，图示如下

max pooling也要满足梯度之和不变的原则，max pooling的前向传播是把patch中最大的值传递给后一层，而其他像素的值直接被舍弃掉。那么反向传播也就是把梯度直接传给前一层某一个像素，而其他像素不接受梯度，也就是为0。所以max pooling操作和mean pooling操作不同点在于需要记录下池化操作时到底哪个像素的值是最大，也就是max id
感受野的计算
1）第一层卷积层的输出特征图像素的感受野的大小等于滤波器的大小
2）深层卷积层的感受野大小和它之前所有层的滤波器大小和步长有关系
3）计算感受野大小时，忽略了图像边缘的影响，即不考虑padding的大小
strides是之前所有层stride的乘积。
即strides（i） = stride(1) * stride(2) * …* stride(i-1)
RF = 1 #待计算的feature map上的感受野大小
for layer in （top layer To down layer）:
　　RF = ((RF -1) stride) + fsize*
权重初始化方法
正则化方法
参数范数惩罚
L2参数正则化
L1参数正则化
L1正则化和L2正则化的区别
数据集增强
噪音的鲁棒性
向输出目标注入噪声
半监督学习
多任务学习
提前终止
参数绑定和共享
稀疏表示
集成化方法
百度百科
BN原理
原理
手写BN
BN有哪些参数
BN在训练和测试时有哪些区别
Weight Normalization（WN）
Layer Normalization (LN)
Instance Normalization (IN)
Group Normalization (GN)
BN，LN，WN，IN和GN的区别
上述总结
优化算法：随机梯度下降法（SGD，Mini-Batch，动量（Monmentum），Nesterov动量，AdaGrad，AdaDelta，RMSProp，Adam，Nadam，AMSGrad，AdaBound
链接
梯度下降法
mini-batch梯度下降法
随机梯度下降法（SGD）
SGD每步做什么，为什么能online learning？
动量梯度下降法（Momentum）
RMSProp
AdaGrad
Adam
Adam优化器的迭代公式
激活函数总结：
26种激活函数可视化总结
Sigmoid用作激活函数时，分类为什么要用交叉熵损失，而不用均方损失？便于化简，参考链接
tanh
ReLU激活函数为什么比sigmoid和tanh好？
ReLU有哪些变体？
Dropout原理？
参考链接
Dropout如何实现？参考链接
Dropout在训练和测试时有哪些区别？参考链接
损失函数（Loss）：
Cross Entropy Loss (CE)：参考
Hinge Loss：参考
Focal Loss：参考链接
11 卷积有什么作用？
1)、降维（ dimension reductionality ）。比如，一张度500 * 500且厚度depth为100 的图片在20个filter上做11的卷积，那么结果的大小为问50050020。
2)、加入非线性。卷积层之后经过答激励层，1*1的卷积在前一层内的学习表示上添加了非线性激励（ non-linear activation ），提升网络的表达能力容；
3)、跨通道链接
AlexNet
VGG：VGG16 VGG19
VGG 是Oxford的Visual Geometry Group的组提出的（大家应该能看出VGG名字的由来了）。该网络是在ILSVRC 2014上的相关工作，主要工作是证明了增加网络的深度能够在一定程度上影响网络最终的性能。VGG有两种结构，分别是VGG16和VGG19，两者并没有本质上的区别，只是网络深度不一样。

VGG16相比AlexNet的一个改进是采用连续的几个3x3的卷积核代替AlexNet中的较大卷积核（11x11，7x7，5x5）。对于给定的感受野（与输出有关的输入图片的局部大小），采用堆积的小卷积核是优于采用大的卷积核，因为多层非线性层可以增加网络深度来保证学习更复杂的模式，而且代价还比较小（参数更少）。

简单来说，在VGG中，使用了3个3x3卷积核来代替7x7卷积核，使用了2个3x3卷积核来代替5*5卷积核，这样做的主要目的是在保证具有相同感知野的条件下，提升了网络的深度，在一定程度上提升了神经网络的效果。

比如，3个步长为1的3x3卷积核的一层层叠加作用可看成一个大小为7的感受野（其实就表示3个3x3连续卷积相当于一个7x7卷积），其参数总量为 3x(9xC^2) ，如果直接使用7x7卷积核，其参数总量为 49xC^2 ，这里 C 指的是输入和输出的通道数。很明显，27xC^2小于49xC2，即减少了参数；而且3x3卷积核有利于更好地保持图像性质。

这里解释一下为什么使用2个3x3卷积核可以来代替5*5卷积核：

5x5卷积看做一个小的全连接网络在5x5区域滑动，我们可以先用一个3x3的卷积滤波器卷积，然后再用一个全连接层连接这个3x3卷积输出，这个全连接层我们也可以看做一个3x3卷积层。这样我们就可以用两个3x3卷积级联（叠加）起来代替一个 5x5卷积。

VGG16包含了16个隐藏层（13个卷积层和3个全连接层）
VGG19包含了19个隐藏层（16个卷积层和3个全连接层）

VGG优缺点
1)VGGNet的结构非常简洁，整个网络都使用了同样大小的卷积核尺寸（3x3）和最大池化尺寸（2x2）。
2)几个小滤波器（3x3）卷积层的组合比一个大滤波器（5x5或7x7）卷积层好
3)验证了通过不断加深网络结构可以提升性能。

缺点：
1）VGG耗费更多计算资源，并且使用了更多的参数（这里不是3x3卷积的锅），导致更多的内存占用（140M）。其中绝大多数的参数都是来自于第一个全连接层。VGG可是有3个全连接层啊！
PS：有的文章称：发现这些全连接层即使被去除，对于性能也没有什么影响，这样就显著降低了参数数量。
注：很多pretrained的方法就是使用VGG的model（主要是16和19），VGG相对其他的方法，参数空间很大，最终的model有500多m，AlexNet只有200m，GoogLeNet更少，所以train一个vgg模型通常要花费更长的时间，所幸有公开的pretrained model让我们很方便的使用。
关于感受野：
假设你一层一层地重叠了3个3x3的卷积层（层与层之间有非线性激活函数）。在这个排列下，第一个卷积层中的每个神经元都对输入数据体有一个3x3的视野。

ResNet：
随着网络的加深，出现了训练集准确率下降的现象，我们可以确定这不是由于Overfit过拟合造成的(过拟合的情况训练集应该准确率很高)；所以作者针对这个问题提出了一种全新的网络，叫深度残差网络，它允许网络尽可能的加深，其中引入了全新的结构如图1；这里问大家一个问题

残差指的是什么？

其中ResNet提出了两种mapping：一种是identity mapping，指的就是图1中”弯弯的曲线”，另一种residual mapping，指的就是除了”弯弯的曲线“那部分，所以最后的输出是 y=F(x)+x identity mapping顾名思义，就是指本身，也就是公式中的x，而residual mapping指的是“差”，也就是y−x，所以残差指的就是F(x)部分。

为什么ResNet可以解决“随着网络加深，准确率不下降”的问题？

理论上，对于“随着网络加深，准确率下降”的问题，Resnet提供了两种选择方式，也就是identity mapping和residual mapping，如果网络已经到达最优，继续加深网络，residual mapping将被push为0，只剩下identity mapping，这样理论上网络一直处于最优状态了，网络的性能也就不会随着深度增加而降低了。

它使用了一种连接方式叫做“shortcut connection”，顾名思义，shortcut就是“抄近道”的意思
参考链接
ResNet到底在解决一个什么问题：

ResNet为什么不用Dropout？
链接1
链接2
为什么ResNet不在一开始就使用residual block，而是使用一个7x7的卷积？
原因: 7x7卷积实际上是用来直接对输入图片降采样(early downsampling), 注意像7x7这样的大卷积核一般只出现在input layer

目的是: 尽可能保留原始图像的信息, 而不需要增加channels数.

本质上是: 多channels的非线性激活层是非常昂贵的, 在input layer用big kernel换多channels是划算的

注意一下, resnet接入residual block前pixel为56x56的layer, channels数才64, 但是同样大小的layer, 在vgg-19里已经有256个channels了.

这里要强调一下, 只有在input layer层, 也就是最靠近输入图片的那层, 才用大卷积, 原因如下:

深度学习领域, 有一种广泛的直觉，即更大的卷积更好，但更昂贵。输入层中的特征数量(224x224)是如此之小（相对于隐藏层），第一卷积可以非常大而不会大幅增加实际的权重数。如果你想在某个地方进行大卷积，第一层通常是唯一的选择。

我认为神经网络的第一层是最基本的，因为它基本上只是将数据嵌入到一个新的更大的向量空间中。ResNet在第二层之前没有开始其特征层跳过，所以看起来作者想要在开始整花里胡哨的layers之前尽可能保留图像里更多的primary features.

题外话, 同时期的GoogLeNet也在input layer用到了7x7大卷积, 所以resnet作者的灵感来源于GoogLeNet也说不定, 至于非要追问为啥这么用, 也许最直接的理由就是"深度学习就像炼丹, 因为这样网络工作得更好, 所以作者就这么用了".

再说个有趣的例子, resnet模型是实验先于理论, 实验证明有效, 后面才陆续有人研究为啥有效, 比如The Shattered Gradients Problem: If resnets are the answer, then what is the question? 可不就是炼丹么? 参考资料

什么是Bottlenet layer？
ResNet如何解决梯度消失？
ResNet网络越来越深，准确率会不会上升？
ResNet v2：参考链接
ResNet v1 与 ResNet v2的区别
ResNet v2的ReLU激活函数有什么不同
ResNeXt：参考链接
Inception系列：v1，v2，v3，v4 参考链接
参考链接2
DenseNet：参考链接
为什么DenseNet比ResNet好
为什么DenseNet比ResNet更耗现存
SE-Net：[
Squeeze-Excitation结构是怎么实现的：参考
FCN主要使用了三种技术：卷积化、上采样、跳跃结构
卷积化

卷积化即是将普通的分类网络，比如VGG16，ResNet50/101等网络丢弃全连接层，换上对应的卷积层即可。

上采样

此处的上采样即是反卷积（Deconvolution）。当然关于这个名字不同框架不同，Caffe和Kera里叫Deconvolution，而tensorflow里叫conv_transpose。CS231n这门课中说，叫conv_transpose更为合适。

众所诸知，普通的池化（为什么这儿是普通的池化请看后文）会缩小图片的尺寸，比如VGG16 五次池化后图片被缩小了32倍。为了得到和原图等大的分割图，我们需要上采样/反卷积。

反卷积和卷积类似，都是相乘相加的运算。只不过后者是多对一，前者是一对多。而反卷积的前向和后向传播，只用颠倒卷积的前后向传播即可。所以无论优化还是后向传播算法都是没有问题。

跳跃结构（Skip Layers）

（这个奇怪的名字是我翻译的，好像一般叫忽略连接结构）这个结构的作用就在于优化结果，因为如果将全卷积之后的结果直接上采样得到的结果是很粗糙的，所以作者将不同池化层的结果进行上采样之后来优化输出。

上采样获得与输入一样的尺寸文章采用的网络经过5次卷积+池化后，图像尺寸依次缩小了 2、4、8、16、32倍，对最后一层做32倍上采样，就可以得到与原图一样的大小

作者发现，仅对第5层做32倍反卷积（deconvolution），得到的结果不太精确。于是将第 4 层和第 3 层的输出也依次反卷积
参考链接
71. U-Net：
本文介绍一种编码器-解码器结构。编码器逐渐减少池化层的空间维度，解码器逐步修复物体的细节和空间维度。编码器和解码器之间通常存在快捷连接，因此能帮助解码器更好地修复目标的细节。U-Net 是这种方法中最常用的结构。

fcn(fully convolutional natwork)的思想是：修改一个普通的逐层收缩的网络，用上采样(up sampling)(？？反卷积)操作代替网络后部的池化(pooling)操作。因此，这些层增加了输出的分辨率。为了使用局部的信息，在网络收缩过程（路径）中产生的高分辨率特征(high resolution features) ，被连接到了修改后网络的上采样的结果上。在此之后，一个卷积层基于这些信息综合得到更精确的结果。

与fcn(fully convolutional natwork)不同的是，我们的网络在上采样部分依然有大量的特征通道(feature channels)，这使得网络可以将环境信息向更高的分辨率层(higher resolution layers)传播。结果是，扩张路径基本对称于收缩路径。网络不存在任何全连接层(fully connected layers)，并且，只使用每个卷积的有效部分，例如，分割图(segmentation map)只包含这样一些像素点，这些像素点的完整上下文都出现在输入图像中。为了预测图像边界区域的像素点，我们采用镜像图像的方式补全缺失的环境像素。这个tiling方法在使用网络分割大图像时是非常有用的，因为如果不这么做，GPU显存会限制图像分辨率。我们的训练数据太少，因此我们采用弹性形变的方式增加数据。这可以让模型学习得到形变不变性。这对医学图像分割是非常重要的，因为组织的形变是非常常见的情况，并且计算机可以很有效的模拟真实的形变。在[3]中指出了在无监督特征学习中，增加数据以获取不变性的重要性。

DeepLab系列：总结
边框回归：
如下图所示，绿色的框表示真实值Ground Truth, 红色的框为Selective Search提取的候选区域/框Region Proposal。那么即便红色的框被分类器识别为飞机，但是由于红色的框定位不准(IoU<0.5)，这张图也相当于没有正确的检测出飞机。

如果我们能对红色的框进行微调fine-tuning，使得经过微调后的窗口跟Ground Truth 更接近，这样岂不是定位会更准确。而Bounding-box regression 就是用来微调这个窗口的。

边框回归是什么？

对于窗口一般使用四维向量(x,y,w,h)(x,y,w,h) 来表示，分别表示窗口的中心点坐标和宽高。对于图2, 红色的框 P 代表原始的Proposal, 绿色的框 G 代表目标的 Ground Truth，我们的目标是寻找一种关系使得输入原始的窗口 P 经过映射得到一个跟真实窗口 G 更接近的回归窗口G^。

所以，边框回归的目的即是：给定(Px,Py,Pw,Ph)寻找一种映射f，使得f(Px,Py,Pw,Ph)=(Gx^,Gy,Gw^,Gh)并且(Gx^,Gy,Gw^,Gh)≈(Gx,Gy,Gw,Gh)

边框回归怎么做的？

那么经过何种变换才能从图2中的窗口 P 变为窗口G^呢？比较简单的思路就是: 平移+尺度放缩

先做平移(Δx,Δy)，Δx=Pwdx§,Δy=Phdy§这是R-CNN论文的： G^x=Pwdx§+Px,(1) G^y=Phdy§+Py,(2)

然后再做尺度缩放(Sw,Sh), Sw=exp(dw§),Sh=exp(dh§),对应论文中： G^w=Pwexp(dw§),(3) G^h=Phexp(dh§),(4)

观察(1)-(4)我们发现，边框回归学习就是dx§,dy§,dw§,dh§这四个变换。

下一步就是设计算法那得到这四个映射。

线性回归就是给定输入的特征向量 X, 学习一组参数 W, 使得经过线性回归后的值跟真实值 Y(Ground Truth)非常接近. 即Y≈WX。那么 Bounding-box 中我们的输入以及输出分别是什么呢？

Input: RegionProposal→P=(Px,Py,Pw,Ph)这个是什么？输入就是这四个数值吗？其实真正的输入是这个窗口对应的 CNN 特征，也就是 R-CNN 中的 Pool5 feature（特征向量）。 (注：训练阶段输入还包括 Ground Truth，也就是下边提到的t∗=(tx,ty,tw,th))

Output: 需要进行的平移变换和尺度缩放 dx§,dy§,dw§,dh§，或者说是Δx,Δy,Sw,Sh。我们的最终输出不应该是 Ground Truth 吗？是的，但是有了这四个变换我们就可以直接得到 Ground Truth。

这里还有个问题，根据(1)~(4)我们可以知道， P 经过 dx§,dy§,dw§,dh§得到的并不是真实值 G，而是预测值G^。的确，这四个值应该是经过 Ground Truth 和 Proposal 计算得到的真正需要的平移量(tx,ty)和尺度缩放(tw,th)。

这也就是 R-CNN 中的(6)~(9)： tx=(Gx−Px)/Pw,(6)

ty=(Gy−Py)/Ph,(7)

tw=log(Gw/Pw),(8)

th=log(Gh/Ph),(9)

那么目标函数可以表示为 d∗§=wT∗Φ5§，Φ5§是输入 Proposal 的特征向量，w∗是要学习的参数（*表示 x,y,w,h，也就是每一个变换对应一个目标函数） , d∗§ 是得到的预测值。

我们要让预测值跟真实值t∗=(tx,ty,tw,th)差距最小，得到损失函数为： Loss=∑iN(ti∗−w^T∗ϕ5(Pi))2

函数优化目标为：

W∗=argminw∗∑iN(ti∗−w^{T∗ϕ5(Pi))2+λ||w}∗||2

利用梯度下降法或者最小二乘法就可以得到 w∗。
bouding box regression
边框回归详解
什么是边框回归？为什么要做边框回归？怎么做边框回归？

反卷积与转置卷积：参考链接
Transposed Convolution, Fractionally Strided Convolution or Deconvolution
空洞卷积：如何理解空洞卷积
Pooling层原理
depthwise卷积加速比推导：为什么耗时
参考
为什么降采样使用max pooling，而分类使用average pooling？参考
maxpooling如何反向传播：参考
反卷积
组卷积（Group Convolution）：

从上图可以看出，一般的卷积会对输入数据的整体一起做卷积操作，即输入数据：H1×W1×C1；而卷积核大小为h1×w1，通道为C1，一共有C2个，然后卷积得到的输出数据就是H2×W2×C2。这里我们假设输出和输出的分辨率是不变的。主要看这个过程是一气呵成的，这对于存储器的容量提出了更高的要求。

但是分组卷积明显就没有那么多的参数。先用图片直观地感受一下分组卷积的过程。对于上面所说的同样的一个问题，分组卷积就如下图所示。

可以看到，图中将输入数据分成了2组（组数为g），需要注意的是，这种分组只是在深度上进行划分，即某几个通道编为一组，这个具体的数量由（C1/g）决定。因为输出数据的改变，相应的，卷积核也需要做出同样的改变。即每组中卷积核的深度也就变成了（C1/g），而卷积核的大小是不需要改变的，此时每组的卷积核的个数就变成了（C2/g）个，而不是原来的C2了。然后用每组的卷积核同它们对应组内的输入数据卷积，得到了输出数据以后，再用concatenate的方式组合起来，最终的输出数据的通道仍旧是C2。也就是说，分组数g决定以后，那么我们将并行的运算g个相同的卷积过程，每个过程里（每组），输入数据为H1×W1×C1/g，卷积核大小为h1×w1×C1/g，一共有C2/g个，输出数据为H2×W2×C2/g。

举个例子：

Group conv本身就极大地减少了参数。比如当输入通道为256，输出通道也为256，kernel size为3×3，不做Group conv参数为256×3×3×256。实施分组卷积时，若group为8，每个group的input channel和output channel均为32，参数为8×32×3×3×32，是原来的八分之一。而Group conv最后每一组输出的feature maps应该是以concatenate的方式组合。 Alex认为group conv的方式能够增加 filter之间的对角相关性，而且能够减少训练参数，不容易过拟合，这类似于正则的效果。
参考链接

交错组卷积（Interleaved Group Convolutions，IGC）：参考
空洞卷积/扩张卷积（Dilated/Atrous Convolution）
能不能设计一种新的操作，不通过pooling也能有较大的感受野看到更多的信息呢？空洞卷积
背景：语义分割中pooling 和 up-sampling layer层。pooling会降低图像尺寸的同时增大感受野，而up-sampling操作扩大图像尺寸，这样虽然恢复了大小，但很多细节被池化操作丢失了。

需求：能不能设计一种新的操作，不通过pooling也能有较大的感受野看到更多的信息呢？

目的：替代pooling和up-sampling运算，既增大感受野又不减小图像大小。

简述：在标准的 convolution map 里注入空洞，以此来增加 reception field。相比原来的正常convolution，dilated convolution 多了一个 hyper-parameter 称之为 dilation rate 指的是kernel的间隔数量(e.g. 正常的 convolution 是 dilatation rate 1)。

空洞卷积诞生于图像分割领域，图像输入到网络中经过CNN提取特征，再经过pooling降低图像尺度的同时增大感受野。由于图像分割是pixel−wise预测输出，所以还需要通过upsampling将变小的图像恢复到原始大小。upsampling通常是通过deconv(转置卷积)完成。因此图像分割FCN有两个关键步骤：池化操作增大感受野，upsampling操作扩大图像尺寸。这儿有个问题，就是虽然图像经过upsampling操作恢复了大小，但是很多细节还是被池化操作丢失了。那么有没有办法既增大了感受野又不减小图像大小呢？Dilated conv横空出世。

为什么不直接使用5x5或者7x7的卷积核？这不也增加了感受野么？
答：增大卷积核能增大感受野，但是只是线性增长，参考答案里的那个公式，(kernel-1)*layer，并不能达到空洞卷积的指数增长。
2.2-dilated要在1-dilated的基础上才能达到7的感受野（如上图a、b所示）

关于空洞卷积的另一种概括：

Dilated Convolution问题的引出，是因为down-sample之后的为了让input和output的尺寸一致。我们需要up-sample，但是up-sample会丢失信息。如果不采用pooling，就无需下采样和上采样步骤了。但是这样会导致kernel 的感受野变小，导致预测不精确。。如果采用大的kernel话，一来训练的参数变大。二来没有小的kernel叠加的正则作用，所以kernel size变大行不通。

由此Dilated Convolution是在不改变kernel size的条件下，增大感受野。

转置卷积核反卷积的区别？
转置卷积（transposed Convolutions）又名反卷积（deconvolution）或是分数步长卷积（fractially straced convolutions）。反卷积（Transposed Convolution, Fractionally Strided Convolution or Deconvolution）的概念第一次出现是 Zeiler 在2010年发表的论文 Deconvolutional networks 中。

转置卷积和反卷积的区别

那什么是反卷积？从字面上理解就是卷积的逆过程。值得注意的反卷积虽然存在，但是在深度学习中并不常用。而转置卷积虽然又名反卷积，却不是真正意义上的反卷积。因为根据反卷积的数学含义，通过反卷积可以将通过卷积的输出信号，完全还原输入信号。而事实是，转置卷积只能还原shape大小，而不能还原value。你可以理解成，至少在数值方面上，转置卷积不能实现卷积操作的逆过程。所以说转置卷积与真正的反卷积有点相似，因为两者产生了相同的空间分辨率。但是又名反卷积（deconvolutions）的这种叫法是不合适的，因为它不符合反卷积的概念。

简单来说，转置矩阵就是一种上采样过程。

正常卷积过程如下，利用3x3的卷积核对4x4的输入进行卷积，输出结果为2x2

转置卷积过程如下，利用3x3的卷积核对"做了补0"的2x2输入进行卷积，输出结果为4x4。

88. Group Normalization
89. Xception
90. SENet（Squeeze-and-Excitation Networks）：
论文的动机是从特征通道之间的关系入手，希望显式地建模特征通道之间的相互依赖关系。另外，没有引入一个新的空间维度来进行特征通道间的融合，而是采用了一种全新的“特征重标定”策略。具体来说，就是通过学习的方式来自动获取到每个特征通道的重要程度，然后依照这个重要程度去增强有用的特征并抑制对当前任务用处不大的特征，通俗来讲，就是让网络利用全局信息有选择的增强有益feature通道并抑制无用feature通道，从而能实现feature通道自适应校准。

SENet学习笔记

SKNet
GCNet：
GCNet：当Non-local遇见SENet
2019 GCNet（attention机制，目标检测backbone性能提升）论文阅读笔记
Octave Convolution
MobileNet系列（v1，v2，v3）：
深度解读mobilenet
mobilenet v3解读:
MobileNet系列为什么快？各有多少层？多少参数？
MobileNet v1、MobileNet v2和MobileNet v3有什么区别：
MobileNetv1：在depthwise separable convolutions（参考Xception）方法的基础上提供了高校模型设计的两个选择：宽度因子（width multiplie）和分辨率因子（resolution multiplier）。深度可分离卷积depthwise separable convolutions（参考Xception）的本质是冗余信息更小的稀疏化表达。

下面介绍两幅Xception中 depthwise separable convolution的图示：

深度可分离卷积的过程是①用16个3×3大小的卷积核（1通道）分别与输入的16通道的数据做卷积（这里使用了16个1通道的卷积核，输入数据的每个通道用1个3×3的卷积核卷积），得到了16个通道的特征图，我们说该步操作是depthwise（逐层）的，在叠加16个特征图之前，②接着用32个1×1大小的卷积核（16通道）在这16个特征图进行卷积运算，将16个通道的信息进行融合（用1×1的卷积进行不同通道间的信息融合），我们说该步操作是pointwise（逐像素）的。这样我们可以算出整个过程使用了3×3×16+（1×1×16）×32 =656个参数。

注：上述描述与标准的卷积非常的不同，第一点在于使用非1x1卷积核时，是单channel的（可以说是1通道），即上一层输出的每个channel都有与之对应的卷积核。而标准的卷积过程，卷积核是多channel的。第二点在于使用1x1卷积核实现多channel的融合，并利用多个1x1卷积核生成多channel。表达的可能不是很清楚，但结合图示其实就容易明白了。

一般卷积核的channel也常称为深度（depth），所以叫做深度可分离，即原来为多channel组合，现在变成了单channel分离。

MobileNet v2为什么会加shortcut
MobileNet v2中的Residual结构最先是由哪个网络提出来的
ShuffleNet系列（ShuffleNet v1，v2）：
shufflenet v1解读
解读2
shuffle具体实现
shufflenet v2
轻量级神经网络“巡礼”（一）—— ShuffleNetV2
ShufflenetV2_高效网络的4条实用准则
v1和v2对比
IGC系列（IGC v1，v2，v3）参考
深度可分离卷积（Depth separable convolution）
学习率如何调整：链接
神经网络的深度和宽度作用：参考
网络压缩与量化：压缩与量化原理
Batch Size：怎么选取batch size
谈谈深度学习中的batch size
BN和Dropout在训练和测试时的区别：链接
深度学习调参有哪些技巧：链接
为什么深度学习中的模型基本用3x3和5x5卷积（奇数），而不是2x2和4x4的卷积（偶数）？链接
深度学习训练中是否有必要使用L1获得稀疏解？链接
EfficientNet
如何评价谷歌大脑的EfficientNet？
EfficientNet-可能是迄今为止最好的CNN网络
EfficientNet论文解读
EfficientNet：调参侠的福音（ICML 2019）
如何理解归一化（Normalization）对于神经网络（深度学习）的帮助？
BN最早被认为通过降低所谓Internal Covariate Shift，这种想法的出处可考至Understanding the difficulty of training deep feedforward neural networks，想必这也是batch norm作者这么设计的初衷。但是这种想法并没有过多实验支持，比如说去年NeurlPS这篇paper作者做了实验，在batch norm之后加上一些随机扰动（non-zero mean and non-unit variance，人为引入covariate shift），发现效果仍然比不加好很多。为什么放在batch norm layer之后而不是之前？因为为了证伪batch norm通过forward pass这一步降低covariate shift来提升网络训练效率的。这样说来故事就变得很有趣了，也就是说我们大概都理解一些BN对BN层之前网络噪音的好处，那么能不能研究一下它对它后面layer的影响？所以这些研究从优化的角度，有如下几种观点。

BN通过修改loss function，可以令loss的和loss的梯度均满足更强的Lipschitzness性质（即函数f满足L-Lipschitz和 [公式] -smooth，令L和 [公式] 更小，后者其实等同于f Hessian的eigenvalue小于 [公式] ，可以作为光滑程度的度量，其实吧我觉得，一般convex optimization里拿这个度量算convergence rate是神器，对于non-convex optimization，不懂鸭，paper里好像也没写的样子），这么做的好处是当步子迈得大的时候，我们可以更自信地告诉自己计算出来的梯度可以更好地近似实际的梯度，因此也不容易让优化掉进小坑里。有意思的地方来了，是不是我在某些地方插入一个1/1000 layer，把梯度的L-Lipschitz变成1/1000L-Lipschitz就能让函数优化的更好了呢？其实不是的，因为单纯除以函数会改变整个优化问题，而BN做了不仅仅rescale这件事情，还让原来近似最优的点在做完变化之后，仍然保留在原来不远的位置。这也就是这篇文章的核心论点，BN做的是问题reparametrization而不是简单的scaling。 [1]
BN把优化这件事情分解成了优化参数的方向和长度两个任务，这么做呢可以解耦层与层之间的dependency因此会让curvature结构更易于优化。这篇证了convergence rate，但由于没有认真读，所以感觉没太多资格评价。[2]
归一化手段是否殊途同归？很可能是的，在[1]的3.3作者也尝试了Lp normalization，也得到了和BN差不多的效果。至于Layer norm还是weight norm，可能都可以顺着这个思路进行研究鸭，无论是通过[1]还是[2]，可能今年的paper里就见分晓了，let’s see。

How Does Batch Normalization Help Optimization?
Exponential convergence rates for Batch Normalization: The power of length-direction decoupling in non-convex optimization
参考资料

如何理解归一化（Normalization）对于神经网络（深度学习）的帮助？
107. 多标签分类怎么解决
107. 手推BP
108. 手推RNN和LSTM结构
109. LSTM中每个gate的作用是什么，为什么跟RNN比起来，LSTM可以防止梯度消失
110. 讲一下pooling的作用，为什么max pooling要更常用?哪些情况下，average pooling比max pooling更合适？
111. 梯度消失和梯度爆炸的原因是什么？怎么解决？
112. CNN和RNN的梯度消失原因是一样的吗？
113. 有哪些防止过拟合的方法？
114. 讲一下激活函数sigmoid，tanh，relu的应用场景？
115. relu的负半轴导数都是0，这部分产生的梯度消失怎么办？
116. batch size对收敛速度的影响
117. 讲一下Batch Normalization
118. CNN做卷积运算的复杂度。如果一个CNN网络的输入channel数目和卷积核数目都减半，总的计算量变为原来的多少？
119. 讲一下AlexNet的具体结构，每层的作用
120. 讲一下你理解的dropout，分别从bagging和正则化的角度
121. data augmentaion有哪些技巧？
122. 讲一下你了解的优化方法，SGD （随机梯度下降）, Momentum（动量），RmsProp和Adam的区别和联系？

如果训练的神经网络不收敛，可能有哪些原因？
1、没有对数据进行归一化
2、忘记检查输入和输出
3、没有对数据进行预处理
4、没有对数据正则化
5、使用过大的样本
6、使用不正确的学习率
7、在输出层使用错误的激活函数
8、网络中包含坏梯度
9、初始化权重错误
10、过深的网络
11、隐藏单元数量错误
12、优化算法不对，一般用adam居多。
13、数据随机性太强，同时网络结构太复杂（样本空间太大，同时样本数量不够，网络函数空间也大）
14、学习率过大。网络可能快要收敛了，却忽然在下一个epoch走向了错误的方向，最终导致不收敛。

作者：菜鸟瞎编
链接：https://www.jianshu.com/p/bbd11ad4e973

说一下你理解的卷积核，1x1卷积的作用？
减少参数，整合特征通道，升维和降维。

你可能感兴趣的:(面试整理)

【云计算解决方案面试整理】3-7主流云计算平台、云计算架构、安全防护不太灵光的程序员阿里云云计算工程师ACP认证云计算云计算面试架构
准备面云计算解决方案的岗位，整理了一些，也请大佬们指点。文档分为云计算基础概念、云计算技术原理、主流云计算平台（以天翼云为例）、云计算架构（弹性设计、高可用设计、高性能设计）、安全防护几个方面。三、主流云计算平台1.阿里云云计算平台强大的计算能力：拥有自主研发的飞天操作系统，可提供高效、稳定的计算服务，能够满足大规模数据处理和高并发业务的需求。例如，在应对双11这样的高并发场景时，飞天系统可以快速
java面试整理（Redis21问） kkkllllss Java Java架构 spring spring boot spring redis java 架构
一、集群、分布式、微服务的理解1、集群是个物理形态，分布式是个工作方式。分布式：一个业务分拆多个子业务，部署在不同的服务器上集群：同一个业务，部署在多个服务器上2、分布式是指将不同的业务分布在不同的地方。而集群指的是将几台服务器集中在一起，实现同一业务。分布式的每一个节点，都完成不同的业务，一个节点垮了，那这个业务就不可访问了。分布式是以缩短单个任务的执行时间来提升效率的，而集群则是通过提高单位时
HTML面试整理 wandongle html 面试前端
本篇博客整理了本人在近期HTML面试题中的部分错误或薄弱问题。第1题：如何在HTML中实现响应式图片加载？请举例说明srcset和picture的使用场景。HTML提供了srcset和两种方式来实现响应式图片加载。方式一：使用srcset：srcset属性可为同一图像提供多个文件源和各自的分辨率描述符。浏览器会根据当前设备的屏幕尺寸（如宽度）和像素密度（如DPI）来选择最合适的图像源进行加载。这样
前端面试每日三题 - Day 27 蓝婷儿前端面试前端面试职场和发展
这是我为准备前端/全栈开发工程师面试整理的第27天每日三题练习，涵盖了：CSS选择器的优先级与权重计算机制Angular中的依赖注入（DependencyInjection）机制设计一个支持实时协作编辑（如GoogleDocs）的前端系统✅题目1：CSS选择器优先级与权重计算机制权重等级表（从高到低）选择器类型权重值示例行内样式1000ID选择器100#header类/伪类/属性选择器10.act
前端面试每日三题 - Day 31 蓝婷儿前端面试前端面试职场和发展
这是我为准备前端/全栈开发工程师面试整理的第30天每日三题练习：✅题目1：WebAssembly前端深度实践指南核心优势对比维度JavaScriptWebAssembly解析速度需要解析+编译预编译二进制执行性能动态类型较慢静态类型接近原生内存管理自动垃圾回收手动内存控制适用场景通用逻辑计算密集型任务实战开发流程#使用Rust开发Wasm模块cargoinstallwasm-packwasm-pa
前端面试每日三题 - Day 33 蓝婷儿前端面试前端面试职场和发展
这是我为准备前端/全栈开发工程师面试整理的第33天每日三题练习：✅题目1：Deno核心特性深度解析革命性特性详解//安全权限控制（运行时显式授权）denorun--allow-net=api.example.comserver.ts//内置TypeScript支持constdecoder=newTextDecoder("utf-8");constdata=awaitDeno.readFile("d
前端面试每日三题 - Day 32 蓝婷儿前端面试前端面试职场和发展
这是我为准备前端/全栈开发工程师面试整理的第32天每日三题练习：✅题目1：Electron主流架构模式深度解析核心架构模式对比模式优点缺点适用场景单一窗口模式开发简单、资源占用低功能扩展受限小型工具类应用多窗口模式模块解耦、独立运行进程管理复杂度高编辑器类应用微前端模式技术栈灵活、独立部署通信成本高企业级复杂应用IPC通信最佳实践//主进程（main.js）const{ipcMain}=requi
前端面试每日三题 - Day 26 蓝婷儿前端面试前端面试职场和发展
这是我为准备前端/全栈开发工程师面试整理的第25天每日三题练习，涵盖了：CSSGrid布局与Flexbox布局的核心区别Angular的变更检测（ChangeDetection）机制项目实战-设计一个微前端架构的前端应用。✅题目1：CSSGrid布局与Flexbox布局的核心区别是什么？分别适用于哪些场景？核心区别GridFlexBox维度二维布局（行+列），可同时控制横向和纵向布局一维布局（主轴
前端面试每日三题 - Day 11 蓝婷儿前端面试前端面试职场和发展
这是我为准备前端/全栈开发工程师面试整理的第十一天每日三题练习，涵盖JavaScript模块化发展、ReactFiber架构解析以及系统设计中的CDN分发系统。通过这三道题，你将对现代前端开发中的关键概念有更深入的理解，并掌握应对面试中的高频考点。✅题目1：JavaScript模块化发展历程与ESModules解析：JavaScript模块化经历了从无模块，到IIFE、CommonJS、AMD，再
前端面试每日三题 - Day 13 蓝婷儿前端面试前端面试职场和发展
这是我为准备前端/全栈开发工程师面试整理的第八天每日三题练习，涵盖JavaScript内存泄漏、React状态提升与propdrilling、以及高可用权限系统。每道题都配有详细解析和代码示例，助你真正掌握原理与实战技巧！✅题目1：JavaScript中哪些操作容易导致内存泄漏？如何排查？解析：内存泄漏是指程序不再使用的内存无法被回收，常见场景包括：常见内存泄漏场景：闭包引用未释放定时器未清除（s
前端面试每日三题 - Day 9 蓝婷儿前端面试前端面试职场和发展
前端面试每日三题-Day9这是我为准备前端/全栈开发工程师面试整理的第九天每日三题练习，涵盖：JavaScript中的事件机制与实践React中的全局状态管理ContextAPI使用技巧系统设计实战：如何构建高可用的分布式缓存系统✅题目1：JavaScript中的事件代理与事件冒泡机制详解解析：事件代理（EventDelegation）是一种利用事件冒泡的机制，将子元素的事件委托到父元素上，从而提
前端面试每日三题 - Day 12 蓝婷儿前端面试前端面试职场和发展
这是我为准备前端/全栈开发工程师面试整理的第十二天每日三题练习，涵盖了：JavaScript中的节流与防抖实现原理与区别；ReactSuspense与lazy的使用场景与注意事项；系统设计实战：构建高并发场景下的任务调度系统。✅题目1：JavaScript中的节流与防抖实现原理与区别解析：节流（throttle）和防抖（debounce）是前端开发中控制高频事件触发的常见方式。特性节流(throt
RabbitMQ面试整理问不倒呀 rabbitmq 面试分布式
1、RabbitMQ有哪些重要的组件？RabbitMQ的核心组件包括以下几部分，他们共同构成了RabbitMQ的基本架构：（1)Broker：RabbitMQ服务器，负责接收和分发消息的应用。（2)VirtualHost：虚拟主机，是RabbitMQ中的逻辑容器，用于隔离不同环境或不同应用程序的信息流。每个虚拟主机都有自己的队列、交换机等设置，可以理解为一个独立的RabbitMQ服务。（3)Con
分布式数据库面试整理 Necther 数据库面试分布式
5.3.1redis面试专题1、redis和memcached什么区别？为什么高并发下有时单线程的redis比多线程的memcached效率要高？区别：mc可缓存图片和视频。rd支持除k/v更多的数据结构；rd可以使用虚拟内存，rd可持久化和aof灾难恢复，rd通过主从支持数据备份;3.rd可以做消息队列。原因:mc多线程模型引入了缓存一致性和锁，加锁带来了性能损耗。2、redis主从复制如何实现
HarmonyOS-面试整理大众筹码 harmonyos 面试华为
目录为什么选择HarmonyOS/优点/特点鸿蒙系统的权限有哪些授权方式区别：说一说鸿蒙系统的安全机制说一说鸿蒙系统的微内核与安卓的内核区别鸿蒙操作系统的微内核架构有哪些优势分布式能力在鸿蒙系统中如何实现请解释一下鸿蒙系统中的分布式软总线技术如何在鸿蒙操作系统中进行多设备协同开发？鸿蒙操作系统如何保障系统的安全性？请描述一下鸿蒙操作系统的用户界面开发框架鸿蒙操作系统支持哪些编程语言请解释一下鸿蒙操
【计算机面试整理1】学习中可能没学到的知识点 ICE·BING 学习 python java
守护线程是什么？Java提供了两种线程：守护线程与用户线程。守护线程是在程序运行过程中在后台进行的线程，它的任务是为其他线程提供服务和支持。当所有的非守护线程结束运行时，虚拟机会自动退出。与之相对的是用户线程,用户线程的结束并不会导致程序的终止。在Java中，通过设置线程的setDaemon(true)方法将线程设置为守护线程。守护线程通常用来执行一些辅助性的任务，比如垃圾回收、内存管理等。pyt
Python算法工程师面试整理-算法复杂度分析和面试常见题型不务正业的猿面试 AI 数据结构算法复杂度时间空间
三、算法复杂度分析1.时间复杂度●大O符号(BigONotation)：表示算法在最坏情况下的运行时间随输入规模的增长率。○常数时间：O(1)。○对数时间：O(logn)。○线性时间：O(n)。
Spark面试整理-Spark是什么？不务正业的猿面试 Spark spark 大数据分布式
ApacheSpark是一个开源的分布式计算系统，它提供了一个用于大规模数据处理的快速、通用、易于使用的平台。它最初是在加州大学伯克利分校的AMPLab开发的，并于2010年开源。自那时起，Spark已经成为大数据处理中最受欢迎和广泛使用的框架之一。下面是Spark的一些关键特点：速度：Spark使用了先进的DAG（有向无环图）执行引擎，可以支持循环数据流和内存计算。这使得Spark在数据处理方面
算法部署优化工程师面试题整理发狂的小花 C/C++面试宝典算法面试性能优化计算机视觉
原文来自【知乎-高性能计算方向面试问题总结】个人简介：一个全栈工程师的升级之路！个人专栏：C/C++面试整理CSDN主页发狂的小花人生秘诀：学习的本质就是极致重复!目录整体情况简介高性能计算基础AI框架知识算法题一些比较零碎的问题推荐参考资料整体情况简介面试中的问题基本上分成以下几类：基础的八股文：C/C++，OS，计算机体系结构等。这一部分略，网上已经有很多总结了。高性能计算基础知识：这一部分是
面试整理程序员
一、mysql数据库的原理答：mysql是基于客户端与服务器的数据库管理系统，是由mysqld服务进程和一些工具程序组成，mysql客户端可以连接到该进程，并向其发送sql,mysqld负责解释及执行这些语句二、mysql架构答：主要分三层，分别是连接层，服务层，存储层三、如何高效的设计数据库表结构1.设计规范和标准化规范和标准化是数据库设计的基础。在设计数据库表结构时，应该遵循一系列标准和规范，
面试整理 qq_20962187
数据分析/hadoop/机器学习面试题集锦，可能是最全的了…发表于：2017-09-2115:17阅读：178评论：0无论你是想从事大数据相关职位的职场小白，还是准备往高处走的牛牛。小白有了这些在校招中过关斩将，牛牛们温故知新跨过业务壁垒。B格高的HR，或者想要个助理的大数据工作者也可以了解下同行是怎么筛选人。非主流的可以拿来撩HR妹纸，折腾面试的小鲜肉…………………………数据分析1、提前想好答案
Spring面试整理-Spring的依赖注入不务正业的猿面试 Java spring 面试 java 依赖注入
Spring框架的依赖注入（DI）是其核心功能之一，它允许对象定义它们依赖的其他对象，而不是自己创建或查找它们。这种机制促进了松耦合和更容易的测试。依赖注入（DI）依赖注入是一种设计模式，其中一个对象或方法提供另一个对象的依赖关系。在Spring中，这些依赖通常是服务、配置值或其他必要的对象。实现方式构造器注入：使用类的构造器来注入依赖。当依赖不应该或不能被改变时推荐使用。示例代码：
超详细！微服务架构面试专栏（SpringCloud、SpringBoot、Dubbo）建议收藏！套马杆的程序员
一、微服务架构面试专栏1、SpringCloud面试整理1、什么是SpringCloud?Springcloud流应用程序启动器是基于SpringBoot的Spring集成应用程序,提供与外部系统的集成。SpringcloudTask,一个生命周期短暂的微服务框架,用于快速构建执行有限数据处理的应用程序。2、使用SpringCloud有什么优势?使用SpringBoot开发分布式微服务时,我们面临
Spring面试整理-Spring的IOC 不务正业的猿面试 Java spring 面试 java IOC
Spring框架的控制反转（IoC,InversionofControl）是其核心特性之一，它是一种编程风格，其中对象的创建和管理不是由对象自己进行，而是由Spring容器进行。IoC的概念控制反转：在传统的程序设计中，对象自行控制依赖对象的创建和生命周期。在IoC模式中，这种控制被反转，转交给了容器。依赖注入（DI,DependencyInjection）：这是实现IoC的一种方式。对象的依赖（
面试整理1 line_3a82
一、px和em和rem的区别1、px实际上就是像素，用PX设置字体大小时，比较稳定和精确。但是px不支持用户进行浏览器缩放或者不同移动端的兼容，因为像素是固定的，屏幕大小是变化的。2、em是根据父元素来对应大小，是一种相对值；em值=1/父元素的font-size*需要转换的像素值。进行任何元素设置，都有可能需要知道他父元素的大小，这很不方便。3、rem是根据根元素html的font-size来对
Spring面试整理-Autowired和Resource关键字的区别不务正业的猿学习之路 Java spring 面试 java 注解
@Autowired和@Resource都是Spring框架中用于依赖注入的注解，但它们在功能和使用方式上有一些重要的区别：@Autowired来源：@Autowired是Spring框架的一部分。注入方式：它默认按照类型（Type）来自动装配依赖。可选性：可以与@Qualifier注解结合使用，以进一步细化需要注入的Bean，特别是当有多个类型相同的Bean时。必要性：如果没有找到匹配的Bean
程序人生：突围金三银四面试季！附学习笔记+面试整理+进阶书籍 6年老Java 程序员 java 后端面试
前言又到一年金九银十之际。Java作为目前用户最多，使用范围最广的软件开发技术之一。Java的技术体系主要由支撑Java程序运行的虚拟机，提供各开发领域接口支持的Java,Java编程语言及许多第三方Jvav框架构成。其中，以Java的虚拟器为今天的着重点以下是我整理收藏的一些JVM大厂面试经典问题与相应答案，希望可以给看文的朋友一些帮助由于篇幅过长，请耐心往下看，文末提供小编收藏已久的JVM面试
Unity面试题（含答案）鹅厂程序小哥 Unity 面试
Unity面试题（含答案）先首先说一下这个面试的题是转载的非个人整理我个人感觉非常有必要在面试之前大体看一下并且也建议大家看一下在应聘之前做好准备我的个人经历：在面试的时候遇到的题大多这里都有事后超后悔所以自己整理了一下方便下次面试整理了一下文档路径https://download.csdn.net/download/m0_37583098/10596112一．如何优化内存？有很多种方式，例如1.
面试整理2 文茶君
请问死锁原因如何打破？如何查看死锁进程状态？回答死锁的四个条件没回答完，但是我觉得不必要背住这四个条件1、死锁是指在一组进程中的各个进程均占有不会释放的资源，但因互相申请被其他进程所站用不会释放的资源而处于的一种永久等待状态。死锁的四个必要条件：•互斥条件(Mutualexclusion)：资源不能被共享，只能由一个进程使用。•请求与保持条件(Holdandwait)：已经得到资源的进程可以再次申
面试整理有李说布清呀
mysqlbinLogredoLogundoLogredolog和undolog是在引擎层实现的，且是innodb引擎独有的，主要和事务相关、binLog是服务层实现的binlog中记录的是整个mysql数据库的操作内容，对所有的引擎都适用，包括执行DDL、DML，可以用来进行数据库的恢复及控制。redolog中记录的是要更新的数据，比如一条数据已提交成功，并不会立即同步到磁盘，而是记录到redo
xml解析小猪猪08 xml
1、DOM解析的步奏准备工作： 1.创建DocumentBuilderFactory的对象 2.创建DocumentBuilder对象 3.通过DocumentBuilder对象的parse(String fileName)方法解析xml文件 4.通过Document的getElem
每个开发人员都需要了解的一个SQL技巧 brotherlamp linux linux视频 linux教程 linux自学 linux资料
对于数据过滤而言CHECK约束已经算是相当不错了。然而它仍存在一些缺陷，比如说它们是应用到表上面的，但有的时候你可能希望指定一条约束，而它只在特定条件下才生效。使用SQL标准的WITH CHECK OPTION子句就能完成这点，至少Oracle和SQL Server都实现了这个功能。下面是实现方式： CREATE TABLE books ( id &
Quartz——CronTrigger触发器 eksliang quartz CronTrigger
转载请出自出处：http://eksliang.iteye.com/blog/2208295 一.概述 CronTrigger 能够提供比 SimpleTrigger 更有具体实际意义的调度方案，调度规则基于 Cron 表达式，CronTrigger 支持日历相关的重复时间间隔（比如每月第一个周一执行），而不是简单的周期时间间隔。二.Cron表达式介绍 1）Cron表达式规则表 Quartz
Informatica基础 18289753290 Informatica Monitor manager workflow Designer
1. 1）PowerCenter Designer：设计开发环境，定义源及目标数据结构；设计转换规则，生成ETL映射。 2）Workflow Manager：合理地实现复杂的ETL工作流，基于时间，事件的作业调度 3）Workflow Monitor：监控Workflow和Session运行情况，生成日志和报告 4）Repository Manager：
linux下为程序创建启动和关闭的的sh文件，scrapyd为例酷的飞上天空 scrapy
对于一些未提供service管理的程序每次启动和关闭都要加上全部路径，想到可以做一个简单的启动和关闭控制的文件下面以scrapy启动server为例，文件名为run.sh： #端口号，根据此端口号确定PID PORT=6800 #启动命令所在目录 HOME='/home/jmscra/scrapy/' #查询出监听了PORT端口
人--自私与无私永夜-极光
今天上毛概课,老师提出一个问题--人是自私的还是无私的,根源是什么? 从客观的角度来看,人有自私的行为,也有无私的
Ubuntu安装NS-3 环境脚本随便小屋 ubuntu
将附件下载下来之后解压，将解压后的文件ns3environment.sh复制到下载目录下（其实放在哪里都可以，就是为了和我下面的命令相统一）。输入命令： sudo ./ns3environment.sh >>result 这样系统就自动安装ns3的环境，运行的结果在result文件中，如果提示 com
创业的简单感受 aijuans 创业的简单感受
2009年11月9日我进入a公司实习，2012年4月26日，我离开a公司，开始自己的创业之旅。今天是2012年5月30日，我忽然很想谈谈自己创业一个月的感受。当初离开边锋时，我就对自己说：“自己选择的路，就是跪着也要把他走完”，我也做好了心理准备，准备迎接一次次的困难。我这次走出来，不管成败
如何经营自己的独立人脉 aoyouzi 如何经营自己的独立人脉
独立人脉不是父母、亲戚的人脉，而是自己主动投入构造的人脉圈。“放长线，钓大鱼”，先行投入才能产生后续产出。现在几乎做所有的事情都需要人脉。以银行柜员为例，需要拉储户，而其本质就是社会人脉，就是社交！很多人都说，人脉我不行，因为我爸不行、我妈不行、我姨不行、我舅不行……我谁谁谁都不行，怎么能建立人脉？我这里说的人脉，是你的独立人脉。以一个普通的银行柜员
JSP基础百合不是茶 jsp 注释隐式对象
1,JSP语句的声明 <%! 声明 %> 　　声明：这个就是提供java代码声明变量、方法等的场所。表达式 <%= 表达式 %> 　　这个相当于赋值，可以在页面上显示表达式的结果，程序代码段/小型指令　<% 程序代码片段 %> 2,JSP的注释
web.xml之session-config、mime-mapping bijian1013 java web.xml servlet session-config mime-mapping
session-config 1.定义： <session-config> <session-timeout>20</session-timeout> </session-config> 2.作用：用于定义整个WEB站点session的有效期限，单位是分钟。 mime-mapping 1.定义： <mime-m
互联网开放平台（1） Bill_chen 互联网 qq 新浪微博百度腾讯
现在各互联网公司都推出了自己的开放平台供用户创造自己的应用，互联网的开放技术欣欣向荣，自己总结如下： 1.淘宝开放平台(TOP) 网址：http://open.taobao.com/ 依赖淘宝强大的电子商务数据，将淘宝内部业务数据作为API开放出去，同时将外部ISV的应用引入进来。目前TOP的三条主线： TOP访问网站：open.taobao.com ISV后台：my.open.ta
【MongoDB学习笔记九】MongoDB索引 bit1129 mongodb
索引可以在任意列上建立索引索引的构造和使用与传统关系型数据库几乎一样,适用于Oracle的索引优化技巧也适用于Mongodb 使用索引可以加快查询,但同时会降低修改,插入等的性能内嵌文档照样可以建立使用索引测试数据 var p1 = { "name":"Jack", "age&q
JDBC常用API之外的总结白糖_ jdbc
做JAVA的人玩JDBC肯定已经很熟练了，像DriverManager、Connection、ResultSet、Statement这些基本类大家肯定很常用啦，我不赘述那些诸如注册JDBC驱动、创建连接、获取数据集的API了，在这我介绍一些写框架时常用的API，大家共同学习吧。 ResultSetMetaData获取ResultSet对象的元数据信息
apache VelocityEngine使用记录 bozch VelocityEngine
VelocityEngine是一个模板引擎，能够基于模板生成指定的文件代码。使用方法如下： VelocityEngine engine = new VelocityEngine();// 定义模板引擎 Properties properties = new Properties();// 模板引擎属
编程之美-快速找出故障机器 bylijinnan 编程之美
package beautyOfCoding; import java.util.Arrays; public class TheLostID { /*编程之美假设一个机器仅存储一个标号为ID的记录，假设机器总量在10亿以下且ID是小于10亿的整数，假设每份数据保存两个备份，这样就有两个机器存储了同样的数据。 1.假设在某个时间得到一个数据文件ID的列表，是
关于Java中redirect与forward的区别 chenbowen00 java servlet
在Servlet中两种实现： forward方式：request.getRequestDispatcher(“/somePage.jsp”).forward(request, response); redirect方式：response.sendRedirect(“/somePage.jsp”); forward是服务器内部重定向，程序收到请求后重新定向到另一个程序，客户机并不知
[信号与系统]人体最关键的两个信号节点 comsci 系统
如果把人体看做是一个带生物磁场的导体,那么这个导体有两个很重要的节点,第一个在头部,中医的名称叫做百汇穴, 另外一个节点在腰部,中医的名称叫做命门如果要保护自己的脑部磁场不受到外界有害信号的攻击,最简单的
oracle 存储过程执行权限 daizj oracle 存储过程权限执行者调用者
在数据库系统中存储过程是必不可少的利器，存储过程是预先编译好的为实现一个复杂功能的一段Sql语句集合。它的优点我就不多说了，说一下我碰到的问题吧。我在项目开发的过程中需要用存储过程来实现一个功能，其中涉及到判断一张表是否已经建立，没有建立就由存储过程来建立这张表。 CREATE OR REPLACE PROCEDURE TestProc IS fla
为mysql数据库建立索引 dengkane mysql 性能索引
前些时候，一位颇高级的程序员居然问我什么叫做索引，令我感到十分的惊奇，我想这绝不会是沧海一粟，因为有成千上万的开发者（可能大部分是使用MySQL的）都没有受过有关数据库的正规培训，尽管他们都为客户做过一些开发，但却对如何为数据库建立适当的索引所知较少，因此我起了写一篇相关文章的念头。最普通的情况，是为出现在where子句的字段建一个索引。为方便讲述，我们先建立一个如下的表。
学习C语言常见误区如何看懂一个程序如何掌握一个程序以及几个小题目示例 dcj3sjt126com c 算法
如果看懂一个程序，分三步 1、流程 2、每个语句的功能 3、试数如何学习一些小算法的程序尝试自己去编程解决它，大部分人都自己无法解决如果解决不了就看答案关键是把答案看懂，这个是要花很大的精力，也是我们学习的重点看懂之后尝试自己去修改程序，并且知道修改之后程序的不同输出结果的含义照着答案去敲调试错误
centos6.3安装php5.4报错 dcj3sjt126com centos6
报错内容如下: Resolving Dependencies --> Running transaction check ---> Package php54w.x86_64 0:5.4.38-1.w6 will be installed --> Processing Dependency: php54w-common(x86-64) = 5.4.38-1.w6 for
JSONP请求 flyer0126 jsonp
使用jsonp不能发起POST请求。 It is not possible to make a JSONP POST request. JSONP works by creating a <script> tag that executes Javascript from a different domain; it is not pos
Spring Security（03）——核心类简介 234390216 Authentication
核心类简介目录 1.1 Authentication 1.2 SecurityContextHolder 1.3 AuthenticationManager和AuthenticationProvider 1.3.1 &nb
在CentOS上部署JAVA服务 java--hhf java jdk centos Java服务
本文将介绍如何在CentOS上运行Java Web服务，其中将包括如何搭建JAVA运行环境、如何开启端口号、如何使得服务在命令执行窗口关闭后依旧运行第一步：卸载旧Linux自带的JDK ①查看本机JDK版本 java -version 结果如下 java version "1.6.0"
oracle、sqlserver、mysql常用函数对比[to_char、to_number、to_date] ldzyz007 oracle mysql SQL Server
oracle &n
记Protocol Oriented Programming in Swift of WWDC 2015 ningandjin protocol WWDC 2015 Swift2.0
其实最先朋友让我就这个题目写篇文章的时候，我是拒绝的，因为觉得苹果就是在炒冷饭，把已经流行了数十年的OOP中的“面向接口编程”还拿来讲，看完整个Session之后呢，虽然还是觉得在炒冷饭，但是毕竟还是加了蛋的，有些东西还是值得说说的。通常谈到面向接口编程，其主要作用是把系统设计和具体实现分离开，让系统的每个部分都可以在不影响别的部分的情况下，改变自身的具体实现。接口的设计就反映了系统
搭建 CentOS 6 服务器(15) - Keepalived、HAProxy、LVS rensanning keepalived
（一）Keepalived （1）安装 # cd /usr/local/src # wget http://www.keepalived.org/software/keepalived-1.2.15.tar.gz # tar zxvf keepalived-1.2.15.tar.gz # cd keepalived-1.2.15 # ./configure # make &a
ORACLE数据库SCN和时间的互相转换 tomcat_oracle oracle sql
SCN（System Change Number 简称 SCN）是当Oracle数据库更新后，由DBMS自动维护去累积递增的一个数字，可以理解成ORACLE数据库的时间戳，从ORACLE 10G开始，提供了函数可以实现SCN和时间进行相互转换；　　用途：在进行数据库的还原和利用数据库的闪回功能时，进行SCN和时间的转换就变的非常必要了；　　操作方法：　　1、通过dbms_f
Spring MVC 方法注解拦截器 xp9802 spring mvc
应用场景，在方法级别对本次调用进行鉴权，如api接口中有个用户唯一标示accessToken,对于有accessToken的每次请求可以在方法加一个拦截器，获得本次请求的用户，存放到request或者session域。 python中，之前在python flask中可以使用装饰器来对方法进行预处理，进行权限处理先看一个实例,使用@access_required拦截： ?