Alex丶Chen

cs213n课程笔记

文章目录

一、计算神经网络（P1）
- 1 激活函数
- - 实际操作：
- 2 数据预处理
- 3 权重初始化
- 4 批标准化
二、训练神经网络（P2）
- 1.梯度下降
- - 实际使用
- 2.避免过拟合
- 3.正则化
- - - Training：Add random noise
    - Testing: Marginalize over the noise
- 4.超参数调节
三、实践CNN
- 卷积转为矩阵运算(im2col)
- 图像卷积看作是信号中的频谱函数相乘
- 加速矩阵乘法O(n^3)
四、迁移学习
- Case Studys
- Also...
五、卷积神经网络案例
- AlexNet
- ZFNet
- VGG
- GoogLeNet
- - InCeptionV1
  - InCeptionV2V3
- ResNet
- 对比神经网络
- SENet
- Squeeze Net
- Improving ResNets...
- - ResNeXt
  - FractalNet
  - DenseNet
  - MobileNets， ShuffleNet
- Meta-learning
六、循环神经网络
- LSTM
- - 避免梯度消失
- GRU
- Image Captioning
- NAS
- Attention
七、目标检测和分割
- 目标检测
- - R-CNN
  - Fast R-CNN
  - Faster R-CNN
- 物体分割
- - Mask R-CNN
  - YOLO 系列
八、视频
- C3D: The VGG of 3D CNNs
- Separating Motion and Apperance: Two-Stream Networks
- Modeling long-term temporal structure
- - Recurrent CNN
  - 序列处理的几种方法优缺点对比
  - Spatio-Temporal Self-Attention (Nonlocal Block)
  - Inflating 2D Networks to 3D (I3D)
  - Visualizing Video Models
  - Treating time and space differently: SlowFast Networks
  - Temporal Action Localization
  - Spatio-Temporal Dection
- Recap: Video Models

一、计算神经网络（P1）

Activation Functions：（ReLU）
Data Processing（images: subtract mean）
Weight Initialization (use Xavir/He init)
Batch Normalizaition

1 激活函数

Sigmoid 的饱和性导致梯度消失
- Sigmoid 导致所有的权重同向增大减小，导致zig(锯齿形) zag（急转）的更新方向
- exp()计算复杂度高，过大会越界
tanh 避免了zig zag
ReLU 不会饱和，计算简单收敛快，但会神经元死亡

实际操作：

使用ReLU，注意学习率
试一试Leaky ReLU/Maxou/ELU
试一试 tanh 但不要期待太多
不要用sigmoid

2 数据预处理

标准化，PCA白化（第一主成分方向即方差最大的方向，和第二主成分方向即与第一主成分正交的方向投影到坐标轴上，此时协方差矩阵为对角矩阵去相关了，再归一化，协方差矩阵为单位阵），ZCA白化（PCA白化基础上，再投影回原坐标系的方向）；使各维度的梯度更新更平均

3 权重初始化

Xavier /z wer/初始化，标准正态分布的基础上/np.sqrt(Din)，即对感受野进行惩罚，Xavier初始化假设x，w都关于0对称，对于ReLU激活失效
Kaiming 初始化（针对ReLU激活函数），标准正态分布的基础上 * np.sqrt(2/Din);
- 想让输入方差=输出方差：
  - W服从正态分布，w ~ Normal(2, 2/d)
  - W服从均匀分布，w ~ Uniform(sqrt(-6/d), sqrt(6/d))

4 批标准化

放在非线性激活函数之前
加快收敛
改善梯度（远离饱和区）
可以使用大学习率（不必担心大学习率导致的梯度爆炸）
对初始化不敏感（废话）
起到正则化的作用
训练和测试的BN层是不一样的
- 训练：标准化每一个特征，再重参数化
- 测试：训练时的总均值代替 mini-batch 均值；训练时的总方差代替 mini-batch 方差

二、训练神经网络（P2）

优化训练误差
- 优化算法
- 学习率调整
优化测试误差
- 正则化
- 超参数选择

1.梯度下降

SGD 随机梯度下降：在梯度较大的方向上发生震荡，陷入鞍点
SGD + Momentum, 方向平滑，冲劲大会过头
Nesterov Momentum：动量基础上Look ahead，先向速度方向前进，再向梯度方向前进
AdaGrad: 惩罚梯度较大的方向，惩罚项为历史梯度的平方和，到最后更新幅度越来越小
RMSProp：AdaGrad基础上，加入关于时间的衰减因子
Adam：第一动量（Momentum）+第二动量（AdaGrad/RMSProp）
Start with large learing rate and decay as over time

梯度下降是First-Order Optimization
若考虑Second-Order，与二阶导数的相关量（曲率，物理中的法向加速度）

广义相对论：在引力场中，时空的性质是由物体的“质量”分布决定的，物体“质量”的分布状况使时空性质变得不均匀，引起了时空的弯曲。因为一个物体有质量就会对时空造成弯曲，而你可以认为有了速度，有质量的物体变得更重了，时空弯曲的曲率就更大了。

二阶优化能更快收敛：牛顿法中，找一阶导数=0的位置，需要对一阶导数再求导，再迭代优化
\

但是海森的逆矩阵计算复杂，一般不用；
而使用BGFS（Quasi-Newton拟牛顿法，更新海森矩阵而O(n^{2)而不求逆运算O(n}3)），L-BGFS（Limited memory BGFS，不储存完整的海森矩阵的逆）
推导：

实际使用

用Adam，often works ok even with constant learning rate
SGD+Momentum 可以比Adam表现的更好，但是需要多调节LR
若能承担复杂的计算量，使用 L-BFGS

2.避免过拟合

Always do early stopping
模型集成（Enjoy 2% extra performance）：checkpoint 集成（训练过程中不同时刻的集成）；周期性增大学习率跳出局部最优点，训练出多种不同参数，再集成；
L1和L2正则化
Dropout达到多模型融合的效果，每次迭代都相当于一个子模型；让一些神经元单独决策，少受其他神经元的影响

3.正则化

Training：Add random noise

Testing: Marginalize over the noise

Dropout
Batch Normalization
Data Augumentation
DropConnect
Fractional Max Pooling
Cutout
Mixup
Consider Dropout for large fully connected layer
Batch normalization and data augumentation almost always a good idea
Try cutout and mixup especially for samall datasets

4.超参数调节

检查初始的loss是否正常
首先在小数据集上过拟合
寻找LR使得loss继续下降
Coarse grid，训练1-5epoch
Refine grid，train longer
观察loss曲线

三、实践CNN

参数量小，计算量小，更好的非线性表示能力

大卷积核换成多个小型卷积核
1*1卷积核用来降维和升维
多个长方形卷积核

卷积转为矩阵运算(im2col)

卷积核Conv weights: D filters, each K * K * C
拉成 D * (K^2 * C) 的矩阵（行向量）

Feature map: H * W * C
拉成(K^2 * C) * N（列向量）

矩阵点乘：D * N results reshape to output tensor

卷积核向量 * 感受野向量

图像卷积看作是信号中的频谱函数相乘

卷积理论：两个函数的卷积=两个函数傅里叶变换之后逐元素乘积

傅里叶变换：任何信号都可以由多个不同频率不同幅度的正弦信号累加而成，实现时域信号向频域信号的转换

卷积核可以看作是滤波器（低通模糊图像，高通提取边缘），提取图像不同频率的特征

图像看作二维信号，频域中高频的地方是像素明暗变化剧烈的地方

时域卷积=频域相乘：

分别计算卷积核和输入图像的FFT（快速傅里叶变换向频域转换）
计算逐元素乘积（存在0元素，则实现了滤波效果）
计算傅里叶逆变换

加速矩阵乘法O(n^3)

Stassen 算法 O(N^2.81)
Lavin & Gray 对3*3卷积的矩阵乘法的优化，在VGG上有2-3倍速度的提升

四、迁移学习

针对不同场景别随便迁移，预训练模型：特征抽取作为特定任务的Backbone

	差异小的数据集	差异大的数据集
数据量小	改动线性分类层	trouble
数据量大	多往前训练几层	往前训练更多层

Case Studys

AlexNet: 2012冠军 Hinton团队多伦多大学
VGG： 2014亚军 VGG16 和VGG19 牛津大学
GoogleNet： 2014冠军 Inception模块谷歌
ResNet： 2015冠军残差模块何凯明团队 MSRA
LeNet：1998 CNN开山之作纽约大学

Also…

SENet：2017冠军，SE模块，Momenta+牛津胡杰团队
NiN（Network in Network）：1*1卷积，Global Average Pooling
Wide ResNet：增加残差块中卷积核的数量（宽度）
ResNeXT：ResNet+Inception
DenseNet：2017CVPR 最佳论文 Dense模块
FractalNet：分形网络
MobileNets：Group卷积和Depthwise Separable卷积
NASNet：2018 神经架构搜索强化学习谷歌大脑
SqueezeNet：斯坦福/伯克利 firemodule 压缩参数量

How transferable are features in deep nerual networks? NIPS 14

五、卷积神经网络案例

AlexNet

ImageNet classification with deep convolutional Neural Networks Krizhevsky et al. 2012

8 层
使用ReLU，比Sigmoid效率高上很多
使用Local Response Normalization 局部响应归一化；作用在同层中相邻的通道之间，VGG论文指出没啥意义，徒增计算量
使用不重叠的最大池化，认为这样可以防止过拟合，后来都不这么做了，进一步说明浅层网络的超参调节策略不能迁移到深层网络中
为了防止过拟合，使用数据增强手段：原本图像+PCA主成分向量X随机数向量，翻转，随机裁剪，平移变换，颜色光照变换
防止过拟合：dropout 0.5, 测试阶段失活一般神经元，测试阶段使用所有的神经元，但是将神经元的输出乘以0.5
minibatch size 128，按一批的平均梯度进行更新
SGD Momentum 0.9
卷积层的偏置项为1，鼓励ReLU进行正向激活，其他层bias为0，weights都为N(0，0.01)
Learning rate 1e-2, reduced by 10
L1 weight decay 5e-4;
7 CNN ensembles

ZFNet

Visualizing and Understanding Convolutional Networks Zeiler and Fergus 2013

8 层，改进AlexNet，更小的步长和卷积核，认识到的特征更细节并且有更少的"dead" features
Deconvolution
- 反池化：记住最大池化时的最大值对应位置，还原至相应位置，其他位置为0
- 反激活：x=max(0,x)
- 转置卷积
找到验证集中激活最大的9张图片，并反池化反卷积重构到原始层。发现越深的层认识到的特征越细节
训练过程特征演化可视化：浅层认识的粗特征很快就收敛，而深层认识到的细特征多轮之后才逐渐收敛
平移，缩放，旋转敏感性分析：得到的第一层特征与原始输入之间的欧式距离：第一层微小变化带来显著影响，第七层微小变化带来线性影响
局部遮挡敏感性分析：找到第五层激活值最大的那个Feature Map，原图中移动遮挡块，记下不同位置时Feature Map，并叠加起来，制作热力图
相关性遮挡分析：对于不同的狗，都遮右眼，看delta(原始激活值-遮住的激活值)的MeanSD；遮住狗眼睛时，第五层delta小：说明此时网络认识到不同狗脸中狗眼睛是相关的；随机遮：第五层delta大，第七层delta小，说明深层网络认识到的特征越细节更倾向于关注语义特征
模型迁移泛化分析
各层特征有效性分析：取出不同层的Feature，用SVM分类，发现越深，越准

VGG

Very Deep Convolutional Networks for Large-Scale Image Recognition Simonyan and Zisserman 2014

VGG-16, VGG-19
Small Filters 3✖3, 与7✖7的感受野相同
占用内存过大
fc7 features 可以用在其他场景

GoogLeNet

InCeptionV1

Going Deeper with Convolutions （Inception V1）

非常好的一篇文章

Introduction 中就说了GoogleNet只有5 million 参数，12倍小于AlexNet，还更加准确。提出不要一味追求精度，还要考虑设备上部署的效率；

启发：Network in network: 1 卷积，Global Average Pooling 取代全连接层；以及《Provable Bounds for Learning some deep representations》用稀疏分散的网络取代以前庞大密集臃肿的网络

Related Work中首先提到启发来源，池化层虽然丢失空间像素精确，但是可以用来做定位和目标检测
《Overfeat: Integrated recognition, localization and detection using convolutional networks》
《Robust object recognition with cortex-like mechanisms》处理多尺度的输入（不同尺度的卷积核），类似Inception 模块
接着，提到了目标检测：《 Rich feature hierarchies for accurate object detection and semantic segmentation》首先找出候选区域，再对每个候选区域使用CNN来识别类别。
Motivation and high level considerations：增加深度和宽度，Inception 模块在利用现有模型的基础上，又实现了稀疏性减少计算；如果作为RCNN的基模型，对于定位和目标检测都很有用处
Architectural Details：设计思想是用密集模块来近似出局部最优稀疏结构；越靠近前面的层越提取局部信息，越靠近后面越提取大范围信息，所以嵌入到两层之间的Inception模块大的小的感受野都需要有；
使用1卷积的理由：受到embedding用低维dense向量代替高维稀疏向量启发，同时希望降维后向量能够不要那么密集压缩便于计算处理，采用1卷积，既可以降维又可以减少计算；
various scales visual information simultaneously processed and then aggregated
GoogLeNet：GAP代替全连接层好处一，便于fine-tune迁移学习，好处二，提升了0.6%的Top-1准确度；浅层特征其实也有了一定的区分度，所以作者在4a和4b后面添加辅助分类器，计算两个辅助Loss，测试阶段去除辅助分类器。

$L=L_{最后} + 0.3 L_{辅1} + 0.3 L_{辅2}$

Training Methodology: asynchronous stochastic gradient descent 异步随机梯度下降（因为数据并行输入）；
调参玄学：dropout和learning rate，数据增强：裁剪为原图的8%-100%, 长宽比例调节至3/4-4/3之间，光度变换（Some improvements on deep convolutional neural network based image classification），等概率使用bilinear, area, nearest neighbor and cubic插值方法。
用于分类任务：一张图裁剪并镜像成144个patch输入，对144个softmax结果取平均得到预测类别；采用7个模型训练好的模型进行集成；比base降低了3.45%的Top5 Error
用于物体检测任务：如果算法给出的框分类正确且与正确标签的框的交并比（jaccard index）大于0.5则预测正确，同一类别的所有分类结果可以统计Confusion Matrix，算法评估使用mAP（每个类别不同阈值下PR曲线围成的面积=AP，不同类别的平均AP=mAP）;
使用《Segmentation as selective search for object recognition.》Selective search 方法，使用《Scalable object detection using deep neural networks》multi-box predications 减少无用的候选框
没有使用框回归和，之间对候选框分类
使用Inception模型作为分类器

22 层
Inception 模块
1×1卷积
1. 降维
2. 减少参数量和运算量
3. 增加模型深度提高非线性表达能力
GAP, 每一个通道求平均，不用FC，减少了参数量
可以利用GAP之后的值，配合最后FC的weights，制作Class Activation Map，用于关键信息定位

InCeptionV2V3

Rethinking the Inception Architecture for Computer Vision(Inception V2 V3)

Introduction 中提到的前沿应用
- RCNN (Object detection)
- Segmentation (全卷积网络)
- human pose estimation (Deeppose)
- video classification (李飞飞 CVPR2014)
- object tracking (NIPS 2013)
- superresolution (何凯明 ECCV2014，TPAMI2015)
General Design Principles
- 原则一：避免representation bottlenecks: 过度降维；feature map 的长宽应该随网络加深逐渐减小
- 原则二：Higher representations are easier to process locally within a network 特征越多，收敛越快，相互独立的特征越多，区分度越大
- 原则三：spatial aggregation can be done over lower dimensional embeddings without much or any loss in representational power
- 原则四：平衡width，depth
Facterizing Convolutions with Large Filter Size
- 大卷积替换成多层小卷积，只要提供相同大小的感受野就行了 ---- 减少了参数量
- Spatial Factorization into Asymmetric Convolutions: n x n --> 1 x n & n x 1
Auxiliary Classifiers

V1认为辅助分类器让浅层也学习到特征，辅助分类器能在浅层注入梯度，防止梯度消失；

这篇文章认为辅助分类器不能帮助模型更快收敛；辅助分类器只是起到了正则化的作用，所以这篇文章改为BN和Dropout来做正则化
Efficient Grid Size Reduction

原本方法：先池化再卷积违反原则一（过度降维浅层丢失信息），先升维再池化（计算量增加）都很expensive

高效下采样：

池化和卷积并行的Inception模块；加深——两条路径做卷积（卷积分解），一条路径做池化，再沿channel摞在一起

扩展滤波器组：加宽——用在模型的最深处，符合原则二：相互独立的特征越多，区分度越大，在最后分类层之前生成高维稀疏特征
Inception-V2
1. 正则化之——标签平滑（LSR，Label Smooth Regulerzation）
  
  因为交叉熵损失的原因，让label更趋近于softmax之后的分布（0.33，0.9，0.33，0.33），而不是独热编码（0，1，0，0）
  
  防止过拟合：如果按照独热编码，网络就会尽可能让softmax之后的数为（0.0001，0.99999，0.00001，0.0000）那么在前一层得到的值就变成了（0.0001，正无穷，0.00001，0.00001）过于偏向正确标签
  Hiton “When Does Label Smoothing Help?”
  
  知识蒸馏（KD）：通过引入teacher（复杂模型），诱导student（简单模型）的训练；
  - 与GoogleNet的关系：
  FITNETS：Hints for Thin Deep Nets【ICLR2015】
  
  deep是DNN主要的功效来源，之前的工作都是用较浅的网络作为student net，这篇文章的主题是如何mimic一个更深但是比较小的网络。
  
  使用的方法直觉上来讲也是直接的：既然网络很深直接训练会很困难，那就通过在中间层加入loss的方法，通过学习teacher中间层feature map来transfer中间层表达的知识，文章中把这个方法叫做Hint-based Training。（Inception V1 采用了该方法）
  
  Knowledge Distillation in Generations: More Tolerant Teachers Educate Better Students【AAAI2019】
  
  硬标签会导致模型产生过拟合现象，soft label对于模型的泛化能力有所帮助
  
  常用的标签处理策略：label smoothing regularization(lsr)**（Inception V2 采用了该方法）**和confidence penalty(CP)两种方法，但其缺点是考虑了所有的类。本文提出了一个更合理的方法，没有计算所有类的额外损失，而是挑选了几个具有最高置信度分数的类。
  
  teacher的loss中加入一个约束：min置信度Top1的标签的和其余K-1个标签平均值之间的gap
  
  训练student的时候，用teacher 的soft label 和 hard label 融合
  
  论文中实验在CIFAR-100和ILSVRC2012分类数据集上**涨点3%~8%**不等

ResNet

Very Deep networks using residual connections He et.al 2015

152 层
BN after every CONV layer
Xavier 2/initialization; 不改变ReLU输出输出的数据分布
SGD + Momentum:0.9
Learning rate 0.1
mini batch: 256
weight decay: 1e-5
没用dropout

对比神经网络

An Analysis of Deep Nerual Network Models for Practical Applications 2017

SENet

Squeeze-and-Excitation Networks (SENet)

接在其他模型的后面，自适应训练每个通道Feature Map的权重

Squeeze Net

Squeeze Net: AlexNet-level Accuracy With 50✖ Fewer Parameters and < 0.5Mb Model Size

1 降维，再一路1，一路3，合并
权重合并量化哈夫曼编码，模型裁剪

Improving ResNets…

ResNeXt

并行化更多的Res结构

FractalNet

FractalNet: Ultra-Deep Neural Networks without Residuals Larsson et al. 2017

DenseNet

Densely Connected Convolutional Networks huang et al. 2017

MobileNets， ShuffleNet

MobileNets: Efficient Convolutional Neural Networks for Mobile Applications Howard et al.2017

每个通道用单独的卷积核卷积，再用1卷积提取跨层特征，大大减少参数量和运算量
车辆，行人目标 SSD+MobileNet

Meta-learning

Meta-learning: Learning to learn network architectures

Neural Architecture Search with Reinforcement Learning (NAS)

RNN作为控制器，每一层的参数对应RNN序列
以概率p在搜索空间中选择一个网络架构，训练得到准确率作为奖赏R，计算概率p的梯度，传回到RNN控制器中
增加好模型的似然概率，降低坏模型的似然概率
先在小数据上训练，再迁移到大数据上

六、循环神经网络

Vanilla RNN 简单但是效果不是很好，会梯度消失或者梯度爆炸
一般都是使用LSTM和GRU
Exploding 使用gradient clipping， Vanishing 使用additive interactions(LSTM)
更好更简单的结构是研究热点

LSTM

输入：当前输入，短期记忆，长期记忆
输出：当前输出，短期记忆，长期记忆

长期记忆乘以一个sigmoid的结果(遗忘一些东西)；加上sigmodi的结果和tanh的结果(加上一些记忆)

短期记忆：（短期记忆+当前输入）乘上第一套权重，经过simoid遗忘门，供给一个0-1之间的遗忘系数给长期记忆；（短期记忆+当前输入）乘上第二套权重，经过一个sigmoid，（短期记忆+当前输入）乘上第三套权重经过一个tanh，以上两者相乘，给长期记忆供给一些新的记忆；

新的短期记忆（当前记忆单元的输出值）：（短期记忆+当前输入）乘上第四套权重经过一个sigmoid，长期记忆经过一个tanh，以上两者相乘得到新的短期记忆，同时共给下一层和作为当前层的输出。[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Z4j3h96a-1602579943887)(cs213n课程笔记 .assets/image-20200910200440937.png)]

避免梯度消失

与ResNet对比，长期记忆乘上一个0.x值，加上新的记忆，给到下一层的长期记忆，不论如何都会有值

Res模块：当前输入乘上一套权重，ReLU之后，加上当前输出，给到下一层

GRU

Gated Recurrent Unit

Learning phrase representations using RNN encoder-decoder for statistical machine translation, 2014

Image Captioning

输入图片，经过CNN得到特征向量，输入到RNN第一个hidden unit

测试时，输入图片和

NAS

RNN Architectures: Neural Achitectures Search

Zoph and Le, " Neural Achitectures Search with reinforence learning" ICLR 2017

Attention

Sequence --> LSTM(Encoder) --> LSTM(Decoder) --> Sequence

Sutskever et al. “Sequence to Sequence Learning with Neural Networks” NIPS 2014

用于机器翻译任务

机器翻译中的Attention机制

Bahdanau et al. “Neural machine translation by jointly learning to align and translation” ICLR 2015

Decoder 的每一个 timestep 都乘上一个系数（Context Vector）

Image Captioning 中的Attention机制

Xu et al. “Neural Image Caption Generation with Visual Attention” ICMK 2015

每个卷积核对应一个Attention weights，与原始卷积叠加得到Decoder 的每一个 timestep 都乘上的系数（Context Vector）

X, Attedn, Y

"Show, attend, and tell"(Xu et al, /CML 2015)
Look at image, attend to image regions, produce question

"Ask, attend, and answer"(Xu and Saenko, ECCV 2016)
"Show, ask, attend, and answer"(Kazemi and Elqursh, 2017)

Read text of question, attend to image regions, produce answer

"Listen, attend, and spell"(Chan et al, ICASSP 2016)
Process raw audio, attend to audio regions while producing text

"Listen, attend, and walk"(Mei et al, AAA/ 2016)
Process text, attend to text regions, output navigation commands

Attention Layer 的种类还挺多：Attention Layer, Self-Attention Layer, Masked Self-Attention Layer, Multihead Self-Attention Layer

七、目标检测和分割

目标检测

属于回归问题，Loss一般是L2

评价指标：mAP

单目标检测

label : (x, y, width, heigh)
多目标检测

根据目标数量不同，不同图片的label维度不同；一般首先选框，再用CNN判断类别
- 选框策略：启发式（从小到大直到选择出一个尽可能小且能框住所有物品的框）

R-CNN

Region-Based CNN

选大概2000个框，分别CNN，判断各个框类别，选择一个候选框子集（top-K，对背景或者类别设置阈值，保留满足threshold的框）

Fast R-CNN

对于原图，用一个backbone模型的前半部分得到Image features（使用全卷积以使得到的低维feature map中目标的相对位置和原图一致）–> crop （低维feature map中的crop 操作 fast）–> resize features --> per-region network (backbone 模型的后半部分) --> category and box transform per region

Faster R-CNN

Region propals computed by heuristic “Selective Search” algorithm on CPU. So let’s learn them with a CNN instead!

Insert Region Proposal Network (RPN) from features

联合训练4种Loss

人体姿态估计: label(14 个关节点的坐标(x,y))

物体分割

label(每个像素点对应一个类别)

全卷积网络（一般先降维，再升维）

Mask R-CNN

Attach a branch for mask prediction , 先多目标检测选框，再在框中做分割

YOLO 系列

八、视频

Raw Videos: long, high FPS

Training: Train model to classify short clips with low FPS

Testing: Test model on different clips and then average predictions

Early Fusion VS Late Fusion VS 3D CNN

Single Frame model works well - always try this first
3D have improved a lot

C3D: The VGG of 3D CNNs

3 * 3 * 3 conv and 2 * 2 * 2 pooling
The pretrained model on Sports-1M dataset was widely used as video feature extrator
Problem: Too expensive conv operation
- AlexNet：0.7GFLOP
- VGG-16：13.6GFLOP
- C3D：39.5 GFLOP （2.9x VGG）

Separating Motion and Apperance: Two-Stream Networks

Simoyan and Zisserman “Two-stream convolutional networks for action recognition in videos”, NIPS 2014

Zisserman 大佬团队的

原图+光流(Optical Flow)图，early fusion, 分别使用convNets

Modeling long-term temporal structure

Donahue et al. “Long-term recurrent convolutional networks for visual recognition and description”, CVPR 2015

先用对每一帧用CNN提取，再用RNN串连 Feature Map，Good at long sequences

**Problem：**RNN计算费时不能并行

Recurrent CNN

Ballas et al. “Delving Deepper into Convolutional Networks for Learning Video Representations” ICLR 2016

序列处理的几种方法优缺点对比

Spatio-Temporal Self-Attention (Nonlocal Block)

Wang et al. “Non-local neural networks” CVPR 2018

Inflating 2D Networks to 3D (I3D)

Carreira and Zisserman “Quo Vadis, Action Recognition? A New Model and the Kinetics Dataset” CVPR 2017

这二作不是VGG的二作嘛？

提供了kinetics数据集

Visualizing Video Models

Feichtenhofer et al. “Deep Insights into Convolutional Networks for Video Recognition” IJCV 2019

Zisserman 这次是四作

添加一个term 鼓励平滑的光流，惩罚过快过慢的光流

可视化了Fast Motion 和 Slow Motion

Treating time and space differently: SlowFast Networks

Feichtenhofer et al. “SlowFast Networks for Video Recognition” ICCV 2019

Slow pathway: 选用low frame rate片段，经过大Channel，小Time 卷积
Fast pathway：同一个片段，但是使用high frame rate，经过小Channel，大TIme 卷积；Slow path的Channel x 1/8，TIme x 8，则两条路径的prediction维度相同

可以看到最后一层，Slowpath输出 C x T (2048 x 4)，Fastpath输出 C x T (256 x 32) 维度相同

Temporal Action Localization

Chao et al, “Rethinking the Faster R-CNN Architecture for Temporal Action Localization” CVPR 2018

Spatio-Temporal Dection

Gu et al, “AVA: A Video Dataset of Spatio-temporally Localized Atomic Visual Actions” CVPR 2018

Recap: Video Models

Single-frame CNN (Try this first!)
Late fusion
Early fusion
3D CNN / C3D
Two-stream networks
CNN+RNN
Convolutional RNN
Spatio-temporal self-attention
SlowFast networks
SoTA …

你可能感兴趣的:(课程笔记,计算机视觉,神经网络)

基于Matlab_simulink仿真相关控制算法、优化算法相关帮助代做，原理讲解 985计算机硕士仿真模型 matlab 算法开发语言
Matlab/simulink仿真相关控制算法、优化算法相关帮助代做，原理讲解：1.优化算法相关：蚁群优化算法，遗传优化算法等2.控制器相关：ADRC控制，鲁棒控制，神经网络控制，MPC等3.神经网络相关：BP神经网络，RBF神经网络，LSTM神经网络等文章目录1.优化算法相关蚁群优化算法（ACO）2.控制器相关ADRC控制3.神经网络相关BP神经网络1.构建光伏系统模型1.1光伏电池模型1.2控
Transformer与图神经网络的融合与应用 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Transformer与图神经网络的融合与应用关键词：Transformer,图神经网络,注意力机制,图结构数据,图表示学习,图分类,图生成1.背景介绍近年来，深度学习技术在各个领域取得了显著的进展。其中，Transformer模型和图神经网络（GraphNeuralNetworks,GNNs）是两个备受关注的研究方向。Transformer最初应用于自然语言处理领域，通过自注意力机制实现了并行计
深度学习的颠覆性发展：从卷积神经网络到Transformer AI天才研究院 AI大模型应用入门实战与进阶 ChatGPT 大数据人工智能语言模型 AI LLM Java Python 架构设计 Agent RPA
1.背景介绍深度学习是人工智能的核心技术之一，它通过模拟人类大脑中的神经网络学习从大数据中抽取知识，从而实现智能化的自动化处理。深度学习的发展历程可以分为以下几个阶段：2006年，GeoffreyHinton等人开始研究卷积神经网络（ConvolutionalNeuralNetworks，CNN），这是深度学习的第一个大突破。CNN主要应用于图像处理和语音识别等领域。2012年，AlexKrizh
群体智能优化算法-粒子群优化算法（Particle Swarm Optimization, PSO，含Matlab源代码） HR Zhou 算法 matlab 智能优化算法优化
摘要（Abstract）粒子群优化（PSO）是一种基于群体智能的优化算法，受鸟群觅食行为的启发。PSO通过模拟粒子（个体）在搜索空间中的运动来寻找最优解。每个粒子根据自身的历史最优位置（pBest）和全局最优位置（gBest）动态调整速度和位置，从而在全局搜索和局部搜索之间取得平衡。PSO具有收敛速度快、实现简单、计算复杂度低等优点，广泛应用于函数优化、神经网络训练、工程优化等领域。算法介绍1.主
AI 大模型应用数据中心的数据迁移架构 AGI大模型与大数据研究院 DeepSeek R1 &大数据AI人工智能 java python javascript kotlin golang 架构人工智能
AI大模型、数据中心、数据迁移、架构设计、迁移策略、性能优化、安全保障1.背景介绍随着人工智能（AI）技术的飞速发展，大规模AI模型的应用日益广泛，涵盖了自然语言处理、计算机视觉、语音识别等多个领域。这些AI模型通常需要海量的数据进行训练和推理，因此数据中心作为AI应用的基础设施，显得尤为重要。然而，随着AI模型规模的不断扩大，数据中心面临着新的挑战：数据规模庞大:AI模型的训练和推理需要海量数据
DeepLabv3+改进18:在主干网络中添加REP_BLOCK AICurator 深度学习 python 机器学习 deeplabv3+语义分割
【DeepLabv3+改进专栏！探索语义分割新高度】你是否在为图像分割的精度与效率发愁？本专栏重磅推出：✅独家改进策略：融合注意力机制、轻量化设计与多尺度优化✅即插即用模块：ASPP+升级、解码器PS:订阅专栏提供完整代码论文简介我们提出了一种通用的卷积神经网络（ConvNet）构建模块，可在不增加推理时间成本的情况下提升性能。该模块名为多样化分支块（DBB），通过结合不同尺度和复杂度的多样化分支
暗光增强技术研究进展与产品落地综合分析（2023-2025） AndrewHZ 深度学习新浪潮图像处理算法动态范围计算机视觉深度学习 transformer 暗光增强
一、引言暗光增强技术作为计算机视觉与移动影像领域的核心研究方向之一，近年来在算法创新、硬件适配及产品落地方面取得了显著进展。本文从技术研究与产业应用两个维度，系统梳理近三年（2023-2025）该领域的关键突破，并对比分析主流手机厂商的影像技术优劣势。二、暗光增强技术研究进展1.算法创新：从传统模型到深度学习（1）Retinex理论的深度结合清华与ETH联合提出的Retinexformer（202
Postman高级功能深度解析：Mock Server与自动化监控——构建高效API测试与监控体系测试渣测试工具 postman
引言：Postman在API开发中的核心价值在数字化时代，API（应用程序编程接口）已成为系统间交互的“神经网络”，其质量直接影响用户体验与业务连续性。然而，传统API测试面临两大挑战：开发阶段依赖：前端与后端团队需同步开发，导致进度延迟；测试环境复杂：生产数据敏感、测试场景覆盖不全、性能压力模拟困难。Postman作为全球领先的API开发与测试工具，通过其MockServer与自动化监控两大核心
TypeScript语言的计算机视觉苏墨瀚包罗万象 golang 开发语言后端
使用TypeScript进行计算机视觉：一个现代化的探索引言随着人工智能和机器学习的快速发展，计算机视觉（ComputerVision）成为了一个极具活力的研究领域。计算机视觉旨在使计算机能够“看”和“理解”数字图像或视频中的内容。近年来，TypeScript作为一种现代化的编程语言，因其类型安全和更好的开发体验，逐渐在前端和后端开发中得到了广泛应用。本文将探讨如何使用TypeScript进行计算
人工智能之数学基础：数学对人工智能技术发展的作用每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能深度学习机器学习神经网络自然语言处理数学
本文重点数学是人工智能技术发展的基础，它提供了人工智能技术所需的数学理论和算法，包括概率论、统计学、线性代数、微积分、图论等等。本文将从以下几个方面探讨数学对人工智能技术发展的作用。概率论和统计学概率论和统计学是人工智能技术中最为重要的数学分支之一。概率论和统计学的应用范围非常广泛，包括机器学习、数据挖掘、自然语言处理、计算机视觉等领域。在人工智能技术中，概率论和统计学主要用于处理不确定性的问题，
YOLO魔改之频率分割模块（FDM）清风AI YOLO算法魔改系列 YOLO 人工智能计算机视觉目标检测 python 深度学习
目标检测原理目标检测是一种将目标分割和识别相结合的图像处理技术，旨在从图像中定位并识别特定目标。深度学习方法，如FasterR-CNN和YOLO系列，已成为主流解决方案。这些方法通常采用两阶段或单阶段策略，通过卷积神经网络(CNN)提取特征并进行分类和定位。在小目标检测中，为克服分辨率低和特征不明显的问题，模型设计中会特别注重特征融合和多尺度处理，以增强对小目标的感知能力。YOLOv8基础YOLO
目标检测YOLO实战应用案例100讲-基于毫米波雷达与摄像头协同的道路目标检测与识别（续）林聪木目标检测 YOLO 人工智能
目录3.2实测数据采集与分析3.2.1回波数据处理3.2.2毫米波雷达数据采集实验3.3基于传统图像特征的目标识别算法3.3.1基于灰度共生矩阵的时频图特征提取3.3.2支持向量机分类器3.3.3实验及结果分析3.4基于卷积神经网络的目标识别算法3.4.1卷积神经网络的基本理论3.4.2卷积神经网络框架设计3.4.3实验及结果分析基于图像的目标检测算法4.1目标检测算法一般流程4.2典型目标检测算
计算机视觉毕业设计选题推荐：选题技巧建议收藏 HaiLang_IT 毕业设计人工智能计算机视觉
目录前言毕设选题开题指导建议更多精选选题选题帮助最后前言大家好,这里是海浪学长毕设专题!大四是整个大学期间最忙碌的时光，一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理了人工智能专业最新精选选题，如遇选题困难或选题有任何疑问，都可以问学长哦(见文末)!对毕设有任何疑问都可以问学长哦!更多选题指导:最新最全计算机专业毕设选题精选推荐汇
数学建模清风课程笔记——第二章 TOPSIS法 minpengyuanBITer 数学建模数学建模笔记
TOPSIS(TechniqueforOrderPreferencebySimilaritytoIdealSolution)可翻译为逼近理想解排序法，国内简称为优劣解距离法。TOPSIS法是一种常用的综合评价方法，其能充分利用原始数据的信息，其结果能够精确地反映各评价方案之间的差距。评价类问题1TOPSIS法TOPSIS法概念：TOPSIS法是一种常用的综合评价方法，能充分利用原始数据的信息，其结
Python 的 ultralytics 库详解白.夜人工智能
ultralytics是一个专注于计算机视觉任务的Python库，尤其以YOLO（YouOnlyLookOnce）系列模型为核心，提供了简单易用的接口，支持目标检测、实例分割、姿态估计等任务。本文将详细介绍ultralytics库的功能、安装方法、核心模块以及使用示例。1.ultralytics库简介ultralytics库由Ultralytics团队开发，旨在为YOLO系列模型提供高效、灵活且易
书籍-《动手学深度学习（英文版）》
书籍：DiveintoDeepLearning作者：AstonZhang，ZacharyC.Lipton，MuLi，AlexanderJ.Smola出版：CambridgeUniversityPress编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《动手学深度学习（英文版）》01书籍介绍深度学习已经彻底改变了模式识别，为计算机视觉、自然语言处理和自动语音识别等领域提供了强大的工具。应用深度学
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法天天酷科研工艺参数优化 matlab 神经网络工艺参数优化
Matlab基于BP神经网络与NSGA-II的多目标工艺参数优化方法一、方法原理与框架BP神经网络的作用BP神经网络通过建立工艺参数与目标性能（如翘曲变形、收缩率、硬度等）之间的非线性映射关系，作为代理模型替代复杂的物理仿真或实验。其优势在于：能够处理多输入-多输出的复杂非线性关系，例如激光功率、扫描速度与熔覆层性能的关联。在注塑成型中，预测体积收缩率和翘曲变形的相对误差可控制在5%以内。通过正交
使用 TensorFlow 进行图像处理：深度解析卷积神经网络（CNN）一碗黄焖鸡三碗米饭人工智能前沿与实践 tensorflow 图像处理 cnn 人工智能机器学习 python ai
目录使用TensorFlow进行图像处理：深度解析卷积神经网络（CNN）1.什么是卷积神经网络（CNN）？CNN的基本结构为什么CNN适合图像处理？2.使用TensorFlow构建CNN2.1环境准备2.2加载并预处理MNIST数据集2.3构建CNN模型2.4编译和训练模型2.5评估模型3.CNN的优化与改进3.1使用数据增强3.2调整网络结构4.CNN在其他图像处理任务中的应用5.总结参考文献在
Opencv计算机视觉编程攻略-第一节图像读取与基本处理 weixin_44242403 深度学习 opencv 计算机视觉
1.图像读取导入依赖项的h文件#include#include#include#include项目Valuecore.hpp基础数据结构和操作（图像存储、矩阵运算、文件I/O）highgui.hpp图像显示、窗口管理、用户交互（图像/视频显示、用户输入处理、结果保存）imgproc.hpp图像处理算法（图像滤波、几何变换、边缘检测、形态学操作）二读取图片Matimage;//图像矩阵std::co
神经网络之参数初始化硬水果糖人工智能神经网络人工智能深度学习
引言：参数初始化是训练深度神经网络的一个关键步骤，目的是给网络中权重（weights）和偏置（biases）赋予初始值。合适的参数初始化方法有助于提高训练速度、避免梯度消失/爆炸问题，并且加速网络的收敛。一、参数初始化目的避免梯度消失和梯度爆炸：在深度神经网络中，参数初始化对梯度流动非常重要。如果初始权重值太大或太小，可能导致梯度爆炸或梯度消失，从而增加网络的训练难度。加速收敛：良好的初始化可以帮
神经网络基础之正则化硬水果糖人工智能神经网络人工智能机器学习
引言：正则化（Regularization）是机器学习中一种用于防止模型过拟合技术。核心思想是通过在模型损失函数中添加一个惩罚项（PenaltyTerm），对模型的复杂度进行约束，从而提升模型在新数据上的泛化能力。一、正则化目的防止过拟合：当模型过于复杂（例如神经网络层数过多、参数过多）时，容易在训练数据上“记忆”噪声或细节，导致在测试数据上表现差。简化模型：正则化通过限制模型参数的大小或数量，迫
《基于图神经网络的安卓应用检测系统设计与实现》开题报告大数据蟒行探索者毕业论文/研究报告神经网络 android 人工智能机器学习大数据深度学习 python
个人主页：@大数据蟒行探索者目录一、课题的研究目的和意义1.研究目的2.研究意义二、国内(外)研究现状及分析1.国内研究现状2.国外研究现状3.研究分析三、课题主要研究内容及可行性分析1.研究内容2.可行性分析四、研究方案和技术途径1.研究方案2.技术途径五、外部条件及解决办法1.开发环境2.解决办法六、主要参考文献一、课题的研究目的和意义1.研究目的随着智能手机的普及，安卓操作系统成为全球最为广
【大模型科普】AIGC技术发展与应用实践（一文读懂AIGC）人工智能
【专栏介绍】⌈⌈⌈人工智能与大模型应用⌋⌋⌋人工智能（AI）通过算法模拟人类智能，利用机器学习、深度学习等技术驱动医疗、金融等领域的智能化。大模型是千亿参数的深度神经网络（如ChatGPT），经海量数据训练后能完成文本生成、图像创作等复杂任务，显著提升效率，但面临算力消耗、数据偏见等挑战。当前正加速与教育、科研融合，未来需平衡技术创新与伦理风险，推动可持续发展。文章目录一、AIGC概述（一）什么是
Halcon 和 opencv比有什么区别与优劣 yuanpan opencv 人工智能计算机视觉
Halcon和OpenCV都是机器视觉领域的重要工具，但它们的设计目标、功能特点和适用场景有所不同。以下是两者的详细对比：1.定位与目标用户Halcon：定位：商业机器视觉软件，专注于工业应用。目标用户：工业自动化、质量控制、机器人引导等领域的专业开发者。OpenCV：定位：开源计算机视觉库，适用于通用图像处理和计算机视觉任务。目标用户：学术研究、教育、初创公司以及需要低成本解决方案的开发者。2.
【产品小白】什么是AI产品经理百事不可口y 产品经理的一步一步人工智能产品经理学习产品运营内容运营用户运营
一、AI产品经理的定义与角色定位AI产品经理是人工智能技术与商业应用之间的核心桥梁，负责将复杂的AI技术转化为满足市场需求的产品。需同时具备技术理解力、商业洞察力和用户思维，既要参与算法选型与数据建模，又要定义产品功能与市场策略，是贯穿产品全生命周期的关键角色。与传统互联网产品经理相比，AI产品经理的独特之处在于：技术深度参与：需理解机器学习、自然语言处理（NLP）、计算机视觉等技术原理，并参与数
NLP高频面试题（三）——普通RNN的梯度消失和梯度爆炸问题 Chaos_Wang_ NLP常见面试题自然语言处理 rnn 人工智能
普通RNN（循环神经网络）的梯度消失和梯度爆炸问题是指在训练深层或长序列的RNN模型时出现的两种典型问题：一、梯度消失（VanishingGradient）梯度消失是指在反向传播过程中，梯度逐层传播时变得越来越小，最终趋于接近0，导致模型前层的参数难以更新。原因：在反向传播时，每一层的梯度是通过链式法则计算得到的。因为链式求导中不断乘以一个较小的数值（小于1），随着层数或时间步的增加，梯度将指数级
使用TensorFlow、OpenCV和Pygame实现图像处理与游戏开发 UwoiGit tensorflow opencv pygame
在本篇文章中，我们将介绍如何结合使用TensorFlow、OpenCV和Pygame来进行图像处理和游戏开发。这三个工具在机器学习、计算机视觉和游戏开发领域都非常流行，并且它们的结合可以提供强大的功能和无限的创造力。我们将逐步介绍如何安装和配置这些工具，并提供相关的源代码示例。安装TensorFlowTensorFlow是一个基于数据流图的开源机器学习框架，提供了丰富的工具和库来构建和训练各种深度
深度革命：ResNet 如何用 “残差连接“ 颠覆深度学习安意诚Matrix 机器学习笔记深度学习人工智能
一文快速了解ResNet创新点在深度学习的历史长河中，2015年或许是最具突破性的一年。这一年，微软亚洲研究院的何恺明团队带着名为ResNet（残差网络）的模型横空出世，在ImageNet图像分类竞赛中以3.57%的错误率夺冠，将人类视觉的识别误差（约5.1%）远远甩在身后。更令人震撼的是，ResNet将神经网络的深度推至152层，彻底打破了"深层网络无法训练"的魔咒。这场革命的核心，正是一个简单
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
基于PyTorch和ResNet18的花卉识别实战（附完整代码）意.远 pytorch 人工智能 python 深度学习
一、项目背景与效果花卉分类是计算机视觉的经典任务。本文使用PyTorch框架，基于ResNet18模型实现了102种花卉的分类任务。完整代码可直接复制运行，最终验证集准确率达8.2%，文中同步分析性能瓶颈与优化方案。二、环境配置与数据准备1.环境要求#主要依赖库importtorchfromtorchimportnn,optimfromtorchvisionimporttransforms,dat
强大的销售团队背后竟然是大数据分析的身影蓝儿唯美数据分析
Mark Roberge是HubSpot的首席财务官，在招聘销售职位时使用了大量数据分析。但是科技并没有挤走直觉。大家都知道数理学家实际上已经渗透到了各行各业。这些热衷数据的人们通过处理数据理解商业流程的各个方面，以重组弱点，增强优势。 Mark Roberge是美国HubSpot公司的首席财务官，HubSpot公司在构架集客营销现象方面出过一份力——因此他也是一位数理学家。他使用数据分析
Haproxy+Keepalived高可用双机单活 bylijinnan 负载均衡 keepalived haproxy 高可用
我们的应用MyApp不支持集群，但要求双机单活（两台机器：master和slave）： 1.正常情况下，只有master启动MyApp并提供服务 2.当master发生故障时，slave自动启动本机的MyApp，同时虚拟IP漂移至slave，保持对外提供服务的IP和端口不变 F5据说也能满足上面的需求，但F5的通常用法都是双机双活，单活的话还没研究过服务器资源 10.7
eclipse编辑器中文乱码问题解决 0624chenhong eclipse乱码
使用Eclipse编辑文件经常出现中文乱码或者文件中有中文不能保存的问题，Eclipse提供了灵活的设置文件编码格式的选项，我们可以通过设置编码格式解决乱码问题。在Eclipse可以从几个层面设置编码格式：Workspace、Project、Content Type、File 本文以Eclipse 3.3（英文）为例加以说明： 1. 设置Workspace的编码格式： Windows-&g
基础篇--resources资源不懂事的小屁孩 android
最近一直在做java开发，偶尔敲点android代码，突然发现有些基础给忘记了，今天用半天时间温顾一下resources的资源。 String.xml 字符串资源涉及国际化问题 http://www.2cto.com/kf/201302/190394.html string-array
接上篇补上window平台自动上传证书文件的批处理问卷酷的飞上天空 window
@echo off : host=服务器证书域名或ip，需要和部署时服务器的域名或ip一致 ou=公司名称, o=公司名称 set host=localhost set ou=localhost set o=localhost set password=123456 set validity=3650 set salias=s
企业物联网大潮涌动：如何做好准备？蓝儿唯美企业
物联网的可能性也许是无限的。要找出架构师可以做好准备的领域然后利用日益连接的世界。尽管物联网（IoT）还很新，企业架构师现在也应该为一个连接更加紧密的未来做好计划，而不是跟上闸门被打开后的集成挑战。“问题不在于物联网正在进入哪些领域，而是哪些地方物联网没有在企业推进，” Gartner研究总监Mike Walker说。 Gartner预测到2020年物联网设备安装量将达260亿，这些设备在全
spring学习——数据库（mybatis持久化框架配置） a-john mybatis
Spring提供了一组数据访问框架，集成了多种数据访问技术。无论是JDBC，iBATIS(mybatis)还是Hibernate，Spring都能够帮助消除持久化代码中单调枯燥的数据访问逻辑。可以依赖Spring来处理底层的数据访问。 mybatis是一种Spring持久化框架，要使用mybatis，就要做好相应的配置： 1，配置数据源。有很多数据源可以选择，如：DBCP，JDBC，aliba
Java静态代理、动态代理实例 aijuans Java静态代理
采用Java代理模式，代理类通过调用委托类对象的方法，来提供特定的服务。委托类需要实现一个业务接口，代理类返回委托类的实例接口对象。按照代理类的创建时期，可以分为：静态代理和动态代理。所谓静态代理：　指程序员创建好代理类，编译时直接生成代理类的字节码文件。所谓动态代理：　在程序运行时，通过反射机制动态生成代理类。一、静态代理类实例： 1、Serivce.ja
Struts1与Struts2的12点区别 asia007 Struts1与Struts2
1) 在Action实现类方面的对比：Struts 1要求Action类继承一个抽象基类；Struts 1的一个具体问题是使用抽象类编程而不是接口。Struts 2 Action类可以实现一个Action接口，也可以实现其他接口，使可选和定制的服务成为可能。Struts 2提供一个ActionSupport基类去实现常用的接口。即使Action接口不是必须实现的，只有一个包含execute方法的P
初学者要多看看帮助文档不要用js来写Jquery的代码百合不是茶 jquery js
解析json数据的时候需要将解析的数据写到文本框中, 出现了用js来写Jquery代码的问题; 1, JQuery的赋值有问题代码如下: data.username 表示的是: 网易 $("#use
经理怎么和员工搞好关系和信任 bijian1013 团队项目管理管理
产品经理应该有坚实的专业基础，这里的基础包括产品方向和产品策略的把握，包括设计，也包括对技术的理解和见识，对运营和市场的敏感，以及良好的沟通和协作能力。换言之，既然是产品经理，整个产品的方方面面都应该能摸得出门道。这也不懂那也不懂，如何让人信服？如何让自己懂？就是不断学习，不仅仅从书本中，更从平时和各种角色的沟通
如何为rich:tree不同类型节点设置右键菜单 sunjing contextMenu tree Richfaces
组合使用target和targetSelector就可以啦，如下： <rich:tree id="ruleTree" value="#{treeAction.ruleTree}" var="node" nodeType="#{node.type}" selectionChangeListener=&qu
【Redis二】Redis2.8.17搭建主从复制环境 bit1129 redis
开始使用Redis2.8.17 Redis第一篇在Redis2.4.5上搭建主从复制环境，对它的主从复制的工作机制，真正的惊呆了。不知道Redis2.8.17的主从复制机制是怎样的，Redis到了2.4.5这个版本，主从复制还做成那样，Impossible is nothing! 本篇把主从复制环境再搭一遍看看效果，这次在Unbuntu上用官方支持的版本。 Ubuntu上安装Red
JSONObject转换JSON--将Date转换为指定格式白糖_ JSONObject
项目中，经常会用JSONObject插件将JavaBean或List<JavaBean>转换为JSON格式的字符串，而JavaBean的属性有时候会有java.util.Date这个类型的时间对象，这时JSONObject默认会将Date属性转换成这样的格式： {"nanos":0,"time":-27076233600000,
JavaScript语言精粹读书笔记 braveCS JavaScript
【经典用法】： //①定义新方法 Function .prototype.method=function(name, func){ this.prototype[name]=func; return this; } //②给Object增加一个create方法，这个方法创建一个使用原对
编程之美-找符合条件的整数用字符串来表示大整数避免溢出 bylijinnan 编程之美
import java.util.LinkedList; public class FindInteger { /** * 编程之美找符合条件的整数用字符串来表示大整数避免溢出 * 题目：任意给定一个正整数N，求一个最小的正整数M(M>1)，使得N*M的十进制表示形式里只含有1和0 * * 假设当前正在搜索由0，1组成的K位十进制数
读书笔记 chengxuyuancsdn 读书笔记
1、Struts访问资源 2、把静态参数传递给一个动作 3、<result>type属性 4、s:iterator、s:if c:forEach 5、StringBuilder和StringBuffer 6、spring配置拦截器 1、访问资源 (1)通过ServletActionContext对象和实现ServletContextAware,ServletReque
[通讯与电力]光网城市建设的一些问题 comsci 问题
信号防护的问题,前面已经说过了,这里要说光网交换机与市电保障的关系我们过去用的ADSL线路,因为是电话线,在小区和街道电力中断的情况下,只要在家里用笔记本电脑+蓄电池,连接ADSL,同样可以上网........
oracle 空间RESUMABLE daizj oracle 空间不足 RESUMABLE 错误挂起
空间RESUMABLE操作转 Oracle从9i开始引入这个功能，当出现空间不足等相关的错误时，Oracle可以不是马上返回错误信息，并回滚当前的操作，而是将操作挂起，直到挂起时间超过RESUMABLE TIMEOUT，或者空间不足的错误被解决。这一篇简单介绍空间RESUMABLE的例子。第一次碰到这个特性是在一次安装9i数据库的过程中，在利用D
重构第一次写的线程池 dieslrae 线程池 python
最近没有什么学习欲望,修改之前的线程池的计划一直搁置,这几天比较闲,还是做了一次重构,由之前的2个类拆分为现在的4个类. 1、首先是工作线程类:TaskThread,此类为一个工作线程,用于完成一个工作任务,提供等待(wait),继续(proceed),绑定任务(bindTask)等方法 #!/usr/bin/env python # -*- coding:utf8 -*-
C语言学习六指针 dcj3sjt126com c
初识指针，简单示例程序： /* 指针就是地址，地址就是指针地址就是内存单元的编号指针变量是存放地址的变量指针和指针变量是两个不同的概念但是要注意：通常我们叙述时会把指针变量简称为指针，实际它们含义并不一样 */ # include <stdio.h> int main(void) { int * p; // p是变量的名字， int *
yii2 beforeSave afterSave beforeDelete dcj3sjt126com delete
public function afterSave($insert, $changedAttributes) { parent::afterSave($insert, $changedAttributes); if($insert) { //这里是新增数据 } else { //这里是更新数据 } }
timertask shuizhaosi888 timertask
java.util.Timer timer = new java.util.Timer(true); // true 说明这个timer以daemon方式运行（优先级低， // 程序结束timer也自动结束），注意，javax.swing // 包中也有一个Timer类，如果import中用到swing包， // 要注意名字的冲突。 TimerTask task = new
Spring Security（13）——session管理 234390216 session Spring Security 攻击保护超时
session管理目录 1.1 检测session超时 1.2 concurrency-control 1.3 session 固定攻击保护
公司项目NODEJS实践0.3[ mongo / session ...] 逐行分析JS源代码 mongodb session nodejs
http://www.upopen.cn 一、前言书接上回，我们搭建了WEB服务端路由、模板等功能，完成了register 通过ajax与后端的通信，今天主要完成数据与mongodb的存取，实现注册 / 登录 /
pojo.vo.po.domain区别 LiaoJuncai java VO POJO javabean domain
　　POJO = "Plain Old Java Object"，是MartinFowler等发明的一个术语，用来表示普通的Java对象，不是JavaBean, EntityBean 或者 SessionBean。POJO不但当任何特殊的角色，也不实现任何特殊的Java框架的接口如，EJB， JDBC等等。　　　　即POJO是一个简单的普通的Java对象，它包含业务逻辑
Windows Error Code OhMyCC windows
0 操作成功完成. 1 功能错误. 2 系统找不到指定的文件. 3 系统找不到指定的路径. 4 系统无法打开文件. 5 拒绝访问. 6 句柄无效. 7 存储控制块被损坏. 8 存储空间不足, 无法处理此命令. 9 存储控制块地址无效. 10 环境错误. 11 试图加载格式错误的程序. 12 访问码无效. 13 数据无效. 14 存储器不足, 无法完成此操作. 15 系
在storm集群环境下发布Topology roadrunners 集群 storm topology spout bolt
storm的topology设计和开发就略过了。本章主要来说说如何在storm的集群环境中，通过storm的管理命令来发布和管理集群中的topology。 1、打包打包插件是使用maven提供的maven-shade-plugin，详细见maven-shade-plugin。 <plugin> <groupId>org.apache.maven.
为什么不允许代码里出现“魔数” tomcat_oracle java
　　在一个新项目中，我最先做的事情之一，就是建立使用诸如Checkstyle和Findbugs之类工具的准则。目的是制定一些代码规范，以及避免通过静态代码分析就能够检测到的bug。　　迟早会有人给出案例说这样太离谱了。其中的一个案例是Checkstyle的魔数检查。它会对任何没有定义常量就使用的数字字面量给出警告，除了-1、0、1和2。　　很多开发者在这个检查方面都有问题，这可以从结果
zoj 3511 Cake Robbery(线段树) 阿尔萨斯线段树
题目链接：zoj 3511 Cake Robbery 题目大意：就是有一个N边形的蛋糕，切M刀，从中挑选一块边数最多的，保证没有两条边重叠。解题思路：有多少个顶点即为有多少条边，所以直接按照切刀切掉点的个数排序，然后用线段树维护剩下的还有哪些点。 #include <cstdio> #include <cstring> #include <vector&