Min220

【论文系列】光流/ LK光流/ FlowNet/ FlowNet2

今天重点介绍光流

首先介绍光流的idea inspiration，传统光流的估计方法，再介绍用CNN解决光流的思路--FlowNet以及FlowNet2（个人认为只是利用stack方式堆叠FlowNetS和FlowNetC，其中更出彩的可能在数据集与更适应的数据训练方法，当然，精度和速度的效果也更为出色，解决了小displacement的估计）。Let's START!

光流

第一次读光流的文章是很久以前，当时有个印象很深的例子，就是当你坐火车的时候往窗外开，原本固定的刚体的物体，由于相对参考系的运动，仿佛变成了一条条川流的线，如同光在流动。而且，不同距离的物体，例如近处的相邻铁轨，远处的天和云，不远处的房屋，其运动的速度不是完全一样的，也就是说，我们可以通过不同的视觉感觉速度，而判断这个物体的远近。

光流（optical flow）最早在1940s由Gibson的The Perception of the Visual World.提出的，其定义是，由物体/相机的运动引起的在连续帧之间的视在运动模式。它是一个矢量2D场，每个矢量是一个位移矢量，代表点从第一帧到第二帧的运动。

光流需要满足的条件假设：

物体的像素强度在连续帧之间不会改变
相邻像素间有相似的运动

---------------------------------------------------

推导：

考虑在第一帧的像素点, $\left ( dx,dy \right )$ 为在下一帧中的运动的位移，所以该点经过运动后在第二帧为 $I \left ( x+dx,y+dy,t+dt \right )$ 。考虑到假设条件一，“物体的像素强度在连续帧之间不会改变”，有：

$I\left ( x ,y ,t \right )= I\left ( x+dx,y+dy,t+dt \right )$

将， $I\left ( x+dx,y+dy,t+dt \right )$ 泰勒展开：

$I\left ( x+dx,y+dy,t+dt \right ) = I\left ( x ,y ,t \right ) +\frac{\partial I}{\partial x}*dx+\frac{\partial I}{\partial y}*dy+\frac{\partial I}{\partial t}*dt+H.O.T.$

故有：

$\frac{\partial I}{\partial x}*dx+\frac{\partial I}{\partial y}*dy+\frac{\partial I}{\partial t}*dt = 0 \ \overset{\div dt} {\rightarrow}\ \ \frac{\partial I}{\partial x}*\frac{ dx}{ dt}+\frac{\partial I}{\partial y}*\frac{dy}{ dt}+\frac{\partial I}{\partial t} = 0$

其中 $\frac{ dx}{ dt},\ \frac{dy}{ dt}$ ，各代表其在x y方向的运动速度，可以看成 u，v。 $u= \frac{ dx}{ dt},\ v= \frac{dy}{ dt}$

这样我们就得到了光流方程

$f_{x}u+f_{y}v+f_{t}=0\ \ \ \leftarrow (f_{x}=\frac{\partial I}{\partial x}\, \ f_{y}=\frac{\partial I}{\partial y}\ \ f_{t}=\frac{\partial I}{\partial t})$

在这个光流方程中 $f_{x},\, f_{y}$ 代表的是图像在(x ,y,t )这一点的梯度， $f_{t}$ 是两帧图像块之间差值，均为已知。我们需要求解的u，v，那么如何求解呢？这里引入L-K光流法和L-K金字塔光流法。

L-K光流法

-------------------------------------------

稀疏光流法： L-K光流

利用L-K法解决光流，充分利用了光流的第二个假设条件，即，相邻像素间有相似的运动。需要注意的是，L-K光流法解决的是小位移情况，所以后文将会介绍L-K金字塔光流法来搞定大位移的光流问题。

由光流方程我们可知，现需求解两个未知数u&v。

L-K方法是找一个3*3的patch，利用相邻像素间有相似的运动，所以假定这九个点都有相同的位移。这样我们就可以得到方程组：

$\left\{\begin{matrix}f_{x1}u+f_{y1}v+f_{t1}=0 \\ f_{x2}u+f_{y2}v+f_{t2}=0 \\.... \\f_{x9}u+f_{y9}v+f_{t9}=0 \end{matrix}\right. \ \ \rightarrow \begin{bmatrix} f_{x1}&f_{y1} \\ f_{x2}&f_{y2} \\ ... \\ f_{x9}& f_{y9} \end{bmatrix} \cdot \begin{bmatrix} u\\ v \end{bmatrix} =- \begin{bmatrix} f_{t1}\\ f_{t2} \\ ... \\ f_{t9} \end{bmatrix}$
九个方程解两个未知数，超定，可以用最小二乘法来得出近似解。 $A\cdot \overrightarrow{x} =\overrightarrow{b}$

$\overrightarrow{x}= (A^{T}A)^{-1}A^{T}(-\overrightarrow{b}) \rightarrow \begin{bmatrix} u\\v \end{bmatrix} = \begin{bmatrix} \sum f_{xi}^{2} &\sum f_{xi}f_{yi} \\ \sum f_{xi}f_{yi}& \sum f_{yi}^{2} \end{bmatrix}^{-1} \begin{bmatrix} -\sum f_{xi} f_{ti} \\ -\sum f_{yi} f_{ti} \end{bmatrix}$

由此，我们解得x，但是观察

$\left ( A^{T} A\right )= \begin{bmatrix} \sum f_{xi}^{2} &\sum f_{xi}f_{yi} \\ \sum f_{xi}f_{yi}& \sum f_{yi}^{2} \end{bmatrix}$ ，并不一定总是可逆的！(充要条件 $\pmb{ \left | G \right | \neq 0\Leftrightarrow G \ is \ invertible }$ ）

在图像中沿着两个方向都有像素变化的区域（角点，这个式子也很像harris corner的响应式），一般对应的 $\left ( A^{t} A\right )$ 是可逆的，但是对于在灰度变化很小的区域，一般 $\left ( A^{t} A\right )$ 是不可逆的。这限制了LK光流法的适用范围，所以我们称之为稀疏光流法（并不是所有光流都能被计算出来）

在光流跟踪中，由于可逆的充要条件 $\pmb{ \left | G \right | \neq 0\Leftrightarrow G \ is \ invertible }$ ，也就是要求，矩阵G的最小特征值要足够大，满足这个要求的像素点才易于光流跟踪。）

-------------------------------------------

稠密光流法：迭代求解L-K光流

这里对上面的证明，再重新梳理一遍，并用迭代的方式求解光流d；连续帧 $I_{1},I_{2}$ ，对于 $I_{1}$ 中的像素点 $a = [x_{a},y_{a}]^{T}$ ,需要在 $I_{2}$ 中找到其对应的像素点 $b, \ b = a + d = [x_{a}+dx,y_{a}+dy]^{T}$ ,使得其灰度值差别最小（光流假设条件一：物体的像素强度在连续帧之间不会改变）。我们把图像在 $a = [x_{a},y_{a}]^{T}$ 处的运动位移 $d = [dx, dy]^{T}$ 称之为在a处的光流。又由条件二知道，相邻像素间光流相同，引入大小为 $w_{x},w_{y}$ 的相同光流邻域。

则求解转换为使下述目标函数的最小值优化为题：

$\varepsilon \left ( d \right ) = \varepsilon(d_{x},d_{y}) = \sum_{x=x_{a}-w_{x}}^{x_{a}+w_{x}} \sum_{y=y_{a}-w_{y}}^{y_{a}+w_{y}}\left ( I_{1}(x,y) - I_{2}(x+dx,y+dy) \right )^{2}$

一般来说，如果 $\epsilon \left ( d \right )$ 是一个数学形式很简单的函数，可以用解析形式来求——令目标函数的导数为0：

将 $I_{2}(x+dx,y+dy)$ 一阶泰勒展开，得到：

$\frac{\partial \epsilon \left ( d \right )}{\partial d} \approx -2 \sum_{x=x_{a}-w_{x}}^{x_{a}+w_{x}} \sum_{y=y_{a}-w_{y}}^{y_{a}+w_{y}}\left ( I_{1}(x,y) - I_{2}(x,y) -\begin{bmatrix} \frac{\partial I_{2}}{\partial x}&\frac{\partial I_{2}}{\partial y} \end{bmatrix}\begin{bmatrix} dx\\dy \end{bmatrix} \right )*\begin{bmatrix} \frac{\partial I_{2}}{\partial x}&\frac{\partial I_{2}}{\partial y} \end{bmatrix}$

由于 $d = [dx, dy]^{T}$ 足够小，有 $\begin{bmatrix} \frac{\partial I_{2}}{\partial x}&\frac{\partial I_{2}}{\partial y} \end{bmatrix} =\begin{bmatrix} \frac{\partial I_{1}}{\partial x}&\frac{\partial I_{1}}{\partial y} \end{bmatrix}$ ，且令 $\delta I=I_{1}(x,y)-I_{2}(x,y)$ ， $\bigtriangledown I =\begin{bmatrix} \frac{\partial I_{1}}{\partial x}&\frac{\partial I_{1}}{\partial y} \end{bmatrix}^{T}$ ，则有：

又 $\left( \bigtriangledown I^{T} d-\delta I \right )$ 为标量，有

$\begin{bmatrix} \frac{1}{2} \frac{\partial \varepsilon \left ( d \right ) }{\partial d} \end{bmatrix}^{T} \approx \sum_{x=x_{a}-w_{x}}^{x_{a}+w_{x}} \sum_{y=y_{a}-w_{y}}^{y_{a}+w_{y}} \left ( \bigtriangledown I^{T} d-\delta I \right )\bigtriangledown I \\ = \sum_{x=x_{a}-w_{x}}^{x_{a}+w_{x}} \sum_{y=y_{a}-w_{y}}^{y_{a}+w_{y}} \begin{bmatrix} f_{x}^{2} &f_{x}f_{y} \\ f_{x}f_{y} & f_{y}^{2} \end{bmatrix} d - \sum_{x=x_{a}-w_{x}}^{x_{a}+w_{x}} \sum_{y=y_{a}-w_{y}}^{y_{a}+w_{y}}\begin{bmatrix} \delta I \cdot f_{x}\\ \delta I\cdot f_{y} \end{bmatrix}$

再令

$G= \sum_{x=x_{a}-w_{x}}^{x_{a}+w_{x}} \sum_{y=y_{a}-w_{y}}^{y_{a}+w_{y}} \begin{bmatrix} f_{x}^{2} &f_{x}f_{y} \\ f_{x}f_{y} & f_{y}^{2} \end{bmatrix} ,\ \ b = \sum_{x=x_{a}-w_{x}}^{x_{a}+w_{x}} \sum_{y=y_{a}-w_{y}}^{y_{a}+w_{y}}\begin{bmatrix} \delta I \cdot f_{x}\\ \delta I\cdot f_{y} \end{bmatrix}$

因为我们最终是求得在使得导数=0下d的值， $d = G^{-1}b$ 。现在以迭代方式求解：

代表迭代次数（ $K \geq 1$ ），对于第k次迭代， $K\geq k\geq 2$ ，第k-1次迭代已经提供了初始值 $d^{k-1} = \begin{bmatrix} dx^{k-1} & dy^{k-1} \end{bmatrix}^{T}$ 并把该值作为图像 $I_{k}$ 处的运动位移初始值，移动后的点落在图像 $I_{k+1}$ ，则有 $I_{k+1} (x,y)= I_{k}(x+dx^{k-1},y+dy^{k-1})$ ，之后重复之前推导的内容： $\eta^{k}=\begin{bmatrix} \eta_{x}^{k}& \eta_{x}^{k} \end{bmatrix} ^{T}$ ，使得下面的目标函数最小：

$\varepsilon^{k} \left ( \eta ^{k} \right ) = \varepsilon^{k} (\eta_{x}^{k}, \eta_{x}^{k}) = \sum_{x=x_{a}-w_{x}}^{x_{a}+w_{x}} \sum_{y=y_{a}-w_{y}}^{y_{a}+w_{y}}\left ( I_{1}(x,y) - I_{k}(x+\eta_{x}^{k},y+\eta_{y}^{k}) \right )^{2}$

最终可以得到 $\eta_{x}^{k}=G^{-1}b_{k}$ (*这里的G在迭代计算中始终保持不变， $G= \sum_{x=x_{a}-w_{x}}^{x_{a}+w_{x}} \sum_{y=y_{a}-w_{y}}^{y_{a}+w_{y}} \begin{bmatrix} f_{x}^{2} &f_{x}f_{y} \\ f_{x}f_{y} & f_{y}^{2} \end{bmatrix}$ )而 $b_{k}$ 每次需要重新计算。

第k次迭代的结果 $d_{k}=d_{k-1}+\eta_{k}$ 。当迭代次数达到设定次数，或者计算得到的 $\eta^{k}$ 达到阈值，迭代计算结束。

金字塔光流法

我们知道L-K光流法中的几个假设都是强假设，当连续帧物体的运动位移较大（运动速度较快时）算法误差较大，如何解决？缩小图像尺寸，我们就可以使得运动像素变小。金字塔分层解决光流方法应用而生。简答来说，上层金字塔（低分辨率）图像中的一个像素可以代表下层的两个像素。利用金字塔的结构，可以自上而下修正光流运动位移。

步骤：

1.金字塔建立。首先，对两帧建立高斯金字塔，最低分辨率图在最顶层，原始图片在底层： $\left \{ I^{L} \right \}_{L=0,...,L_{m}}, \left \{ J^{L} \right \}_{L=0,...,L_{m}}$ 。为了保证每层分解得到的图像尺寸都是整数，所以需要在正式处理之前，通过resize对原图像（包括前后两帧图像）的尺寸进行调整。

图像的金字塔化包括两个步骤：

①利用低通滤波器（lowpass filter）平滑图像。

防止图像降采样后发生锯齿现象。一般使用高斯滤波器，所以也称高斯金字塔

②对平滑图像进行抽样，从而得到一系列尺寸缩小的图像

可以对原始图像调整宽高以满足整除 $2^{L}$ ，也可以用公式确定新图像的宽高： $n_{x}^{L}\leq \frac{n_{x}^{L-1}+1}{2}, n_{y}^{L}\leq \frac{n_{y}^{L-1}+1}{2}$ 。 $n_{x}^{L} ,n_{y}^{L}$ 代表第L层图像的宽和高。

2.计算每层图像的光流，先计算顶层光流，从顶层（Lm层）开始，对于每一层L，通过最小化每个点的领域范围内的匹配误差和，得到顶层图像中每个点的光流。（g为上一层传递的初始值，d为光流位移与初始值的残差，即g+d=光流）

最小化该式→： ${\color{Red} \varepsilon^{L} \left ( d^{L} \right ) = \varepsilon^{L}(d_{x}^{L},d_{y}^{L}) = \sum_{x=x_{a}^{L}-w_{x}}^{x_{a}^{L}+w_{x}} \sum_{y=y_{a}^{L}-w_{y}}^{y_{a}^{L}+w_{y}}\left ( I^{L}(x,y) - J^{L}(x+g_{x}^{L}+dx^{L},y+g_{y}^{L}+dy^{L}) \right )^{2}}$

具体步骤如下：

①计算对于当前图像 $I^{L}$ 中像素点u对应的位置： $u^{L}=\begin{bmatrix} u^{L}_{x} & u^{L}_{y} \end{bmatrix}=\frac{u}{2^{L}}$ (图像缩放1/2)。

②计算图像 $I^{L}$ 在x方向的梯度： $f_{x}^{L}(x,y) = \frac{I^{L}(x+1,y)-I^{L}(x-1,y)}{2}\ ,u_{x}^{L}=x\ \&\ u_{y}^{L}=y$

③计算图像 $I^{L}$ 在y方向的梯度： $f_{y}^{L}(x,y) = \frac{I ^{L}(x ,y+1)-I^{L}(x,y-1)}{2}\ ,u_{x}^{L}=x\ \&\ u_{y}^{L}=y$

④计算空间矩阵G：

$G= \sum_{x=u_{x}^{L}-w_{x}}^{x=u_{x}^{L}+w_{x}} \sum_{y= u_{y}^{L}-w_{y}}^{ y=u_{y}^{L}+w_{y}} \begin{bmatrix} f_{x}^{L^{2}} &f_{x}^{L}f_{y}^{L} \\ f_{x}^{L}f_{y}^{L} & f_{y}^{L^{2}} \end{bmatrix}$

⑤迭代获取LK初始值g，最顶层的光流估计值设为0， $g^{L_{m}} = \begin{bmatrix} 0& 0 \end{bmatrix}^{T}$ ，其余层的光流估计值为： $g^{L-1} = 2 (g^{L}+d^{L})$

⑥计算图像差异：

$b = \sum_{x=u_{x}^{L}-w_{x}}^{x=u_{x}^{L}+w_{x}} \sum_{y= u_{y}^{L}-w_{y}}^{ y=u_{y}^{L}+w_{y}} \begin{bmatrix} \delta I^{k} \cdot f_{x}\\ \delta I^{k} \cdot f_{y} \end{bmatrix}, \\ where\ \delta I^{k} = I^{L}(x,y)- J^{L}(x+g_{x}^{L}+dx^{k-1},y+g_{y}^{L}+dy^{k-1})$

⑦计算残差向量 $\eta_{x}^{k}=G^{-1}b_{k}$ 。

⑧计算光流： $d^{k} = g^{k}+\eta ^{k}$ ，第L层的光流优化值 $d^{L}= d^{k}$

⑨提供下一层的光流计算的初始值，

$g^{L-1} = 2 (g^{L}+d^{L})$ 。

（假设图像的尺寸每次缩放为原来的1/2。共缩放了Lm层，第0层为原图。设已知原图的位移为d，则每层的位移为: $d^{L}=\frac{d}{2^{L}}$ ）

反馈直到底层(准确值=估计值+残差)

$d = g^{0}+d^{0}$

其实可以看出，最终的光流值，就是所哟偶层的分段光流d的叠加：

$d=\sum_{L=0}^{L_{m}} 2^{L}d^{L}, d^{L}\ is \ the \ optical \ flow \ of \ the \ L\ Level$

最终得到图像J中的点坐标。

光流金字塔实际操作中一些需要注意的点：

$(x+g_{x}^{L}+dx^{L},y+g_{y}^{L}+dy^{L}) \right )$ 往往不是整数坐标，需要双线性插值。
滤波、求梯度时，需要注意图像边界处的像素点的关于像素越界的处理
v的坐标在J图像外被判定为错误点，但当v在J内时，匹配也不一定正确，需要滤除该方法计算得到的误匹配，常用解决方案是基于RANSAC计算两帧图像的变换矩阵。

至此，三个点推下来，相信你已经对光流有了比较深刻的理解了，接下来，我们将看如何利用CNN解决光流问题。

FlowNet

------------------------------------

文章下载地址：http://lmb.informatik.uni-freiburg.de/Publications/2015/DFIB15/
实现代码地址：http://lmb.informatik.uni-freiburg.de/resources/binaries/

FlowNet，开创了利用CNN来进行光流估计的先河。光流估计需要的两个条件：“needs precise per-pixel localization”，“requires finding correspondences between two input images”指向了利用CNN解决光流会面临的问题——要学习一个什么样的特征表达和如何匹配两图之间不同位置上的特征。作者提出的大致思路如下图所示：

首先，用两张图片作为输入，利用一个收缩部分（contracting part）压缩可用的信息，然后再利用一个放大部分（expanding part）将图像和光流特征图都恢复到full image resolution级别。并且在收缩部分，作者提出了两种网络结构FlowNetS(imple) 和FlowNetC(orrelation)，其区别在于FlowNetC中加入了一个新层——correlation layers——用来进行patch之间的乘性匹配（每两个patch都要一一匹配，后文细说），这个显式关联层，可以利用多层级多尺度和抽象的能力去学习强的特征来匹配（在FlowNet中没有完全发挥它的作用，是数据集和训练策略的问题，FlowNet2有提到，并且有更好地应用FlowNetC）。

网络结构

作者采用端到端的训练方式，整个网络结构中只用卷积层联系起来（读了上篇pooling博文的同学知道，没有连接层，就不用在意图片的输入大小。）在contracting part使用了池化操作使得计算更简单，网络不容易过拟合并且能够在输入图像大区域地聚集信息。但是Pooling会让网络分辨率降低，所以作者又加入了expanding part来refine收缩结果使得光流map最终可以以一个高像素图呈现。

收缩部分

收缩部分提出两个框架——FlowNetSimple 和 FlowNet Corr

FlowNetS

FlowNetS的思路很简单，我们就套用CNN在学习输入输出关系上很擅长的优点：我把一对图片的通道连接起来，网络结构图中可以看到输入的data层的channel是6输入，让网络自己去学习怎样处理图像对来获得光流移动信息，如上图所示，没有其他的多余操作。

整个收缩部分FlowNetS一共有九个卷积层，其中的六个stride（步长）为2。每一层后还有一个非线性的ReLU操作。卷积操作的filter大小随着网络的深入而递减。

FlowNetC

第二种方法是，将两张图片分开，两张图片经过同样的处理进行特征提取（我个人把卷积当做一个特征提取的过程），得到各自的feature map，再通过correlation layer使得这两张特征图在更高的特征级别（卷积后）上联系（匹配），再继续进行特征提取。整个过程就像图像匹配——提取特征+匹配特征，这里作者的匹配特征应用的方式是the correlation layers。

The correlation layers

既然要匹配“特征”了，那就是找最像的过程（别忘了光流的假设条件一：物体的像素强度在连续帧之间不会改变，所以找到最像像素的点对，motion就有了）。FlowNet作者的想法是，那我就把所有patch的对比结果都拿来做个map吧，继续在这个map上学习，我就能学到光流的。于是作者就先提出一个correlation（patchs相关性定义）：

描述一下这个公式，x1，x2是两张图的两个patch的中心坐标，二维， $x_{1}=\begin{bmatrix} a_{1} &b_{1} \end{bmatrix}, x_{2}=\begin{bmatrix} a_{2} &b_{2} \end{bmatrix}$ 。 $f_{1}, f_{2}$ 各自代表图像卷积后的feature map。每个patch的大小为K=2k+1，所以整个公式类似卷积核在图片上的卷积：以x1为中心的patch和以x2为中心的patch，对应位置相乘然后相加，但它的weight不可训练。

到这里，大家就会觉得如果两两patch都要算，会不会太麻烦？两块之间c*K*K的复杂度，考虑到光流本身是有一定的范围的，所以作者用两个小tips来解决计算的问题：

我假定光流是有最大displacement的，设定一个最大displacement范围d，超出x1中心d范围的patch，我不再做correlation比较。
加一个步长，s1和s2分别针对x1和x2，不用D范围（D=2d+1）都去进行计算。

于是乎，计算量得到减小，从correlation layers出来的结果维度为 $c(x_{1},x_{2}) = c(a_{1},b_{1},a_{2},b_{2}) = w*h*D^{2}$ 。

$for \ each \ point\ x1\ in \ f_{1}\ c(x_{1},*) = 1*1*D^{2}, the \ size \ of \ f_{1}=w*h \\so \c(x_{1},x_{2}) = c(a_{1},b_{1},a_{2},b_{2}) = w*h*D^{2}$

放大部分

放大部分主要由“upconvolutional layers”组成，主要进行unpooling和convolution操作。整个refinement过程如上图所示：作者在feature map上做反卷积（绿色箭头），同时将由收缩部分得到的feature map（灰色箭头）以及上采样得到的光流粗预测结果（红色箭头）连接起来(如果有的话)进行新的光流预测。每一步提升两倍的分辨率，重复四次，预测出来的光流的分辨率是输入图片的分辨率的1/4。如果想要继续提升分辨率，双线性插值没有什么明显地提升，可以用variational refinement。

至此，网络结构大概就已经被梳理好了，具体的其他细节，可以对照原文查看。

--------------------------------------------------------

数据集制作

这是本文的第二个贡献，作者通过拼接前景和背景制造的仿真数据集Flying Chairs使得网络能够有充分数据进行训练。具体做法、考量内容，本文不关注。此外，作者也比较了其他几个光流数据集的光流类型，数据集特点，有兴趣可以详读。

评价指标

EPE是一种对光流预测错误率的一种评估方式，代表所有像素点的gound truth和预测出来的光流之间差别距离（欧氏距离）的平均值，越低越好。

数据集表现：

Sintel Clean ： FlowNetC比FlowNetS要好。
Sintel Final：FlowNetS比FlowNetC要好。
Flyingchair：Flownet优于其他方法，FlowNetC比FlowNetS要好：
Kitti：Flownet表现一般，FlowNetS比FlowNetC要好。

FlowNetC比FlowNetS比较

数据集的表现上各有千秋，但是FlowNetC有过拟合的问题所以才导致有些数据集上的表现不够好。（可以继续看在FlowNet2上如何进行训练的改进。）相比FlowNetS，FlowNetC应该可以在真实数据集上有更好的表现，所以坚信C网络在保存信息上的优势，加以更丰富的数据和合理的训练方法，可以得到更好的结果。

因为我们在计算correlation的时候，为了减少计算的复杂度，所以我们设立了max displacement d，这使得，有一些超出d范围的光流motion没能被很好地学习以及在数据集中被测试出来，所以FlowNetC在large displacement上的表现比FlowNetS要差，比如在kitti数据集上，动态物体多，displacement大。

本文贡献：

CNN预测光流先河。虽然我们也能大概感觉到，作为第一个利用CNN解决光流的工作，作者的思路可以算是尝试性的（但一定尝试了多种方法），FlowNetS结构如其名的simple..C相比S添加了correlation layers。所以我相信在利用深度学习方面一定有更好的网络结构和切入点来解决光流问题，只是大家暂时被障目所以暂时还没有找到...
FlyingChairs数据集。数据集真的是个好东西，深度学习上数据集多重要就不说了，自己的数据集还能够很好地说明你的实验效果，能够多加引用...当然制作起来也是...比较耗费精力。

FlowNet2

接下来进入FlowNet2的世界。

横空出世的FlowNet，证明了的确可以用CNN完成对光流的估计，然而，对于small displacement问题和在真实数据集上的表现，FlowNet要逊色于传统方法。FlowNet的不足，是有原因的：例如对训练数据的需求，例如没有充分发挥FlowNetC中显式关联层correlation layers的作用，例如训练策略是否存在一些不足？可不可以结合FlowNetS和FlowNetC?这里，FlowNet2更关注训练数据和训练策略，为解决FlowNet的不足给出了答案。

依据摘要，文章的主要贡献有三：

本文提出了新的训练策略和新的训练数据。并且实验证明，这些的确可以影响实验结果。作者首先是发现如果单独使用越复杂的数据，将导致越差的结果。然后作者还发现，多个数据集的训练策略可以显著提高实验结果，使得correlation layer真正派上用场。
作者将FlowNetC和FlowNetS进行堆叠而得到新的网络 instead of promoting a new architecture, 。并且在网络中，对第二帧图像施加warp操作，使得localization更精确。并非通过调节stack的深度和单个成分的大小，得到许多网络变种来控制网络精度和计算资源中的平衡，速度范围在8fps~140fps。
提出一个专治small displacement的子网络和数据集，弥补上一版的不足。基于此数据集的特定网络只是对于真实世界中小运动有着良好的效果。为了对于任意位移都能达到最佳的性能，添加了一个网络来融合前面堆叠网络和小位移网络。

FlowNet2继承了FlowNet的优点：large displacement上表现很好（传统方法的劣势），光流域里的极小细节也能正确估计，还有对于特定场景里学习先验的潜力和运行速度快。同时，还能搞定small displacement和光流噪声问题，加速real-world中的应用发展。上个对比图，更清晰的边界，更平滑的结果。

数据集策略

1.数据集质量要高，这是监督训练成功的关键。

2.不同属性的训练的数据的出场顺序也很重要。

如此一来，FlowNetC比FlowNetS效果要好。最好的训练效果的顺序和数据集是：先在Chairs数据集上训练，然后仔仔Things3D上fine-tuning。

本文的三个学习率训练策略：

不同的学习率训练策略+不同的数据集训练顺序得出的不同结果：

--------------------------------------------------------

Stacking Networks

1.Stacking Two Networks for Flow Refinement堆叠两个网络：

输入两张图片只用FlowNetS网络堆叠，添加warp或不添加warp。

得到如下观察：

1）如果只堆叠网络不warp，堆叠网络易过拟合，在Sintel数据集上结果更差

2）stack和warp同时使用比较好。warp的确可以提高精度

3）Net1层加intermediate loss效果更好

4）固定第一个网络在warp操作之后训练第二个网络可以得到最佳的结果。

堆叠网络大小是原始网络的两倍，易过拟合。解决办法是网络一个接一个的训练。

实验结果如下

2.Stacking Multiply Diverse Networks堆叠不同种网络：FlowNetS+FlowNetC

这一节主要是进行不同种类和大小的网络的堆叠。设第一个网络为bootstrap网络，第二个网络用不同权重的新网络（运行时间上不会增加，但训练资源会增加）。这种情况下，作者认为顶层网络，可以在不同的步骤中表征不同的任务——这样，通过固定现有网络再一个接一个的添加新网络，stack针对某一任务就可以在更小的数据集上训练了。

同时，可以通过对通道数的减少从而对网络进行精简，最佳精简的尺寸是3/8。用大小写来区分网络中到底用了多少通道数。CSS比C要好，通道数更少网络参数少，速度快。

【论文系列】光流/ LK光流/ FlowNet/ FlowNet2_第14张图片

3/8的来历

---------------------------------------------

Small displacement network

作者想要捕获小运动的同时不丢失大运动→但是亚像素级motion上，噪声影响了光流的估计。→这是FlowNet本身的结构固有问题造成的→作者设计了网络图中右下角的FlowNet-SD，用以下改进解决：

修改filter的大小，7*7，5*5都用成3*3，更小，更平滑。
FlowNetS的第一层的stride=2变为1
在上采样前加了卷积层用了平滑噪声
重新做了数据集ChairsSDHom

-----------------------------------------------

最后的一些实验结果

做完这些总结之后，再回头看，并没有觉得FlowNet有多惊艳，但是第一个就是第一个，开天辟地，FlowNet2更像一篇工程性的文章，这里修修，那里改改，堆叠网络，做各种实验，隔了几年之后的FlowNet2，效果的确很好，背后的工作和努力肯定是值得人肯定的，但我还是坚信...光流有更合适的其他深度学习网络结构可以解决....卷积只是在做类似金字塔的工作，但是你有足够的数据量可以学习，金字塔不能保存这个权重信息，切入点暂时也没想法，期待未来读到更惊艳的文章吧！

参考博客：

https://my.oschina.net/u/3702502/blog/1815343
Mega_Li 的博客 https://blog.csdn.net/lwx309025167/article/details/80012199?utm_source=blogxgwz0
FlowNet——爆米花好美啊的博客 https://blog.csdn.net/u013010889/article/details/71189271
FlowNet2——lvhhh 的博客 https://blog.csdn.net/lvhao92/article/details/72899761
FlowNet2——bea_tree 的博客https://blog.csdn.net/bea_tree/article/details/67049373

你可能感兴趣的:(CV/统计,理论&算法,深度学习,论文系列)

十大经典排序算法——冒泡排序 ————————————————— 算法排序排序算法算法
冒泡排序（BubbleSort）是一种简单的排序算法，它通过重复地遍历待排序的列表，比较相邻的元素并交换它们的位置来实现排序。该算法的名称来源于较小的元素会像"气泡"一样逐渐"浮"到列表的顶端。一、算法步骤比较相邻元素：从列表的第一个元素开始，比较相邻的两个元素。交换位置：如果前一个元素比后一个元素大，则交换它们的位置。重复遍历：对列表中的每一对相邻元素重复上述步骤，直到列表的末尾。这样，最大的元
快讯，2021印尼羽毛球大师赛，桃田贤斗再次高歌猛进虫大话体坛
快讯，2021印尼羽毛球大师赛，桃田贤斗再次高歌猛进.。北京时间11月16日，2021印尼羽毛球大师赛（超级750系列）开始首轮比赛的争夺，在刚刚结束的一场男单焦点赛事中，桃田贤斗以2比0战胜小苏吉亚托，再奏凯歌。桃田贤斗自东京奥运会后基本没有休息过，一直在海外征战。丹麦赛和安赛龙的对战成为经典，直到最后一局才分出胜负。桃田贤斗在东京奥运会前曾遭受过车祸和感染新冠，但凭借惊人的毅力，状态逐渐恢复。
VUE解决Error: error:0308010C:digital envelope routines::unsupported的四种解决方案
问题描述：报错：Error:error:0308010C:digitalenveloperoutines::unsupported报错原因：主要是因为nodeJsV17版本发布了OpenSSL3.0对算法和秘钥大小增加了更为严格的限制，nodeJsv17之前版本没影响，但V17和之后版本会出现这个错误。我的node版本是v18+报错详细信息：rror:error:0308010C:digitale
Flink 多流转换（三）CoProcessFunction合流操作案例 Alienware^ #Flink Flink
文章目录下面是CoProcessFunction的一个具体示例：我们可以实现一个实时对账的需求，也就是app的支付操作和第三方的支付操作的一个双流Join。App的支付事件和第三方的支付事件将会互相等待5秒钟，如果等不来对应的支付事件，那么就输出报警信息。程序如下：Gitee源代码如下publicclassBillCheckExample{publicstaticvoidmain(String[]
天文图像处理：星系分类与天体定位 xcLeigh 计算机视觉CV 图像处理分类人工智能 AI 计算机视觉
天文图像处理：星系分类与天体定位一、前言二、天文图像处理基础2.1天文图像的获取2.2天文图像的格式2.3天文图像处理的基本流程三、天文图像预处理3.1去噪处理3.2平场校正3.3偏置校正四、星系分类4.1星系的分类体系4.2基于特征提取的星系分类方法4.3基于深度学习的星系分类方法五、天体定位5.1天体坐标系统5.2基于星图匹配的天体定位方法5.3基于深度学习的天体定位方法六、总结与展望致读者一
深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
PromptX 核心架构深度解析：从革命性理念到工程实践的全景解读步子哥智能涌现架构人工智能
核心理念：AIuseCLIgetpromptforAI-让AI通过命令行获取专业提示词，从通用助手进化为专业专家团队引言：一场关于AI认知的革命当我们深入研究PromptX项目的核心架构文档时，会发现这不仅仅是一个技术框架，而是一套完整的AI认知重构理论。这些文档展现了从哲学思考到工程实践的完整链条，重新定义了人类与AI的协作模式。今天，让我们从这些核心文档开始，深度解析PromptX如何重塑AI
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
AI 人工智能与 Copilot 碰撞出的火花 AI天才研究院 AI大模型企业级应用开发实战人工智能 copilot ai
AI人工智能与Copilot碰撞出的火花关键词：AI人工智能、Copilot、代码辅助、智能编程、人机协作、软件开发、技术创新摘要：本文深入探讨了AI人工智能与Copilot碰撞所产生的一系列效应。首先介绍了相关背景，包括目的、预期读者、文档结构和术语表。接着阐述了核心概念与联系，展示了其原理和架构的示意图及流程图。详细讲解了核心算法原理和具体操作步骤，并通过Python代码进行说明。同时给出了数
HW prefetcher之CDP(Content-Directed Data Prefetching) Chip Design xPU Chip Design CPU GEM5
CDP是Content-DirectedDataPrefetching的缩写，它基于RobertCooksey和StephanJourdan提出的"Stateless,Content-DirectedDataPrefetchingMechanism"论文实现。是一种内容导向的数据预取机制，CDP通过分析内存中的数据内容来识别可能的指针，当识别到指针时，它会预取指针指向的内存地址。CDP使用VPN表
FPGA芯片厂商及关键的开发测试工具 Chip Design xPU Chip Design fpga开发
以下是结合2025年技术动态整理的。一、FPGA芯片主要厂商及产品系列厂商芯片系列典型特点目标市场AMD/XilinxVersal,Kintex,Artix,Zynq高性能异构计算（AI引擎+FPGA+CPU）数据中心、5G、航空航天Intel(Altera)Stratix,Arria,Agilex,Cyclone高带宽内存集成（HBM），支持CXL协议网络加速、边缘计算LatticeCertus
硬件预取的几个问题 1
1.硬件预取的定义和目标是什么？答案：硬件预取是CPU在程序执行前自动预测并加载可能使用的数据到缓存中的技术，目标是减少缓存未命中带来的延迟，提升指令吞吐量。2.硬件预取与软件预取的核心区别？答案：硬件预取由CPU内部逻辑自动触发，透明且通用；软件预取需程序员显式插入指令（如prefetch），可针对特定场景优化，但依赖代码适配。3.预取算法的主要分类？答案：分为规则驱动型（如顺序、步长预取）和机
Zuul的用法——限流 HmilyMing
因为所有的对外提供的接口都是要经过Zuul的转发，所以在这里的Pre过滤器里面做限流是最好的。常用的限流算法有1.计数器法，可以看做是低精度的滑动窗口算法2.滑动窗口，需要更多的存储空间3.漏桶算法，4.令牌桶算法，运行流量在一定程度上的突发，实践简单，对用户更友好，采用得更多。我这里采用的就是令牌桶算法，其原理如下令牌桶算法guava里面有令牌桶算法的实现在浏览器多刷几次就会被限流给禁止访问了代
Java:实现朴素模式匹配算法（附带源码） Katie。 Java算法完整教程算法 java python
1.项目背景详细介绍在文本处理、信息检索和生物序列分析等领域，“字符串模式匹配”是最基础也是最核心的操作之一。朴素模式匹配（NaiveStringMatching）算法，作为最直观的实现方式，通过逐个字符对比，查找模式串在目标文本中出现的位置。虽然现代应用中普遍采用更高效的KMP、Boyer–Moore、Sunday算法等，但理解并掌握朴素算法有助于：打牢基础：从最简单的实现入手，帮助初学者理解匹
网易云音乐会员优惠大揭秘，网友：太值了！氧惠佣金真的高
在数字音乐时代，拥有一款高品质的音乐APP是音乐爱好者的必备之选。作为中国音乐市场的佼佼者，网易云音乐凭借其丰富的曲库、出色的推荐算法以及浓厚的社区氛围，吸引了大量用户。近日，网易云音乐推出了一系列会员优惠活动，让我们一起来了解一下吧！大家好，我是氧惠联合创始人七言导师，给大家推荐一款省钱更加赚钱的app——氧惠。氧惠是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。主
微算法科技基于格密码的量子加密技术，融入LSQb算法的信息隐藏与传输过程中，实现抗量子攻击策略强化 MicroTech2025 量子计算区块链
随着量子计算技术的发展，传统加密算法面临被量子计算机破解的风险，LSQb算法也需考虑应对未来可能的量子攻击。微算法科技基于格密码的量子加密技术，融入LSQb算法的信息隐藏与传输过程中，实现抗量子攻击策略强化。格密码在面对量子攻击时具有较高的安全性，通过这种融合，能为LSQb算法提供更强大的抗攻击能力，确保信息在复杂的量子计算环境下的安全性。格密码是一种基于数学格结构的密码学方法，具有在量子计算环境
微算法科技技术突破：用于前馈神经网络的量子算法技术助力神经网络变革 MicroTech2025 量子计算算法神经网络
随着量子计算和机器学习的迅猛发展，企业界正逐步迈向融合这两大领域的新时代。在这一背景下，微算法科技（NASDAQ:MLGO）成功研发出一套用于前馈神经网络的量子算法，突破了传统神经网络在训练和评估中的性能瓶颈。这一创新性的量子算法以经典的前馈和反向传播算法为基础，借助量子计算的强大算力，极大提升了网络训练和评估效率，并带来了对过拟合的天然抗性。前馈神经网络是深度学习的核心架构，广泛应用于图像分类、
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
图机器学习（13）——图相似性检测
图机器学习（13）——图相似性检测0.前言1.基于图嵌入的方法2.基于图核的方法3.基于GNN的方法4.应用0.前言图机器学习(machinelearning,ML)方法能广泛应用于各类任务，其应用场景涵盖从药物设计到社交网络推荐系统等多个领域。值得注意的是，由于这类方法在设计上具有通用性，同一算法可用于解决不同问题。学习图之间相似性的定量度量是一个关键问题。事实上，这是网络分析的重要步骤，同时也
浪漫与性感兼具｜Julie Vino 2019婚纱系列服装设计禅言
以色列设计师婚纱品牌JulieVino释出2019「Paris巴黎」婚纱系列，本季婚纱以巴黎城市为拍摄背景和主题诉求，打造浪漫与性感兼具的现代礼服。来源|CFW服装设计最懂得穿衣服的是哪个职业？——设计师有穿不完的衣服是哪个职业？——设计师走在时装最顶端的职业是？没错还是设计师，想学习服装设计成为设计师，可以私信小编，免费带粉丝入门！
Perl数组用法详细解析架构 ExogFix perl scala 开发语言架构
Perl是一种功能强大的编程语言，广泛应用于各种领域。其中，数组是Perl中一种常用的数据结构，用于存储和操作一系列相关的数据。本文将详细解析Perl数组的用法，并提供相应的源代码示例。创建数组在Perl中，可以使用以下方式创建数组：#直接初始化数组my@array=(1,2,3,4,5)
Kafka 时间轮深度解析：如何O(1)处理定时任务 lifallen Kafka Java kafka linq 分布式 java 数据库数据结构 apache
TimingWheel（时间轮）TimingWheel是一种高效的、用于实现大量定时任务调度的算法结构。相比于传统的基于优先队列（PriorityQueue）的定时器（其添加/删除操作的时间复杂度为O(logn)），时间轮可以实现近乎O(1)的添加和删除操作，这在需要管理成千上万个定时任务的场景下（例如Kafka中的请求超时、延迟操作等）具有巨大的性能优势。可以把一个TimingWheel想象成一
【算法训练营Day12】二叉树part2 十八岁讨厌编程算法训练营算法
文章目录翻转二叉树对称二叉树二叉树的最大深度二叉树的最小深度翻转二叉树题目链接：226.翻转二叉树解题逻辑：翻转二叉树也就是将所有非叶节点的左右孩子相互交换，那么我们就可以采用层序遍历判断非叶节点进行翻转：初始化一个辅助队列将根节点添加到队列中去弹出队头元素如果该元素的两个子节点均不为null则翻转两个子节点然后将子节点入队如此循环往复直到队列为空代码如下：classSolution{public
ColQwen-Omni：RAG全模态检索来了，支持【文本|图像|视频|音频】四种模态！致Great 音视频
还记得ColPali、ColQwen和DSE吗？这些模型开创了视觉文档检索的新范式：无需费力地从文档中提取文本进行处理，只需将文档页面视为一系列图像（屏幕截图），然后训练视觉语言模型（VLM）直接将其内容表示为向量。ColPali的实践表明，这种策略通常比其他替代方法更快、更简单，并且能带来更好的检索性能。自发布一年以来，ColPali和ColQwen系列模型已被下载数百万次，被誉为“2024年顶
高通camera结构（第五天）
一、摄像头的结构和工作原理镜头用来拍摄景物，拍摄的图片在传感器上将光信号转换成了电信号，电信号经过AD转换器（模数转换器）转换成了数字信号，数字信号经过DSP（数字信号处理器）进行加工处理，再被送到电脑中进行处理，最终转换成了手机屏幕上我们可以看到的图像。数字信号处理器芯片（DSP）功能：主要是通过一系列数学的算法运算，对数字图像信号进行优化处理，并把处理过的信号通过USB等接口传到PC等设备。D
水彩原创。花篮姑娘嘉蓓水彩慢生活
这是过年后完成的第二张作品花篮姑娘，也是少女系列我最喜欢的一幅。感觉中粗纹的纸比细纹的好画。就是拍照片的时候纹理感太强了。图片发自App很想找个跟画画有关的工作，不知道这个目标能不能实现。图片发自App图片发自App图片发自App喜欢我的画记得关注我一下。公众号嘉蓓水彩慢生活
推荐算法召回：架构理解 Jay Kay c++推荐算法推荐算法架构算法
一、召回服务的定位与挑战召回层是推荐系统的第一道漏斗，负责从亿级候选集中筛选出千级别的相关项，其效果直接决定推荐效果的天花板。核心挑战包括：低延迟约束：需在50ms内完成海量候选检索；高召回率要求：98%的召回率需覆盖用户多样化兴趣；数据漂移应对：实时用户行为分布变化需动态适应；误杀控制：避免优质内容被过度过滤引发用户投诉。⚙️二、召回服务核心架构1.多路召回并行召回策略实现方式适用场景规则召回基
A*算法详解
A*算法详解一、A*算法基础概念1.1算法定位1.2核心评估函数1.3关键数据结构二、A*算法的核心步骤三、启发函数设计3.1网格地图中的启发函数3.2启发函数的选择原则三、Java代码实现四、启发函数的设计与优化4.1启发函数的可采纳性4.2启发函数的效率影响4.3常见启发函数对比五、A*算法的应用场景与拓展5.1典型应用5.2算法拓展六、A*算法的优缺点优点缺点从游戏中的角色寻路到机器人导航，
分层图最短路径算法详解 GG不是gg 数据结构与算法分析 #算法分析与设计图搜索算法
分层图最短路径算法详解一、分层图算法的核心思想1.1问题引入：带约束的最短路径1.2分层图的核心思路二、分层图的构建方法2.1分层图的结构定义2.2构建步骤（以“最多k次边权改为0”为例）三、分层图最短路径的求解3.1算法步骤3.2Java代码实现（以Dijkstra为例）四、分层图算法的关键细节4.1状态表示与空间优化4.2边的处理4.3复杂度分析五、典型应用场景5.1带次数约束的路径优化5.2
信息学奥赛-一本通-第二部分基础算法 --＞第五章搜索与回溯算法攻城丶狮 C++比赛信息算法深度优先图论 c++青少年编程
1317：【例5.2】组合的输出【题目描述】排列与组合是常用的数学方法，其中组合就是从n个元素中抽出r个元素(不分顺序且r≤n)，我们可以简单地将n个元素理解为自然数1，2，…，n，从中任取r个数。现要求你用递归的方法输出所有组合。例如n＝5，r＝3，所有组合为：123124125134135145234235245345【题目分析】1.搜索函数参数:上一次搜索的数字i(i(n)>=i(n-1))
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

【论文系列】光流/ LK光流/ FlowNet/ FlowNet2

光流

L-K光流法

稀疏光流法： L-K光流

稠密光流法：迭代求解L-K光流

金字塔光流法

光流金字塔​​​​​实际操作中​​一些需要注意的点：

FlowNet

网络结构

FlowNet2

Stacking Networks

参考博客：

你可能感兴趣的:(CV/统计,理论&算法,深度学习,论文系列)

光流金字塔实际操作中一些需要注意的点：