linjiet

文本检测(一)

此篇博客记录Scene text detection深度学习相关论文笔记。
Ref:Scene Text Detection and Recognition: The Deep Learning Era
世界没有一定…才能…，just do it.

Method 1

FCN

是一种semantic segmentation深度学习方法。

特点

使用不同的backbone networks进行实验
卷积化，将fully connected layers全部换成卷积,以使得可以处理任意size的输入
使用固定参数（FYI：bilinear interpolation且学习率为0）的transposed convolutions实现将最终的输出还原回input尺寸，通道维表示各个类别的预测
使用skip architecture进行fuse coarse information and fine information提高IU值，分别有FCN8s、FCN16s、FCN32s三种架构。其中FCN32s最终输出由最后的卷积层32 X upsampling得到；FCN16s是使用最后的卷积层2 X upsampling加上pooling 4的外加一层预测卷积的输出，然后进行16 X upsampling得到FCN16s的最终输出；FCN8s是使用FCN16s的1/16的加和的2 X upsampling加上pooling 3的外加一层预测卷积的输出，然后进行8 X upsampling得到FCN8s的最终dense预测输出。显然FCN8s获得最好效果，相对FCN16s提高很小，所以作者并没有继续使用FCN4s
end-to-end training
fine-tune

缺点

对于fine detail 处理并不是很好。

深入浅出SVM

在DSN论文中使用了SVM，SVM在DL也有应用，之前并没有怎么深入理解，趁着这篇论文的契机，重新捡起来。this section参考了李航的《统计学习方法》。

some mathematic conceptions

从数学角度谈谈自己对超平面的理解。

在数学中，我们可以通过很多方式表达二维平面的直线，例如斜截式、一般式等，对于一般式，我们也能够写成向量的形式
$\\ WX+C=0 \ \ \ \ in\ vector\ form$
可以证明其中的 $W$ 实质上表示的是垂直于直线的向量。
对于三维空间，亦是如此，可以设定面内的某一点，作出所有的面内向量，很方便地就可以证明 $W$ 是三维空间面的法向量。
在更高维空间里面，没有我们一般意义上的直线或者平面，我们称 $W X + C = 0$ 为超平面，超平面的概念和平面、直线的概念均一样，都是指满足 $W X + C = 0$ 的所有 $X$ 组成的无限集合。只是在可视化方面，二维和三维很容易地展示出来它们的几何意义，我们能够直观地认识到什么是法向量什么是平面等，而四维或者更高维没有办法像二维三维一样直观地展示出来它们的几何意义，但是抛开几何意义或者说是视觉含义，在数学层面上它们是一致的，都表示一个无限点集合，至于法向量的含义也进行了高维拓展，表示垂直于超平面的高维向量。安利一个很好的数学可视化网站mathematics visible.
进一步，我们可以很容易地将 $W$ 单位化，这样就可以认为 $W X$ 表示 $X$ 在法向量方向上的投影，当带符号的投影的长度等于 $C$ 的相反数时，则表示点刚好在超平面上。称 $C$ 为截距，在三维空间，很容易理解，我们是能够用投影去衡量点在平面的什么位置。伴随着这样的前提条件，我们可以调整点距离原点的位置和调整点到原点的向量与法向量的角度来改变点在平面的位置。在实际中，我们可以取法向量方向一侧为正类，反向为负类。

各种SVM

有三种类型的SVM，由简单到复杂。

linear support vector machine in linearly separable case with hard margin maximization
linear support vector machine with soft margin maximization
non-linear support vector machine with kernel method and soft margin maximization

函数间隔和几何间隔

functional margin: $\left|WX+C\right|$ 可以衡量点到平面的距离，如果值越大表示距离越远，表示分类预测的置信度越高（只有 $W$ 为单位向量的话，那么这个距离就等于 $\left|WX+C\right|$ ）。再者 $y$ 的符号和(WX+C\right)符号是否一致能够表示分类的正确与否，基于这两点就可以定义functional margin为 $y\left(WX+C\right)$ .它表示了预测的正确性和预测的确信度，函数间隔对于整个训练数据集为 $\min\limits_i{yi}\left(WX+C\right)$ .
geometric margin:当 $W$ 和 $C$ 成比例扩大或缩小，平面而没有变化，但函数间隔会按相同比例缩小扩大，我们利用regularization得到几何间隔，即 $\min\limits_i{yi}\left(\frac{W}{||W||}X+\frac{C}{||W||}\right)$ ,当 $∣ ∣ W ∣ ∣ = 1$ 时两个间隔相等。之所以为几何间隔，因为当我们的预测正确时，几何间隔就是点到平面的距离。

核技巧(kernel trick)

在解决非线性分类问题时，我们尝试将输入空间映射到特征空间，在特征空间中使用线性支持向量机解决分类问题。下面定义核函数（kernel function）：
$假设输入空间\Chi（欧氏空间）和特征空间\Eta（希尔伯特空间），如果存在映射\phi(x)将输入空间中的点映射到特征空间中，使得对任意x,z\in\Chi，K函数都满足下面条件\\ K(x,z)=\phi(x)\cdot\phi(z)\\ 则称K为核函数，\phi为映射函数，其中\cdot为特征空间中的点积。$
kernel trick:由于对偶问题的目标函数和分类器决策函数都包含样本点之间的点乘，加之特征空间往往是高维的或者无穷维的，所以只需要定义核函数，使得存在映射函数 $\phi$ 将输入空间中的样本点映射到特征空间中近似线性可分样本点，这样能够隐式地在特征空间中使用线性支持向量机对偶学习算法学习一个线性分类器，从而使用线性支持向量机解决非线性问题，而不需要显示地定义 $\phi$ 和特征空间。这就是核技巧。

linear support vector machine in linearly separable case with hard margin maximization

针对那些具有完全的线性可分特性的数据集。基于学习目的的不同，感知机对应的解有无穷多个，而SVM仅有一个解，SVM学习的模型不但能够正确分类训练集，且对于整个训练数据集还拥有最大几何间隔，最大的几何间隔就意味着对于最难分的样本点（离分离平面最近的点）也能拥有足够大的确信度，所以SVM是一个最大最小问题，即最大化最低确信度或者说是最大化最小间隔。从几何角度解释SVM，也即我们需要找一个平面，对所有平面我们计算离它最近的点与它的距离，然后选择有最大距离的面，这就是解。更加具体的，SVM的最大间隔formulation如下：
$\argmax\limits_{W,C} \ \min\limits_i{yi}\left(\frac{W}{||W||}X+\frac{C}{||W||}\right)$
更进一步，我们可以想象这样的一个空间： $∣ ∣ W ∣ ∣$ 为1的平面是真实世界的平面， $||W||\not=1$ 的平面位于相对于真实世界被放缩了的世界，在放缩世界里仅仅是空间的长度（size）被放缩了，我们能够利用 $∣ ∣ W ∣ ∣$ 这个放缩比例轻易地还原为真实世界。在一个完全的 $(W, C)$ 空间中，不同的 $(W, C)$ 对可能对应同一个平面，但是是在不同的放缩空间中。在所有放缩世界里，我们任意取定一个长度，让所有的点到平面的距离大于或者等于这个长度（在SVM中这个长度设置为1，任意数均可以），保证了最近点到平面的距离也大于或等于这个给定值，也保证了最近点到平面距离还原后也大于给定值还原后的值，我们只用还原给定值，最后找距离最大的 $(W, C)$ 对。对于某一个平面来说，当且仅当在某个合适的放缩比例 $∣ ∣ M ∣ ∣$ 的放缩空间中最近的点到平面的距离等于给定值时，它们还原后的距离相等否则给定值还原后的距离都小于真实空间中最近点到平面的距离，保证了正确性。如果在某个放缩空间中，最近点与平面的距离小于了给定的长度，那么还原这个长度回去得到的距离比真实世界中最近点到平面的距离大。如果暴力搜索完全的 $(W, C)$ 空间，由于部分放缩比例是没有意义的，会造成大量时间的浪费。
因此我们先调整上面的式子到放缩空间中，得到如下：
$\argmax\limits_{W,C} \frac{\gamma}{||W||} \\ s.t.\ \ \ yi(WX_i+C) >= \gamma$
上面的式子保证了 $\gamma$ 是最近的点到平面的距离，再将放缩世界中的 $\gamma$ 固定为1，得到：
$\argmax\limits_{W,C} \frac{1}{||W||} \\ s.t.\ \ \ yi(WX_i+C) -1>= 0$
将上面的最优化问题转为线性可分支持向量机的二次规划优化问题：
$\min\limits_{W,C}\frac{1}{2}||W||^2 \\ s.t.\ \ \ yi(WX_i+C) -1>= 0,i=1,2,...N$
因为对于一个线性可分训练数据集，一定存在满足条件的解，即存在可行解，又由于目标函数是一个有界函数，所以上述的优化问题一定存在解。对于参数 $W$ ，可以通过反证法假定存在两个 $W$ 满足最优解，利用两个 $W$ 和的1/2构造一个新的 $W$ ，利用新的 $W$ 与其他两个 $W$ 模的大小关系证明两个 $W$ 是线性关系，进一步证明这两个 $W$ 相等。对于参数 $C$ ，假定存在两个不同的 $C$ ，因为最优的 $W$ 一定能够满足最近的点使得限制条件等号刚好成立，所以可以通过利用离两个平面的最近点构造关于两个 $C$ 的等式，然后做差，证明这个差为0即可。
所以综上，在线性可分训练数据集中，解能够正确划分所有的正负数据，解存在且唯一。
支持向量定义为使得问题的约束条件等号成立的样本点，即离分离平面最近的样本点，这些点决定了分离平面，所以将这个模型称为支持向量机。分别令 $-1\ and\ 1$ 等号成立的两个超平面称为间隔边界，中间长条称为间隔(margin)，位于间隔边界平面上的样本点都是支持向量。可见对于支持向量机来说，最重要的是位于正负样点的边界部分的点。
我们可以这样想象求解过程，以每一个点做任意平面，保证与它同类的所有点在平面一侧且这一侧没有另一类别的点，并做一个平行的平面使得它们之间没有任何样本点，然后取两个平面中间的平面作为一个可行解，然后求间隔大小，最后找到最大间隔对应的平面。
个人认为在李航老师的书中提到移动间隔边界外的点或者去掉不会改变解，这个说法有问题，如果将间隔边界外一个点移到间隔内，由于这个平面对应的支持向量变化了，间隔更窄了，可能导致最终解发生变化，可以举一个极端的例子，例如只有三个点
最终的求解是转换为求解对偶问题从而求解线性可分SVM的优化问题。

linear support vector machine with soft margin maximization

线性支持向量机相比于线性可分支持向量机来说，多了一个软间隔参数，使得线性支持向量机应用范围比线性可分支持向量机广，对于线性可分训练数据集中多了奇异点或者噪声，都可以使用线性支持向量机解决，线性可分支持向量机是线性支持向量机的特例，线性支持向量机二次规划表达如下：
$\min\limits_{W,C,\xi} \frac{1}{2}|W||^2+B\sum_{i}^{N}\xi_i \\ s.t.\ \ \ \ y_i(WX_i+C) \geq1-\xi_i,i=1,2,3...N\\ \xi_i\geq0,i=0,1,2,...N$
其中 $B$ 是有关于任务的一个惩罚参数，对于对分类错误比较敏感的任务可以设置大一点，反之小一点。因为 $y_i(WX_i+C)$ 表示的是最近点到平面的有符号的距离，如果为负数意味着分类错误，在几何上，可以理解为点位于分离平面两侧中其所属类别一侧的相反侧，这个新增加的参数 $\xi$ 在几何上表示将点沿着超平面法向量方向移动，使得这个点能够在正确的一侧，并且保证与超平面的距离大于或等于1。（PS：即使在正确的一侧，但是距离小于1，那么也需要移动）
当计算出 $W$ 和 $C$ 变量后，我们就可以得到最终的分类超平面：
$W X + C = 0$
进而得到线性支持向量机：
$s i g n (W X + C)$
$s i g n$ 函数是一个符号函数。同样可以使用其二次规划问题的对偶问题得到最终的解，其中 $W$ 唯一， $C$ 不唯一。除了间隔边界上的样本点是支持向量外，还有 $\xi_i>0$ 的样本点。另外线性SVM二次规划问题还有一种等价的形式叫做合页损失函数（hinge loss function），如下：
$\min\limits_{W,C} \sum_i^N[1-y_i(WXi+C)]_++\lambda||W||^2$

有时间再来补一补对偶问题的求解过程和合页损失函数推理吧
对偶形式如下，给定超参 $B$ 后，求解下面的凸二次规划问题即可得出最终结果：
$\min\limits_{a}\frac{1}{2}\sum_i^N\sum_j^Na_ia_jy_iy_j(x_i \cdot x_j)-\sum_i^Na_i\\ s.t.\ \ \ \ \sum_i^Na_iy_i=0\\ 0<=a_i<=B,i=1,2,3...N$
在得到了上述式子的解 $a^*=\{a_1^*,a_2^*,a_3^*,...,a_N^*\}$ 后，对任意一个 $x_j,y_j)$ 样点满足 $0 < a j ∗ < B 0，求解参数 C C ： C ∗ = y j − ∑ i N a i ∗ y i ( x i ⋅ x j ) C^*=y_j-\sum_i^Na^*_iy_i(x_i \cdot x_j) 最终的线性分类器决策函数如下： f ( x ) = s i g n ( ∑ i N a i ∗ y i ( x , x i ) + C ∗ ) f(x)=sign(\sum_i^Na_i^*y_i(x,x_i)+C^*) 求解上面的对偶形式，有许多方法例如SMO算法等，可以高效地求解对偶形式的解。$

non-linear support vector machine with kernel method and soft margin maximization

上面的两种模型都是线性模型，解决的是线性问题，对于非线性问题，我们使用核技巧，即结合核函数和线性支持向量机对偶学习算法，解决非线性问题。本质上是将训练集从线性不可分空间变到线性可分空间，然后使用线性支持向量机进行分类。核函数的选择需要依赖于领域知识，它的好坏需要通过实验进行验证。
我们一般称核函数为正定核函数，通过推导（详细请移步李航老师的《统计学习方法》）我们能够得到正定核的充要条件，也可以看作是正定核即核函数的另一个等价的定义。定义如下：
$设\Chi\subset R^n,K(x,z)是定义在\Chi \times \Chi上的对称函数，如果对任意x_i\in\Chi,i=1,2,3,...m,K(x,z)对应的Gram矩阵\\ K=\left[ K(x_i,x_j)\right]_{m,m}\\ 都是半正定矩阵，那么K(x,z)函数称为正定核。$
这里不是一般意义的Gram矩阵，所以 $K$ 矩阵仅仅是一个对称矩阵。利用上述定义可以很方便构造地构造核函数，但是要判断一个函数是否是正定核比较困难，因为需要验证所有可能的 ${x_1,x_2,...,x_m\}$ 集合对应的 $K$ 矩阵是否是半正定矩阵，不太现实。在实际中，往往使用已经存在的正定核。包括多项式核函数、高斯核函数等。
我们利用线性支持向量机的对偶学习算法+核技巧就可以学习得到非线性支持向量机，优化问题依然为凸二次规划问题。在选定一个 $K (x, z)$ 函数和超参 $B$ 后，并将上面线性支持向量机的对偶形式中的点积 $(x_i \cdot x_j)$ 换成 $K(x_i,x_j)$ ，然后就可以求解 $a^*$ ，最后将 $C^*$ 和 $f (x)$ 求解式子中的点积 $(x_i \cdot x_j)$ 换成 $K(x_i,x_j)$ ，即可得到最终的非线性支持向量机。

感知机与SVM的区别

对于传统的线性感知机和线性可分支持向量机来说，因为线性可分SVM目的是在特征空间中实现最大化间隔，这与线性感知机目的不同，一般地，线性感知机只要求位于分割直线之上（或之下）的区域为正类，之下（或之上）为负类，最小化错误率即可，容易出现过拟合现象，而线性可分SVM的最大化间隔保证了一定的泛化能力。

一点思考

为什么线性支持向量机的原始二次规划式子中的slack variables没有除以 $∣ ∣ W ∣ ∣$ 以标准化？
L2-SVM（slack variables从线性相加变为平方和）的优点在哪？L2-SVM is differentiable and imposes a bigger (quadratic vs. linear) loss for points which violate the margin.

Deeply-supervised net

改论文介绍了现存DL框架的问题，包括在隐藏层学习的特征的意义影响难解释性、在隐藏层低质量的低鲁棒性的学习的特征、消失梯度难以引导学习、DL数学原理难以系统解释。

改论文的contributions：

integrated layer-wise loss function：因为每一个hidden layer都有一个objective function，这样的算法能够解决如及其深的神经网络出现的梯度消失情况（还有一种解决方法是使用dense convolution neural network技术）。这些新增加的objective functions能够作为一些额外的限制，从实验结果中得到测试结果效果提升而训练结果没有提升，相当于做了regularization，泛化性能更好。
a analysis technique from stochastic gradient method：
combined learning：相比较之前的greedy layer-wise pre-training方法来说，这里的方法学习的特征更好，greedy layer-wise pre-training方法造成了过拟合。
companion objective zero-ing：作者使用hidden layers的supervision本质是为了更容易学得更好的hidden layers特征，便于最终的输出层分类器分类，所以当hidden layers objective functions降低到一定数值后就不再对梯度有所贡献。而输出层分类器的损失对梯度的贡献将会存在于整个training过程。可以通过两个方法实现companion objective functions zero-ing，即设置一个阀值或使用decay function。
作者使用了L2-SVM和softmax作为分类器验证模型效果，不管是直接使用CNN-type的framework还是DSN，结果都是分类器为L2-SVM的模型结果最优
当分类器为L2-SVM，每一个hidden layer的objective function都是一个squaredhingeloss函数，这里将线性SVM中的squaredhingeloss扩展到了多分类任务，并去除了 $W||^2$ 项。这里在卷积和loss之间使用全连接网络表示一个线性SVM分类器（肯定是不能等同上述提到的线性SVM，不然就没有任何DL意义了，只是说线性SVM中是有inner product计算的，所以可以简单使用全连接网络表示线性SVM分类器，而不是学习过程），对于多分类任务，实质相当于使用多个二分类线性SVM，每个SVM负责决定属于或不属于这个类别，详情参考了caffe的document HingeLossLayer
作者在第一层卷积结束后就应用了companion objective function，所有objective functions（包括最后输出层的objective function函数）都使用了squaredhingeloss，且code中使用了学习率衰减的方式不断减弱companion objective function对网络的梯度更新，而输出层（一个pooling操作）并没有学习率衰减，与作者论文中描述一致（实质上仅仅只有表示线性SVM的全连接网络有学习率的衰减，其他地方并没有学习率的衰减，因为链式法则中乘法的因素，所以能够实现减弱companion objective function对网络的梯度更新）。详细的框架参考了作者的caffe prototxt文件DSN framework in cifar10

优点

就实验结果而言，相比于之前的greedy layer-wise pre-training结果overfitting，此实验的结果不错，因为将companion objectives作为hidden layer feature quality的proxy联合训练，regularization能力强。通过实验结果，相比于普通的CNN-SVM，DSN-SVM的generalization能力更强。与普通的CNN网络相比，DSN网络在训练数据集很缺乏的时候性能（test error rate）提升更明显，从这个角度也说明了DSN拥有更好的generalization能力，能够在一定程度上减弱因训练数据集缺乏导致的过拟合现象，所以说DSN是一个强的generalization工具。对于更大的数据集和更深的网络，它能够使得训练更加容易，不会出现像梯度消失的问题。

HED Edge Detection Algorithm

multi-scale and multi-level learning

最初接触multi-scale learning是在学习SSD的时候，在SSD中multi-scale的object可以通过backbone网络后的各个多尺度检测块进行检测和学习。在HED论文中，作者对multi-scale和multi-level learning进行了总结，例如multi-scale learning可以用神经网络本身的学习过程(i.e. multiscale receptive field or multiscale feature representations learned by each layer)和multiscale input image来解释。

接下来，作者将常见的multi-scale deep learning architectures分为了4个类型:

multi-stream architecture:典型特征是创建多个streams，多个streams使用不同的参数，拥有不同的感受野，对应了multi-scale，最后将这些输出进行concat，然后传入最后的输出层产生最终的结果。
skip-layer network learning:典型特征是使用single stream，提取单一single stream中的不同层的feature maps，然后将他们合并，典型代表就是FCN网络，从某种意义上经典的特征提取网络FPN网络也是用了这样的结构。这个architecture和上面的architecture都是得到single prediction，这与一般流行的边检测算法不一致。
single model on multiple inputs：基于multiple scaled input images和单个网络，在训练时，相当于使用了图像增强技术进行训练，在测试时多次的前向传播，效率极低。
training independent networks：它是第一种architecture的变形，这里将训练多个独立的网络，不同的网络使用不同的depth以及得到不同的prediction。但是效率同样很低。
holistically-nested networks：正如前面所述，大量的重复计算使得现存方法效率不高，这里提出的方法和方法2（例如：FCN）很相似，都是利用了单一神经网络不同层学习的多尺寸特征。利用single stream network中各个层产生side outputs，如果需要可以将这些side outputs做一个fusion操作，最终的最优结构结合了side outputs的平均和fusion结果。
作者为了解决high-level side output layer造成的梯度爆炸问题，以及提高模型的能力和鲁棒性，使用了多个标注器，至少3个annotators标注一个pixel为positive时，这个pixel才被标记为positive class，其余都是negative class。
作者也使用了image augmentation技术，将一个图片经过一些变换，得到32张图片。在测试时，使用这32张图片的预测结果的平均值作为test image的prediction并没有提高表现，所以作者在执行test时，就只是使用原始图片。
poolling function对edge detection result影响较大
与FCN网络相似，这里作者也使用bilinear上采样得到original image size的side output，且上采样的weights是被固定为bilinear interpolation参数即学习率为0。在FCN论文中作者指出可以使用learned deconvolution（虽然FCN代码并没有learn deconvolution weights），但是这篇文章中作者在采用learned deconvolution layer时并没有获得显著的模型能力提升。
HED结合了FCN（存在于HED的fusion过程，但FCN和HED的fusion处理过程是有点不同的）和DSN（存在于side output supervision，这是和FCN的single loss function完全不同的）技术，作者实验中比较了FCN8s和FCN2s（换成了cross entropy loss function）、HED without DSN，结果都比HED with DSN差，原因主要是作者将每一个网络层及其之前的层看作一个单独的network，对应的side output loss是这个network的损失函数，这样每一个side output network能够依靠损失函数优化对应scale的edge map。而且经过实验，在HED without DSN框架，由于没有对side output的控制即损失函数的引导，仅仅有最后的loss function，它更加关注large structure edge，所以一些存在于lower layer的关键的edge就缺失掉了，效果下降。下面展示一个example result:(来源于作者Github源码example页面，上面是fusion output 和下面是五张side outputs)
在测试时直接使用fusion output作为prediction或者是所有outputs的平均。

总结：无论哪一种方法，我们都是基于了neural network本身的nature即hierarchical learning，利用这个nature我们能够设计得到各种architectures，这些architectures能够进行multi-scale预测。更进一步，我们并不能用feature map的size去表现multi-scale，更加根本地应从receptive field size去表现，因为即使feature map size与原图保持一致，而感受野可以很大。我们要实现multi-scale学习，可以尝试创建更大的感受野feature map，然后基于这些multi-scale receptive field maps去进行multi-scale object detection，像SSD算法、FPN、Mask-RCNN等都是这样做的。

Training & Testing

隐藏层的监督可以提高结果表现。

因为target set中标签分布的不均匀，为了进行平衡，作者使用了一种简单的cost-sensitive loss function for per-pixel，即weighted cross-entropy loss function，使用负类和正类所占比例作为权值。损失函数是建立在side-outputs和fusion output与target set的差别上的。

Comparing FCN with HED about architecture

HED与FCN相比，相同点：

都使用了单一神经网络的各个层学习的特征组合得到最终结果
在这些层后面加上额外的1x1卷积然后进行transposed convolution
都使用了额外的1x1卷积改变中间层的输出通道为类别数
在上采样部分依然使用了bi-linear采样初始化，

不同点：

被transposed convolution的层不一致，HED用的是卷积层输出且在层数方面使用的深度范围更深
与FCN8s相比，HED分别对每一层额外卷积输出结果直接transposed convolution到input image shape，然后concat这些结果，组成5通道的输出，然后传入一个卷积层输出fuse的结果（同样为单通道），接着将这个fuse结果和其他的side output 进行concat，最后对这个结果使用激活函数作为输出。而FCN8s是将最后一层的输出进行2x transposed convolution，然后加上pool4额外卷积输出，再进行2x transposed convolution, pool3同样的道理

Regard text detection as semantic segmentation problem

由于前面很多的工作是在local region进行搜索text，而且几乎所有的前面的工作都是检测horizontal or near-horizontal的text，忽略了non-horizontal区域

Features

使用FCN网络进行holistic的预测，不再基于局部（基于整个图片进行预测），能够有效地利用contextual information，抑制false positives
能够解决non-horizontal predict
当两个文本行距离太近的时候，作者在论文中提到简单地使用两分类的语义分割器，将导致分割的结果是粘连在一起的，意味着这样的语义分割器很困难去单独识别每一个文本行，直接使用语义分割技术是不足够用于文本检测任务的。作者解决这个问题是通过除了考虑text region location，还考虑了单个character的中心和尺寸以及相邻characters的linking orientation；

Ref

[1] J. Long, E. Shelhamer, and T. Darrell. Fully convolutional networks for semantic segmentation. In Proc. of CVPR, 2015.
[2] C.-Y. Lee, S. Xie, P. Gallagher, Z. Zhang, and Z. Tu. Deeply- supervised nets. In AISTATS, 2015.

霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
目标检测（object detection）加油吧zkf 目标检测目标检测人工智能计算机视觉
目标检测作为计算机视觉的核心技术，在自动驾驶、安防监控、医疗影像等领域发挥着不可替代的作用。本文将系统讲解目标检测的概念、原理、主流模型、常见数据集及应用场景，帮助读者构建对这一技术的完整认知。一、目标检测的核心概念目标检测（ObjectDetection）是指在图像或视频中自动定位并识别出所有感兴趣的目标的技术。它需要解决两个核心问题：分类（Classification）：确定图像中每个目标的类
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
OpenCV图片操作100例：从入门到精通指南（1）总有刁民想爱朕ha opencv 计算机视觉人工智能
OpenCV图片操作100例：从入门到精通指南本文整理了100个OpenCV实用技巧，涵盖图像处理各个领域，助你轻松掌握计算机视觉核心技能！一、入门必备：基础操作1.图像读写与显示importcv2#读取图像（BGR格式）img=cv2.imread('image.jpg')#显示图像cv2.imshow('示例图片',img)cv2.waitKey(0)#按任意键退出cv2.destroyAll
OpenCV图片操作100例：从入门到精通指南（3）总有刁民想爱朕ha opencv 人工智能计算机视觉
高效学习路径：1️⃣分阶段学习：入门：1-20例（基础操作）进阶：21-50例（图像处理）高级：51-100例（计算机视觉）2️⃣项目驱动学习：证件照背景替换（1-15例）停车场车位检测（30-45例）视频运动追踪（70-85例）3️⃣性能优化技巧：#使用UMat加速图像处理umat_img=cv2.UMat(img)processed=cv2.GaussianBlur(umat_img,(5,5
OpenCV入门到精通：AI视觉处理的完整指南 AI云原生与云计算技术学院人工智能 opencv 计算机视觉 ai
OpenCV入门到精通：AI视觉处理的完整指南关键词：OpenCV、计算机视觉、图像预处理、目标检测、AI视觉应用摘要：本文是一份面向AI视觉爱好者的OpenCV完整学习指南。从OpenCV的核心概念讲起，结合生活案例、代码示例和项目实战，逐步拆解图像读取/显示、灰度化、边缘检测、目标检测等关键技术。无论你是想入门计算机视觉的新手，还是希望用OpenCV解决实际问题的开发者，都能通过本文掌握从理论
CNN 猫狗识别：从理论到实战的深度解析爱熬夜的小古 cnn 深度学习人工智能
在计算机视觉领域，卷积神经网络（ConvolutionalNeuralNetwork，CNN）凭借其强大的特征提取和模式识别能力，成为图像分类任务的主流技术。猫狗识别作为经典的图像分类问题，不仅能帮助我们理解CNN的工作原理，还能为实际应用提供技术支持。本文将深入探讨CNN在猫狗识别中的应用，从理论基础到实战代码，带你全面掌握这项技术。一、CNN基础理论概述（一）CNN的核心组件卷积层：是CNN的
OpenCV入门到精通：从基础到实战的全面指南
摘要：本文旨在为初学者和有一定经验的开发者提供OpenCV从入门到精通的全面指南。文章首先介绍了OpenCV的基本概念和安装方法，然后深入讲解了图像处理基础、特征检测与匹配、视频处理与分析等核心内容，最后通过实战案例展示了OpenCV在计算机视觉任务中的应用。关键词：OpenCV；图像处理；特征检测；视频分析；实战案例引言OpenCV（OpenSourceComputerVisionLibrary
【人工智能面经第五期：模型训练与优化核心面试深度问答】码上有前 Pytorch Python 深度学习人工智能面试职场和发展
作者：“码上有前”文章简介：人工智能面经欢迎小伙伴们点赞、收藏⭐、留言模型训练与优化核心面试深度问答摘要围绕模型训练与优化的训练技巧（正则化、迁移学习）和数据工程（数据增强、标注质量）展开，通过20个关键问题，解析正则化协同策略、迁移学习适配场景、数据增强实践等核心要点，助力读者掌握人工智能与计算机视觉岗位面试中模型训练优化的知识体系，明晰技术原理与实际应用的关联。目录训练技巧-正则化策略相关问题
机器学习手写字体识别系统：技术演进与应用实践万能小贤哥机器学习人工智能
引言：手写字体识别的技术定位与价值在信息处理领域，人工录入手写文本的低效性与机器识别的高效性形成鲜明对比。例如，医疗处方的人工处理需约5分钟/张，而采用手写字体识别技术可将时间缩短至10秒/张，显著提升处理效率。作为计算机视觉与人工智能的重要分支，手写字体识别技术通过将手写文本转换为可编辑电子文本，不仅大幅减少人工输入时间和错误，降低人工处理成本，还能在大量数据处理时保持高于人工录入的准确性，是人
【论文阅读笔记】TimesURL: Self-supervised Contrastive Learning for Universal Time Series 少写代码少看论文多多睡觉 #论文阅读笔记论文阅读笔记
TimesURL:Self-supervisedContrastiveLearningforUniversalTimeSeriesRepresentationLearning摘要学习适用于多种下游任务的通用时间序列表示，并指出这在实际应用中具有挑战性但也是有价值的。最近，研究人员尝试借鉴自监督对比学习（SSCL）在计算机视觉（CV）和自然语言处理（NLP）中的成功经验，以解决时间序列表示的问题。
异物检测的计算机视觉算法技术路线思绪漂移计算机视觉算法人工智能
异物检测的计算机视觉算法技术路线在现代智能监测系统中，异物检测有着其必要性和运维重要性，通过计算机视觉算法，可以实时识别各种异常物体，为设备安全运行提供有力保障。本文将介绍异物检测的主要技术路线。一、分类识别适应场景分类识别技术主要适用于已知目标类别的异物检测场景。在运维环境中，这类场景包括：固定区域内的障碍物监测（如轨道区域的石块、工具、动物等）关键部件的异物附着检测（如固定装置上的杂物）安全通
【AI大模型】深入解析预训练：大模型时代的核心引擎我爱一条柴ya 学习AI记录深度学习人工智能 ai python AI编程算法
预训练已成为现代人工智能，尤其是自然语言处理和计算机视觉领域的基石技术。它彻底改变了模型开发范式，催生了BERT、GPT等革命性模型。本文将系统阐述预训练的核心概念、原理、方法、应用及挑战。一、预训练的本质：为何需要它？核心问题：数据标注的瓶颈监督学习依赖海量高质量标注数据，获取成本极高（时间、金钱、专业知识）。对于复杂任务（如理解语义、生成文本），标注难度呈指数级上升。标注数据稀缺导致模型泛化能
OpenCvSharp 实现环形文字识别OCR实例（C#） XisVisual_Basic ocr c#计算机视觉 C#
近年来，随着计算机视觉和图像处理的不断发展，光学字符识别（OCR）技术也变得愈发成熟。OCR技术可以将图像中的文字转换为可编辑和可搜索的文本，为人们带来了极大的便利。在本篇文章中，我们将介绍如何使用OpenCvSharp库来实现环形文字的识别。首先，在使用OpenCvSharp之前，我们需要确保已经在项目中引用了该库，并添加相应的命名空间。usingOpenCvSharp;接下来，我们需要准备一张
Python|OpenCV-实现识别弧形文字(17) 写python的鑫哥 OpenCV入门与进阶 python opencv 人工智能计算机视觉弧形文字环形文字识别
前言本文是该专栏的第19篇，后面将持续分享OpenCV计算机视觉的干货知识，记得关注。我们知道，OCR可以识别文字方面的需求，但是如果遇到那些目标文字是“弧形文字”，需要怎么去识别呢？遇到想要识别“弧形文字”的需求，这个时候你可以借助于Opencv+OCR技术来实现。而本文，笔者将针对上述问题需求，利用OpenCV结合OCR来实现“弧形文字”的识别。废话不多说，具体的细节部分以及详细的解决方案，跟
【小白入门必看】一文读懂深度学习计算机视觉技术及学习路线
一、什么是计算机视觉？计算机视觉，其实就是教机器怎么像我们人一样，用摄像头看看周围的世界，然后理解它。比如说，它能认出这是个苹果，或者那边有辆车。除此之外，还能把拍到的照片或者视频转换成有用的信息，帮我们做决定。整个过程就是为了让机器能看懂图像，然后根据这些图像来做出聪明的选择。二、计算机视觉实现起来难吗？人类依赖视觉，找辆汽车轻而易举，毕竟汽车那么大，一眼就能看出来，所以常误以为计算机视觉简单，
计算机视觉：Transformer的轻量化与加速策略 xcLeigh 计算机视觉CV 计算机视觉 transformer 人工智能 AI 策略
计算机视觉：Transformer的轻量化与加速策略一、前言二、Transformer基础概念回顾2.1Transformer架构概述2.2自注意力机制原理三、Transformer轻量化策略3.1模型结构优化3.1.1减少层数和头数3.1.2优化Patch大小3.2参数共享与剪枝3.2.1参数共享3.2.2剪枝3.3知识蒸馏四、Transformer加速策略4.1模型量化4.2.2TPU加速4.
【机器学习】解密计算机视觉：CNN、目标检测与图像识别核心技术（第25天）吴师兄大模型 0基础实现机器学习入门到精通机器学习计算机视觉 cnn 人工智能目标检测图像识别 pytorch
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
人体坐姿检测系统开发实战（YOLOv8+PyTorch+可视化） Loving_enjoy 计算机学科论文创新点人工智能深度学习迁移学习经验分享
本文将手把手教你构建智能坐姿检测系统，结合目标检测与姿态估计技术，实现不良坐姿的实时识别与预警###一、项目背景与价值现代人每天平均坐姿时间超过8小时，不良坐姿会导致：-脊椎压力增加300%-颈椎病发病率提升45%-腰椎间盘突出风险增加60%本系统通过计算机视觉技术实时监测坐姿状态，对驼背、侧倾、前倾等不良姿势进行智能识别和预警。相较于传统传感器方案，我们的视觉方案具有非接触、低成本、易部署的优势
魔都AI医疗哪家强？全景揭秘科技创新与未来钱景！
引言上海作为中国科技创新的先锋城市，正在AI医疗领域崭露头角。根据2024年12月的数据，上海拥有34家专注于AI药物研发的公司，占全国预临床研究的60%和临床试验的47%。这些公司利用深度学习、大语言模型（LLM）和计算机视觉等技术，革新药物发现、医疗影像分析和数据治理，推动医疗行业的智能化转型。从全球首个人工智能医院“AgentHospital”到AI驱动的诊断系统，上海的AI医疗生态正在重塑
语义分割模型的轻量化与准确率提升研究 pk_xz123456 仿真模型深度学习算法 transformer 深度学习人工智能算法数据结构
语义分割模型的轻量化与准确率提升研究1.引言语义分割是计算机视觉领域的核心任务之一，它要求模型为图像中的每个像素分配一个类别标签。随着深度学习的发展，语义分割模型在多个领域得到了广泛应用，如自动驾驶、医学影像分析、遥感图像解译等。然而，现有的语义分割模型往往面临两个主要挑战：模型复杂度高导致难以部署在资源受限的设备上，以及准确率仍有提升空间以满足实际应用需求。本文将从模型轻量化和准确率提升两个角度
Python深度学习实践：建立端到端的自动驾驶系统 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：建立端到端的自动驾驶系统1.背景介绍自动驾驶系统是当今科技领域最具挑战性和前景的应用之一。它融合了计算机视觉、深度学习、规划与控制等多个领域的先进技术,旨在实现车辆的自主感知、决策和操控。随着人工智能技术的不断发展,越来越多的公司和研究机构投入了大量资源来开发自动驾驶系统。Python作为一种高效、易学且开源的编程语言,在这一领域扮演着重要角色。本文将探讨如何利用Pyth
从0开始学习计算机视觉--Day08--卷积神经网络
之前我们提到，神经网络是通过全连接层对输入做降维处理，将输入的向量通过矩阵和激活函数进行降维，在神经元上输出激活值。而卷积神经网络中，用卷积层代替了全连接层。不同的是，这里的输入不再需要降维，而是可以保留输入的空间结构，例如输入的是32×32×3的图片，在全连接层中是3072×1的向量，而卷积层里则保持不变。这里的改变的地方是对于同样的WX的函数形式，这里是把5×5×3的权重矩阵（也叫卷积核）向量
Python打卡：Day40
#先继续之前的代码importtorchimporttorch.nnasnnimporttorch.optimasoptimfromtorch.utils.dataimportDataLoader,Dataset#DataLoader是PyTorch中用于加载数据的工具fromtorchvisionimportdatasets,transforms#torchvision是一个用于计算机视觉的库，
BigQuery对象引用（ObjectRef）全面指南：一站式整合结构化与非结构化多模态数据分析
引言企业需要同时管理有组织表格中的结构化数据，以及日益增长的非结构化数据（如图片、音频和文档）。传统上，联合分析这些多样化数据类型非常复杂，通常需要使用不同的工具。非结构化媒体通常需要导出到专门的服务进行处理（如图片分析需计算机视觉服务，音频需语音转文本引擎），这会造成数据孤岛，阻碍全局分析视角的建立。以虚构的电商支持系统为例：结构化的工单信息存储在BigQuery表中，而相关的支持通话录音或损坏
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
多模态大模型的技术应用与未来展望：重构AI交互范式的新引擎 zhaoyi_he 重构人工智能
一、引言：为什么多模态是AI发展的下一场革命？过去十年，深度学习推动了计算机视觉和自然语言处理的飞跃，但两者的发展路径长期割裂。随着生成式AI和大模型时代的到来，**多模态大模型（MultimodalFoundationModels）**以统一的建模方式处理图像、文本、音频、视频等多源数据，重塑了“感知-认知-决策”链条，为AGI迈出关键一步。OpenAI的GPT-4o、Google的Gemini
OpenCV 图像操作：颜色识别、替换与水印添加
目录引言代码实现1.导入必要的库2.图像加法3.图像直接相加4.颜色加权加法5.HSV颜色空间转换概念作用6.查找颜色范围对应的像素点7.与运算-生成掩膜8.添加水印9.主函数总结引言在计算机视觉领域，OpenCV是一个强大的库，提供了丰富的图像操作功能。本文将详细介绍如何使用OpenCV进行图像加法、颜色加权加法、HSV颜色空间转换、颜色范围查找、与运算生成掩膜以及添加水印等操作，并给出相应的P
YOLO学习笔记｜从YOLOv5到YOLOv11：技术演进与核心改进北斗猿 YOLO学习从零到1 YOLO 目标检测算法 python 计算机视觉
从YOLOv5到YOLOv11：技术演进与核心改进深度解析一、YOLO系列发展概述YOLO（YouOnlyLookOnce）目标检测算法自2016年诞生以来，凭借其"单次检测"的独特理念和卓越的实时性能，持续引领着计算机视觉领域的技术革新。从JosephRedmon的初代YOLO到AlexeyBochkovskiy的YOLOv4，再到Ultralytics团队的YOLOv5及后续系列，这一算法家族
《卷积神经网络到Vision Transformer：计算机视觉的十年架构革命》 HeartException 人工智能学习
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站题目《卷积神经网络到VisionTransformer：计算机视觉的十年架构革命》展开深度解析，全文采用技术演进史+架构对比+产业影响的三段式结构，附关键数据与趋势预测：卷积神经网络到VisionTransformer：计算机视觉的十年架构革命副标题：从局部感知到全局建模，一场改变AI视觉基石的
web前段跨域nginx代理配置刘正强 nginx cms Web
nginx代理配置可参考server部分 server { listen 80; server_name localhost;
spring学习笔记 caoyong spring
一、概述 a>、核心技术 : IOC与AOP b>、开发为什么需要面向接口而不是实现接口降低一个组件与整个系统的藕合程度，当该组件不满足系统需求时，可以很容易的将该组件从系统中替换掉，而不会对整个系统产生大的影响 c>、面向接口编口编程的难点在于如何对接口进行初始化,(使用工厂设计模式)
Eclipse打开workspace提示工作空间不可用 0624chenhong eclipse
做项目的时候，难免会用到整个团队的代码，或者上一任同事创建的workspace， 1.电脑切换账号后，Eclipse打开时，会提示Eclipse对应的目录锁定，无法访问，根据提示，找到对应目录，G:\eclipse\configuration\org.eclipse.osgi\.manager，其中文件.fileTableLock提示被锁定。解决办法，删掉.fileTableLock文件，重
Javascript 面向对面写法的必要性？一炮送你回车库 JavaScript
现在Javascript面向对象的方式来写页面很流行，什么纯javascript的mvc框架都出来了：ember 这是javascript层的mvc框架哦,不是j2ee的mvc框架我想说的是，javascript本来就不是一门面向对象的语言，用它写出来的面向对象的程序，本身就有些别扭，很多人提到js的面向对象首先提的是：复用性。那么我请问你写的js里有多少是可以复用的，用fu
js array对象的迭代方法换个号韩国红果果 array
1.forEach 该方法接受一个函数作为参数，对数组中的每个元素使用该函数 return 语句失效 function square(num) { print(num, num * num); } var nums = [1,2,3,4,5,6,7,8,9,10]; nums.forEach(square); 2.every 该方法接受一个返回值为布尔类型
对Hibernate缓存机制的理解归来朝歌 session 一级缓存对象持久化
在hibernate中session一级缓存机制中，有这么一种情况：问题描述：我需要new一个对象，对它的几个字段赋值，但是有一些属性并没有进行赋值，然后调用 session.save()方法，在提交事务后，会出现这样的情况： 1：在数据库中有默认属性的字段的值为空 2：既然是持久化对象，为什么在最后对象拿不到默认属性的值？通过调试后解决方案如下：对于问题一，如你在数据库里设置了
WebService调用错误合集 darkranger webservice
Java.Lang.NoClassDefFoundError: Org/Apache/Commons/Discovery/Tools/DiscoverSingleton 调用接口出错，一个简单的WebService import org.apache.axis.client.Call;import org.apache.axis.client.Service; 首先必不可
JSP和Servlet的中文乱码处理 aijuans Java Web
JSP和Servlet的中文乱码处理前几天学习了JSP和Servlet中有关中文乱码的一些问题，写成了博客，今天进行更新一下。应该是可以解决日常的乱码问题了。现在作以下总结希望对需要的人有所帮助。我也是刚学，所以有不足之处希望谅解。一、表单提交时出现乱码：在进行表单提交的时候，经常提交一些中文，自然就避免不了出现中文乱码的情况，对于表单来说有两种提交方式：get和post提交方式。所以
面试经典六问 atongyeye 工作面试
题记：因为我不善沟通，所以在面试中经常碰壁，看了网上太多面试宝典，基本上不太靠谱。只好自己总结，并试着根据最近工作情况完成个人答案。以备不时之需。以下是人事了解应聘者情况的最典型的六个问题： 1 简单自我介绍关于这个问题，主要为了弄清两件事，一是了解应聘者的背景，二是应聘者将这些背景信息组织成合适语言的能力。我的回答：(针对技术面试回答，如果是人事面试，可以就掌
contentResolver.query()参数详解百合不是茶 android query()详解
收藏csdn的博客,介绍的比较详细,新手值得一看 1.获取联系人姓名一个简单的例子，这个函数获取设备上所有的联系人ID和联系人NAME。 [java] view plain copy public void fetchAllContacts() {
ora-00054:resource busy and acquire with nowait specified解决方法 bijian1013 oracle 数据库 kill nowait
当某个数据库用户在数据库中插入、更新、删除一个表的数据，或者增加一个表的主键时或者表的索引时，常常会出现ora-00054:resource busy and acquire with nowait specified这样的错误。主要是因为有事务正在执行（或者事务已经被锁），所有导致执行不成功。 1.下面的语句
web 开发乱码征客丶 spring Web
以下前端都是 utf-8 字符集编码一、后台接收 1.1、 get 请求乱码 get 请求中，请求参数在请求头中；乱码解决方法： a、通过在web 服务器中配置编码格式：tomcat 中，在 Connector 中添加URIEncoding="UTF-8"； 1.2、post 请求乱码 post 请求中，请求参数分两部份， 1.2.1、url？参数，
【Spark十六】： Spark SQL第二部分数据源和注册表的几种方式 bit1129 spark
Spark SQL数据源和表的Schema case class apply schema parquet json JSON数据源准备源数据 {"name":"Jack", "age": 12, "addr":{"city":"beijing&
JVM学习之:调优总结 -Xms -Xmx -Xmn -Xss BlueSkator -Xss -Xmn -Xms -Xmx
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx355
jqGrid 各种参数详解(转帖) BreakingBad jqGrid
jqGrid 各种参数详解分类：源代码分享个人随笔请勿参考解决开发问题 2012-05-09 20:29 84282人阅读评论(22) 收藏举报 jquery 服务器 parameters function ajax string
读《研磨设计模式》-代码笔记-代理模式-Proxy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.lang.reflect.InvocationHandler; import java.lang.reflect.Method; import java.lang.reflect.Proxy; /* * 下面
应用升级iOS8中遇到的一些问题 chenhbc ios8 升级iOS8
1、很奇怪的问题，登录界面，有一个判断，如果不存在某个值，则跳转到设置界面，ios8之前的系统都可以正常跳转，iOS8中代码已经执行到下一个界面了，但界面并没有跳转过去，而且这个值如果设置过的话，也是可以正常跳转过去的，这个问题纠结了两天多，之前的判断我是在 -(void)viewWillAppear:(BOOL)animated 中写的，最终的解决办法是把判断写在 -(void
工作流与自组织的关系？ comsci 设计模式工作
目前的工作流系统中的节点及其相互之间的连接是事先根据管理的实际需要而绘制好的，这种固定的模式在实际的运用中会受到很多限制，特别是节点之间的依存关系是固定的，节点的处理不考虑到流程整体的运行情况，细节和整体间的关系是脱节的，那么我们提出一个新的观点，一个流程是否可以通过节点的自组织运动来自动生成呢？这种流程有什么实际意义呢？这里有篇论文，摘要是：“针对网格中的服务
Oracle11.2新特性之INSERT提示IGNORE_ROW_ON_DUPKEY_INDEX daizj oracle
insert提示IGNORE_ROW_ON_DUPKEY_INDEX 转自：http://space.itpub.net/18922393/viewspace-752123 在 insert into tablea ...select * from tableb中，如果存在唯一约束，会导致整个insert操作失败。使用IGNORE_ROW_ON_DUPKEY_INDEX提示，会忽略唯一
二叉树:堆 dieslrae 二叉树
这里说的堆其实是一个完全二叉树,每个节点都不小于自己的子节点,不要跟jvm的堆搞混了.由于是完全二叉树,可以用数组来构建.用数组构建树的规则很简单: 一个节点的父节点下标为: (当前下标 - 1)/2 一个节点的左节点下标为: 当前下标 * 2 + 1 &
C语言学习八结构体 dcj3sjt126com c
为什么需要结构体，看代码 # include <stdio.h> struct Student //定义一个学生类型，里面有age, score, sex, 然后可以定义这个类型的变量 { int age; float score; char sex; } int main(void) { struct Student st = {80, 66.6,
centos安装golang dcj3sjt126com centos
#在国内镜像下载二进制包 wget -c http://www.golangtc.com/static/go/go1.4.1.linux-amd64.tar.gz tar -C /usr/local -xzf go1.4.1.linux-amd64.tar.gz #把golang的bin目录加入全局环境变量 cat >>/etc/profile<
10.性能优化-监控-MySQL慢查询 frank1234 性能优化 MySQL慢查询
1.记录慢查询配置 show variables where variable_name like 'slow%' ; --查看默认日志路径查询结果：--不用的机器可能不同 slow_query_log_file=/var/lib/mysql/centos-slow.log 修改mysqld配置文件：/usr /my.cnf[一般在/etc/my.cnf，本机在/user/my.cn
Java父类取得子类类名 happyqing java this 父类子类类名
在继承关系中，不管父类还是子类，这些类里面的this都代表了最终new出来的那个类的实例对象，所以在父类中你可以用this获取到子类的信息！ package com.urthinker.module.test; import org.junit.Test; abstract class BaseDao<T> { public void
Spring3.2新注解@ControllerAdvice jinnianshilongnian @Controller
@ControllerAdvice，是spring3.2提供的新注解，从名字上可以看出大体意思是控制器增强。让我们先看看@ControllerAdvice的实现： @Target(ElementType.TYPE) @Retention(RetentionPolicy.RUNTIME) @Documented @Component public @interface Co
Java spring mvc多数据源配置 liuxihope spring
转自：http://www.itpub.net/thread-1906608-1-1.html 1、首先配置两个数据库 <bean id="dataSourceA" class="org.apache.commons.dbcp.BasicDataSource" destroy-method="close&quo
第12章 Ajax（下） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
BW / Universe Mappings blueoxygen BO
BW Element OLAP Universe Element Cube Dimension Class Charateristic A class with dimension and detail objects (Detail objects for key and desription) Hi
Java开发熟手该当心的11个错误 tomcat_oracle java 多线程工作单元测试
#1、不在属性文件或XML文件中外化配置属性。比如，没有把批处理使用的线程数设置成可在属性文件中配置。你的批处理程序无论在DEV环境中，还是UAT（用户验收测试）环境中，都可以顺畅无阻地运行，但是一旦部署在PROD 上，把它作为多线程程序处理更大的数据集时，就会抛出IOException，原因可能是JDBC驱动版本不同，也可能是#2中讨论的问题。如果线程数目可以在属性文件中配置，那么使它成为
推行国产操作系统的优劣 yananay windows linux 国产操作系统
最近刮起了一股风，就是去“国外货”。从应用程序开始，到基础的系统，数据库，现在已经刮到操作系统了。原因就是“棱镜计划”，使我们终于认识到了国外货的危害，开始重视起了信息安全。操作系统是计算机的灵魂。既然是灵魂，为了信息安全，那我们就自然要使用和推行国货。可是，一味地推行，是否就一定正确呢？先说说信息安全。其实从很早以来大家就在讨论信息安全。很多年以前，就据传某世界级的网络设备制造商生产的交