田神

CornerNet：不用 Anchor Boxes 也能进行目标检测（Object Detection）

一、简介

目标检测（Object Detection）是图像识别的一个重要领域，近来看了一篇19年8月的相关综述《Recent Advances in Deep Learning for Object Detection》[1]，发现自己又落伍了，现在已经到了不用 anchor boxes也能进行目标定位了。我们来看看文中给出的一个 Object Detection 的发展脉络：

图1 基于深度学习的目标检测的发展脉络

从图中我们看到两个趋势，其一为 anchor free，另一个是 AutoML，让我们先来了解一下 anchor free 方案，这也是本文的中心。
Anchor Boxes 直译为“锚矩形”（没翻译成“锚盒”，因为我觉得“矩形”似乎更贴合其使用场景），Anchor Boxes是目标定位的基准，它们在图像中的位置是固定的，而我们通过卷积网络regression得到的目标bounded boxes 坐标一般都是以anchor boxes为基准的相对位置，并归一化，由bounded boxes相对位置结合Anchor Boxes的绝对位置，我们就可以对 Objects 进行定位。
在CornerNet出现前的检测模型，不论是One Stage的还是Two Stages的，皆有此设置，然而，Anchor boxes这一机制有两大问题：
1、凡采用anchor boxes的模型，都会在图上定义大量的anchor boxes，这一方面增加了计算量，另一方面也引入了正、负例不均衡，从而导致的训练效果下降；
2、Anchor boxes 是需要设计的，这不仅增加了大量的超级参数，需要手动设置，还因为不同尺度对象需要从不同的Feature Maps中提取，增加了网络的复杂度。
正是为了消除anchor boxes的这两个缺陷，CornerNet[2]提出了 Anchor free 的方案，以下我们就 CornerNet 的实现详细地展开。

二、Anchor Free 的实现原理

CornerNet的实现原理图如下：

图2、CornerNet的实现框图

它的实现流程分为三个部分:
1、ConvNet 卷积网络，提取特征；
2、Predicting Module，由Corner Pooling预测出：Heapmaps、Offset、Embedding 三部分，它们皆用于计算目标的定位；
3、损失Loss部分：分成多个部分 Loss ，加起来形成总的损失，并采用Adam训练各网络参数。
接下来，我们研究一下各个部分的具体实现：

2.1 ConvNet 作为backbone

CornerNet 所选的卷积网络是一个称为 Hourglass 的网络，所谓 Hourglass 就是沙漏，[2] 中有一段文字是这样叙述的：
The hourglass network was first introduced for the human pose estimation task. It is a fully convolutional neural network that consists of one or more hourglass modules. An hourglass module first down samplesthe input features by a series of convolution and maxpooling layers. It then up samplesthe features back to the original resolutionby a series of upsampling and convolution layers. Since details are lost in the max pooling layers, skip layersare added to bring back the details to the upsampled features. The hourglass module captures both global and local features in a single unified structure. When multiple hourglass modules are stacked in the network, the hourglass modules can reprocess the features to capture higher-level of information. These properties make the hourglass network an ideal choice for object detection as well.
简单翻译如下：一个沙漏模块由两部分组成，其中第一部分由conv和max-pooling构成，使feature maps 尺度逐层缩小，而第二部分采用upsampling和conv，使feature maps再恢复到原来的尺寸，为减少max pooling对原图信息的丢失，采用skip layers，将丢失的details补充回来。沙漏模块可以叠加，形成检测网络。由于其featuremap 先缩，而后再扩展，如同一个沙漏，由此得名hourglass。

图3、hourglass结构图[3]

CornerNet 的 backbone 由两个 hourglasses 模块堆叠而成，图2简单地用了两个打横的沙漏来表示。另外，CornerNet 为简化实现，将max pooling直接用stride=2 来代替了，其它的细节可以从代码实现中得到[4]。

2.2 网络的predict部分

由图2部分，可以看到在 hourglass 模块后有两个 prediction module，分别用于预测bounding box的左上角（top-left corner）和右下角（bottom-right corner），这是CornerNet的实现的关键。Hourglass 的输出特征图（feature maps）经 Corner Pooling 后，会最终输出三组Predictions：Heatmaps、 Embeddings 和 Offsets，最后的目标定位由它们经 post-processing algorithm 得到。
以下，我们先来看看这三组 Predictions 都是些什么东西，然后再看看 Corner Pooling 的实现原理。

2.2.1 Heatmaps

按 [2] 中所述，Heatmaps 是一个 C * H * W 张量，其中H 表示高度，W表示宽度，反映图的size；C是channels，其数量与目标分类（Category）数量相同。在Heatmap上的一点 $p_{cij}$ 表示在图（image）中（i，j）位置上是 c 分类角点（top-left 或 bottom-right corner点）的score，它是一个小于1大于0的数，可看作概率。
作为 ground truth bounding boxes，每一个都有且仅有一个 top-left corner（或 bottom-right corner），角点位置 $y_{cij}$ 取值为 1，若不是角点则 $y_{cij}$ 取值为 0。由此，可定义一个二进制交叉熵损失：
$L_{det}= -\frac 1N \sum_{c=1}^C \sum_{i=1}^W \sum_{j=1}^H \left \{ \begin{array} {cc} log(p_{cij}) & \text{if } \ y_{cij}=1\\ log(1-p_{cij}) & \text{if otherwise} \end{array} \right. \qquad(1)$
用上述Loss训练网络，会因为positive case 与 negative case 数量不平衡，而导致训练效果不好，[5]给出了一个平衡不均衡训练样例的方法—— focal loss ，其原文摘抄如下：
1、Easily classified negatives comprise the majority of the loss and dominate the gradient.
即容易进行分辨的负例占样例的大多数，它们主导了梯度计算。
2、We propose to add a modulating factor $(1-p_t)^{\gamma}$ to the cross entropy loss, with tunable focusing parameter $\gamma \ge 0$ . We define the focal loss as:
$-(1-p_t)^{\gamma} log(p_t)$
通过对交叉熵添加一个衰减因子 $(1-p_t)^{\gamma}$ ，使 $p_t$ 大的（即容易分辨的样本）衰减大，使 $p_t$ 小的（即不容易分辨的样本）衰减小。一般取 $\gamma \in [0,5]$ 。
若根据这个思路，改造公式（1），有：
$L_{det}= -\frac 1N \sum_{c=1}^C \sum_{i=1}^W \sum_{j=1}^H \left \{ \begin{array} {cc} (1-p_{cij})^{\alpha}log(p_{cij}) & \text{if } \ y_{cij}=1\\ (p_{cij})^{\alpha}log(1-p_{cij}) & \text{if otherwise} \end{array} \right. \qquad(2)$
因而[2]觉得[5]的 focal loss 思想可用，但还不够，因为实在是positive太少，negative太多，想想也是，因为整个平面上真正的角点（positive）没几个，大部分都是非角点（negative），于是，[2]平滑了正负例，它在原来的ground truth角点上引入了一个高斯模糊，这使得ground truth不再是非1即0，而是一个光滑变化的曲面，具体处理如下：
$y_{cij}=e^{\frac {x^2+y^2}{2\sigma^2}} \qquad(3)$
上式中， $x=i-\hat i_{tl}, \ y=j-\hat j_{tl}$ ，其中 $(\hat i_{tl}, \hat j_{tl})$ 表示ground-truth 的 top-left，因此 $x^2+y^2$ 表示 $(i, j)$ 与 $(\hat i_{tl}, \hat j_{tl})$ 的距离。 $\sigma$ 等于 $\frac 13 \text{Radius}$ ，Radius由目标大小决定。

于是，公式（2）变成了：
$L_{det}= -\frac 1N \sum_{c=1}^C \sum_{i=1}^W \sum_{j=1}^H \left \{ \begin{array} {cc} (1-p_{cij})^{\alpha}log(p_{cij}) & \text{if } \ y_{cij}=1\\ (1-y_{cij})^{\beta}(p_{cij})^{\alpha}log(1-p_{cij}) & \text{if otherwise} \end{array} \right. \qquad(3)$
由上式，我们看到，加入了 $(1-y_{cij})^{\beta}$ 因子，使ground truth附近的点，对Loss贡献减少了，[2] 中是这样说的：
With the Gaussian bumps encoded in $y_{cij}$ , the $1-y_{cij})$ term reduces the penalty around the ground truth locations.
大概[2]的作者认为，在角点附近的点被判定为角点的概率很高，属于 easily 判断的cases，因此，需要减少它的作用吧。
上式一般取 $\alpha=2, \beta=4$ ，下面来看看这部分代码：

## from [4] /models/py_utils/kp_utils.py
def _neg_loss(preds, gt):
    pos_inds = gt.eq(1)
    neg_inds = gt.lt(1)

    neg_weights = torch.pow(1 - gt[neg_inds], 4)

    loss = 0
    for pred in preds:
        pos_pred = pred[pos_inds]
        neg_pred = pred[neg_inds]

        pos_loss = torch.log(pos_pred) * torch.pow(1 - pos_pred, 2)
        neg_loss = torch.log(1 - neg_pred) * torch.pow(neg_pred, 2) * neg_weights

        num_pos  = pos_inds.float().sum()
        pos_loss = pos_loss.sum()
        neg_loss = neg_loss.sum()

        if pos_pred.nelement() == 0:
            loss = loss - neg_loss
        else:
            loss = loss - (pos_loss + neg_loss) / num_pos
    return loss

在上面代码中，gt表示来自样本的标注，其处理有：

## from [4] /sample/coco.py
def kp_detection(db, k_ind, data_aug, debug):
    ...
    # allocating memory
    images      = np.zeros((batch_size, 3, input_size[0], input_size[1]), dtype=np.float32)
    tl_heatmaps = np.zeros((batch_size, categories, output_size[0], output_size[1]), dtype=np.float32)
    br_heatmaps = np.zeros((batch_size, categories, output_size[0], output_size[1]), dtype=np.float32)
   ...
           if gaussian_bump:
                width  = detection[2] - detection[0]
                height = detection[3] - detection[1]

                width  = math.ceil(width * width_ratio)
                height = math.ceil(height * height_ratio)

                if gaussian_rad == -1:
                    radius = gaussian_radius((height, width), gaussian_iou)  #计算目标的半径
                    radius = max(0, int(radius))   
                else:
                    radius = gaussian_rad

                draw_gaussian(tl_heatmaps[b_ind, category], [xtl, ytl], radius) #用2D Gaussian函数处理角点周围点
                draw_gaussian(br_heatmaps[b_ind, category], [xbr, ybr], radius)
            else:
                tl_heatmaps[b_ind, category, ytl, xtl] = 1
                br_heatmaps[b_ind, category, ybr, xbr] = 1
    ...

在上述代码中可以看到 Radius 由函数 gaussian_radius( ) 得到， $y_{cij}$ 由 draw_gaussian( ) 得到，这两个函数如下。

## from [4] /sample/utils.py
def gaussian_radius(det_size, min_overlap):
    height, width = det_size

    a1  = 1
    b1  = (height + width)
    c1  = width * height * (1 - min_overlap) / (1 + min_overlap)
    sq1 = np.sqrt(b1 ** 2 - 4 * a1 * c1)
    r1  = (b1 - sq1) / (2 * a1)

    a2  = 4
    b2  = 2 * (height + width)
    c2  = (1 - min_overlap) * width * height
    sq2 = np.sqrt(b2 ** 2 - 4 * a2 * c2)
    r2  = (b2 - sq2) / (2 * a2)

    a3  = 4 * min_overlap
    b3  = -2 * min_overlap * (height + width)
    c3  = (min_overlap - 1) * width * height
    sq3 = np.sqrt(b3 ** 2 - 4 * a3 * c3)
    r3  = (b3 + sq3) / (2 * a3)
    return min(r1, r2, r3)

def gaussian2D(shape, sigma=1):
    m, n = [(ss - 1.) / 2. for ss in shape]
    y, x = np.ogrid[-m:m+1,-n:n+1]

    h = np.exp(-(x * x + y * y) / (2 * sigma * sigma))
    h[h < np.finfo(h.dtype).eps * h.max()] = 0
    return h
    
def draw_gaussian(heatmap, center, radius, k=1):
    diameter = 2 * radius + 1
    gaussian = gaussian2D((diameter, diameter), sigma=diameter / 6)
    # 得到一个 diameter*diameter 的二维高斯图像 gaussian
    x, y = center

    height, width = heatmap.shape[0:2]
    
    left, right = min(x, radius), min(width - x, radius + 1)
    top, bottom = min(y, radius), min(height - y, radius + 1)

    masked_heatmap  = heatmap[y - top:y + bottom, x - left:x + right]
    masked_gaussian = gaussian[radius - top:radius + bottom, radius - left:radius + right]
    np.maximum(masked_heatmap, masked_gaussian * k, out=masked_heatmap)

我做了小测试，设定heatmap大小为100*100，有两个key points，位置分别为：[20,30] 和 [50,60]，两个bounding boxes的 [w, h] 都是[25,35]，则我们可得到target heat map 如下：

图4、经2D Gaussian 处理后的目标Heatmap

2.2.2 Offsets

一般而言，为了让网络处理节省一些内存，往往会使前面得到的Heatmaps的size 比原图（Image）小一些，在将原图位置映射到Heatmap上时，会丢失一些精度，因为向下取整，因而在逆映射时，会产生一定误差，这对于小物体而言是有很大影响的。让我们一起看看[2]原文的叙述：
Hence, a location (x,y) in the image is mapped to the locationin $(\lfloor\frac xn\rfloor, \lfloor\frac yn\rfloor)$ the heatmaps, where n is the downsampling factor. When we remap the locations from the heatmaps to the input image, some precision may be lost, which can greatly affect the IoU of small bounding boxes with their ground truths.
为此，[2]定义了一个用于微调的Offset prediction，如下：
$\mathbf o_k=\left( \frac {x_k}n - \left \lfloor \frac{x_k}n \right\rfloor, \frac {y_k}n - \left \lfloor \frac{y_k}n \right\rfloor\right) \qquad(4)$
其中， $\left \lfloor \cdot \right\rfloor$ 表示向下取整，公式（4）表示Heatmap上每一点需要调整的偏移量，由此，prediction与ground-truth偏移量差构成Loss。[2]采用 SmoothL1Loss，其定义如下：
$L_{off}=\frac 1N \sum_{k=1}^{N}\text{SmoothL1Loss}(\mathbf o_k,\mathbf {\hat o}_k)\qquad(5)$
为什么不直接采用L2Loss而要采用SmoothL1Loss？
L2Loss的定义如下：
$L2(x)=x^2\qquad(6)$
SmoothL1Loss在[6]中给出：
$SmoothL1(x)=\left\{\begin{array}{cc}\\ 0.5x^2 & \text{if} \ |x|<1 \\ |x|-0.5 & \text{otherwise} \end{array} \right. \qquad(7)$
采用SmoothL1Loss的原因，[6]是这样说的:
A smoothed L1 loss that is less sensitive to outliers than the L2 loss used in R-CNN. When the regression targets are unbounded, training with L2 loss requires significant tuning of learning rates in order to prevent exploding gradients. Eq. 3 eliminates this sensitivity.
简译：SmoothL1对outliers（异常点）不如 L2 敏感，因为 the regression targets 是无界的，很容易造成梯度爆炸，需仔细调节 learning rates，而采用 SmoothL1 则可以有效消除这种敏感性。
为什么会这样呢？我们看看两者的函数图形，可能会有一个直观的感觉：

图5、SmoothL1与L2的比较
从图中可见，SmoothL1较为平缓，另外，其梯度在 $∣ x ∣ > 1$ 的区域是恒定值，或许正是这样特性，使它对异常点不敏感吧。
SmoothL1 的实现是在：

## from [4] models/py_utils/kp_utils.py
def _regr_loss(regr, gt_regr, mask):
    num  = mask.float().sum()
    mask = mask.unsqueeze(2).expand_as(gt_regr)

    regr    = regr[mask]
    gt_regr = gt_regr[mask]
    
    regr_loss = nn.functional.smooth_l1_loss(regr, gt_regr, size_average=False)
    regr_loss = regr_loss / (num + 1e-4)
    return regr_loss

pytorch 已经帮我们实现了 smooth_l1_loss，直接调用就可以了。

2.2.3 Embedding

前面两个Loss都与独立的 key point 预测有关，但最终我们是希望得到的是bounding boxes，需要匹配 top-left 与 bottom-right，以形成完整的bounding box。
如何把相应的 top-left 和 bottom-right 点组合（group）起来的问题，原文是这样说的：
Multiple objects may appear in an image, and thus multiple top-left and bottom-right corners may be detected. We need to determine if a pair of the top-left corner and bottom-right corner is from the same bounding box.
[2]在这部分的叙述较为简单，只说与[7]的方法相似，即 Associative embedding 方法，[2] 和 [7] 的作者 Jia Deng 应该是同一人，不仅是在此应用了相同方法，还在backbone处用了相似的hourglass结构，可能是 Jia Deng 换了个大学，又发了一篇文章。[7] 原来是一个关于人体姿态估计的算法，如下图：

图6、[7]的Associative embedding方法
在人体姿势估计的任务中，一方面需要把人体的关键点（如：right wrist、left knee等）detect出来，另一方面还需要将它们按不同人joint起来，这就需要将这些点分组（group），[7]说 Associative embedding 是 fit 任何需要detect和group任务的方法，那么接下来我们就详细地看看这是怎样实现的 from [7]。
图6是 Associative embedding 的理解关键。在hourglass输出端，可以得到一组heatmaps，从图中可看到这组heatmaps分为两类，其中黑色layer表示关键点score，其中淡蓝色layer表示associative embedding tags。每层embedding的每个位置上的 embedding tag 其实是一个实数，该tag值是什么并不重要，只要同属一个人的关键点的tag值之间的差值小，不同人关键点之间tag值差大就可以。
在人体姿势估计中假设有K种不同的关键点，则每一种关键点对应两层layer，这样输出的heatmaps就是： $2 K * W * H$ ，其中W和H对应于heatmap的宽和高。为什么把 embedding tags 要叫做 embedding 呢？我想可能是这样的：在heatmaps的某个位置 (i, j)上，都有一个由不同类型keypoint tags组成的矢量，因而如此称呼它。[7]给出的Loss计算方法如下：
令 $h_k\in \mathcal R^{W*H}$ 是 the predicted tagging heatmap for 第k个关键点形成的tag scores 矢量。其实，它就是一个2维实数张量，即实数平面，即第k个heatmap。 $h (x)$ 表示 a tag value at pixel location x， $h_k(x)$ 表示x位置上 $h_k$ 的值。
给定N个独立的人，每个人有K个关键点，ground-truth是： $T=\{ (x_{nk})\},\ n=1,\cdots,N; \ k=1,\cdots,K$ ， $x_{nk}$ 是该关键点的位置。我们为ground-truth中每个人定义一个变量—— reference embedding for the n-th person：
$\bar h_n = \frac 1K \sum h_k(x_{nk})$
即第n个人关键点 ground-truth 位置对应的tag值的 mean，则总的损失函数为：
$L_g(h,T)=\frac 1N\sum_n \sum_k(\bar h_n-h_k(x_{nk}))^2 + \frac 1{N^2}\sum_n \sum_{n'}exp \left\{-\frac 1{2\sigma^2}(\bar h_n-\bar h_{n'})^2 \right\} \qquad(8)$
公式（8）中， $h_k(x_{nk})$ 表示ground-truth位置下，第n个人第k个关键点位置对应的tag值， $\sum (\bar h_n-h_k(x_{nk}))^2$ 其实就是该人关键点tag值的方差，注意：这里的 $x_{nk}$ 对应的皆是ground-truth关键点的位置，与前面两个预测2.2.1 heatmap、2.2.2 offset结果无关，这也体现了one-stage原则。
$L_g$ 分为了两部分，第一部分表示的是同一个人内部不同关键点tag与tag mean的平方差的和，第二部分反映的是不同人tag mean分离的程度，当然是不同人分离程度越大越好，同一个tag差异越小越好，这个损失函数的设计逻辑上是没有问题的。
以下是经训练后，得到的一个分离，或group结果：

图7、embedding分组效果
图7如何看？纵坐标是关键点的index，横坐标表示tag值，从图上可以看到9列小圈，这表示9组，每1组的横坐标，也就是tag值是近似相等的，这是分组的依据。

从[7]到[2]，公式（8）损失函数有了一些变化，[2]的损失函数变成了如下形式：
$L_{pull} = \frac 1N \sum_{n=1}^N\left [(e_{tn}-e_n)^2 + (e_{bn}-e_n^2)\right]\qquad(9) \\ \ \\L_{push}=\frac 1{N(N-1)}\sum_{n=1}^N\sum_{n'=1,n'\neq n}^N max(0,\Delta - |e_n - e_{n'}|) \qquad(10)$
其中，where $e_k$ is the average of $e_{tn}$ and $e_{bn}$ and we set $\Delta$ to be 1 。
此处， $L_{pull}$ 相当于公式（8）的第一部分，除了采用符号不同外，没有什么其他的不同； $L_{push}$ 相当于公式（8）的第二部分，此处用 $max(0,\Delta-|e_n-e_{n'}|)$ 代替了公式（8）的 $exp\{\cdot\}$ ，其目的是一样的。
以下是CornerNet的这部分实现代码，摘自[4]，其过程很清晰：

## from [4] /models/py_utils/kp.py
class AELoss(nn.Module):
    def __init__(self, pull_weight=1, push_weight=1, regr_weight=1, focal_loss=_neg_loss):
        super(AELoss, self).__init__()

        self.pull_weight = pull_weight
        self.push_weight = push_weight
        self.regr_weight = regr_weight
        self.focal_loss  = focal_loss
        self.ae_loss     = _ae_loss
        self.regr_loss   = _regr_loss

    def forward(self, outs, targets):
        stride = 6

        tl_heats = outs[0::stride] # 表示0元素取后，隔stride个元素再取
        br_heats = outs[1::stride] # 表示1元素取后，隔stride个元素再取
        tl_tags  = outs[2::stride]
        br_tags  = outs[3::stride]
        tl_regrs = outs[4::stride]
        br_regrs = outs[5::stride]

        gt_tl_heat = targets[0]
        gt_br_heat = targets[1]
        gt_mask    = targets[2]
        gt_tl_regr = targets[3]
        gt_br_regr = targets[4]

        # focal loss
        focal_loss = 0

        tl_heats = [_sigmoid(t) for t in tl_heats]
        br_heats = [_sigmoid(b) for b in br_heats]

        focal_loss += self.focal_loss(tl_heats, gt_tl_heat)
        focal_loss += self.focal_loss(br_heats, gt_br_heat)

        # tag loss
        pull_loss = 0
        push_loss = 0

        for tl_tag, br_tag in zip(tl_tags, br_tags):
            pull, push = self.ae_loss(tl_tag, br_tag, gt_mask)
            pull_loss += pull
            push_loss += push
        pull_loss = self.pull_weight * pull_loss
        push_loss = self.push_weight * push_loss

        regr_loss = 0
        for tl_regr, br_regr in zip(tl_regrs, br_regrs):
            regr_loss += self.regr_loss(tl_regr, gt_tl_regr, gt_mask)
            regr_loss += self.regr_loss(br_regr, gt_br_regr, gt_mask)
        regr_loss = self.regr_weight * regr_loss

        loss = (focal_loss + pull_loss + push_loss + regr_loss) / len(tl_heats)
        return loss.unsqueeze(0)

$L_{pull}$ 和 $L_{push}$ 的实现如下：

def _ae_loss(tag0, tag1, mask):
    num  = mask.sum(dim=1, keepdim=True).float()
    tag0 = tag0.squeeze()
    tag1 = tag1.squeeze()

    tag_mean = (tag0 + tag1) / 2

    tag0 = torch.pow(tag0 - tag_mean, 2) / (num + 1e-4)
    tag0 = tag0[mask].sum()
    tag1 = torch.pow(tag1 - tag_mean, 2) / (num + 1e-4)
    tag1 = tag1[mask].sum()
    pull = tag0 + tag1

    mask = mask.unsqueeze(1) + mask.unsqueeze(2)
    mask = mask.eq(2)
    num  = num.unsqueeze(2)
    num2 = (num - 1) * num
    dist = tag_mean.unsqueeze(1) - tag_mean.unsqueeze(2)
    dist = 1 - torch.abs(dist)
    dist = nn.functional.relu(dist, inplace=True)
    dist = dist - 1 / (num + 1e-4)
    dist = dist / (num2 + 1e-4)
    dist = dist[mask]
    push = dist.sum()
    return pull, push

从以上代码可以看到，从predict出来的heatmap得到tag0、tag1，分别对应 $e_{tn},e_{bn}$ ；(tag0+tag1)/2得到 $e_n$ ，这是所有点都参与的，然后，

    tag0 = torch.pow(tag0 - tag_mean, 2) / (num + 1e-4)
    tag0 = tag0[mask].sum()
    tag1 = torch.pow(tag1 - tag_mean, 2) / (num + 1e-4)
    tag1 = tag1[mask].sum()
    pull = tag0 + tag1

因为mask是ground-truth的位置，在求Loss时，我们仅将ground-truth对应位置上的结果加总即可。
这个embedding的设计思路确实在之前不常见，很有启发。

2.3 Hourglass与Heatmap之间的Corner Pooling

在[2]中，还有一个作者引以为豪的是Corner Pooling的设计，其初衷是： Often there is no local evidence to determine the location of a bounding box corner. We address this issue by proposing a new type of pooling layer.

图7、通过pooling的方法获得top-left点和bottom-right点
corner pooling的结构在图10，原理可通过图8和图9来解释：

图8 获得top-left的pooling方法
从图10可见，backbone的输出被分支为两个部分: $f^t,f^l$ ，两者都是feature maps，图8上部分处理是从 $f^t$ 中max pooling表示top的相关信息，处理过程是：从bottom开始scan，到i结束，找到 $f^t$ 上找到该列的最大值，精确的数学表达为：
$f_{ij}^t=max(f_{kj}^t), k\in[i,H]$
同理，从 $f^l$ 中max pooling表示left的相关信息，可得到
$f_{ij}^l=max(f_{ik}^l), k\in[j,W]$
然后，将它们加起来
$f_{ij} = f_{ij}^t+f_{ij}^l$
其中，具体过程见如下例子：

图9 pooling处理过程的具体例子
此corner pooling位于 backbone 与 predict之间，如图10：

图10、corner pooling 所在位置
为了不让原有信息丢失，在图上还看到一条skip支路，构成Residual结构。其实，我认为residual结构，就是为了增强我们想增强的信息，而不丢失原有信息。
此corner pooling有什么作用呢？效果对比如下：

图11、第一行为没有corner pooling效果，第二行为有corner pooling的效果
从图11中，我们看到box更贴合目标，用作者自己的话来说就是：Corner pooling is a key component of CornerNet.

三、CornerNet 的升级版 CenterNet

3.1 CenterNet 简介

图1中最右边那根红线代表的就是 CenterNet [8]，[8] 中写道CornerNet存在以下问题：Since each object is constructed by a pair of corners, the algorithm is sensitive to detect the boundary of objects, meanwhile not being aware of which pairs of keypoints should be grouped into objects. It often generates some incorrect bounding boxes, most of which could be easily filtered out with complementary information, e.g., the aspect ratio.
由此，[8]在[2]的基础上提出一种三点定位的算法，即：top-left, bottom-right and center，对比 CornerNet，它只有两个 key points。CenterNet 的网络结构与 CornerNet 相似，它比CornerNet 的预测输出多了一个 Center Heatmap 预测，如图12：

图12、CenterNet网络结构
多预测一个Center有什么好处呢？[8]是这样说的：
If a predicted bounding box has a high IoU with the ground-truth box, then the probability that the center keypoint in its central region is predicted as the same class is high, and vice versa. Thus, during inference, after a proposal is generated as a pair of corner keypoints, we determine if the proposal is indeed an object by checking if there is a center keypoint of the same class falling within its central region.
也就是，我们可以通过检查所生成的box中间区域是否包含其中心点，以此来确定此proposal是否真正是一个合理的box。
为了实现center的预测，CenterNet除了增加一个输出外，还设计了两个 pooling：

Center pooling
Cascade corner pooling

以下，我们就来看看这两个 pooling 高明在哪里？

3.2 两个pooling的实现

1、Center pooling
[8] 要预测center，碰到一个问题就是：The geometric centers of objects do not necessarily convey very recognizable visual patterns，也就是说目标的中心点并不是必然存在可识别的特征模式的。于是，[8]发明了center pooling来解决这个问题，方法是这样的：the backbone outputs a feature map, and to determine if a pixel in the feature map is a center keypoint, we need to find the maximum value in its both horizontal and vertical directions and add them together. By doing this, center pooling helps the better detection of center key points.
为什么这样会行呢？文章没写，我也不想深究了。

2、Cascade corner pooling
该方法表述如下：It first looks along a boundary to find a boundary maximum value, then looks inside along the location of the boundary maximum value to find an internal maximum value, and finally, add the two maximum values together. By doing this, the corners obtain both the the boundary information and the visual patterns of objects.
这个处理方法描述得不太清楚，或许要看看它的实现代码。

3、pooling的结构

图13、pooling的结构

通过pooling将我们认为有用的效果增强，那能不能说pooling其实就是一种人工设计的feature提取方法呢？人工设计来自于人的直觉，这个直觉的模拟可能需要千万个参数去拟合，因此人工的干预和end-to-end的结合往往有奇效。

四、小结

通过CornerNet学习，我觉得至少有三个值得学习的地方：
1、由hourglass和prediction得到的heat maps，其实就是FCN（全卷积网络），这个FCN让我们得到了各个pixel作为corner的score。
2、embedding的获得，用ground-truth作为位置索引取出 tagging heat map值，计算相对距离
3、pooling其实就是手动设计feature，将pooling应用在神经网络中，提升了神经网络的效率。

[1] Recent Advances in Deep Learning for Object Detection, 8/2019, Xiongwei Wu, Doyen Sahoo, Steven C.H. Hoi, School of Information System, Singapore Management University Salesforce Research Asia

[2] CornerNet: Detecting Objects as Paired Keypoints, 8/2018, Hei Law , Jia Deng, Princeton University, Princeton, NJ, USA

[3] Stacked hourglass networks for human pose estimation, 3/2016, Alejandro Newell, Kaiyu Yang, and Jia Deng, University of Michigan

[4] https://github.com/princeton-vl/CornerNet

[5] Lin, T.-Y., Goyal, P., Girshick, R., He, K., and Doll ́ar, P. (2017). Focal loss for dense object detection. arXiv preprint arXiv:1708.02002

[6] Girshick, R. (2015). Fast r-cnn. arXiv preprint arXiv:1504.08083.

[7] Newell, A., Huang, Z., and Deng, J. (2017). Associative embedding: End-to-end learning for joint detection and grouping. In Advances in Neural Information Processing Systems, pages 2274–2284.

[8] K. Duan, S. Bai, L. Xie, H. Qi, Q. Huang, Q. Tian, Centernet: Keypoint
triplets for object detection, in: arXiv preprint arXiv:1904.08189, 2019

你可能感兴趣的:(机器视觉,机器学习与神经网络)

机器视觉_联合编程(二) Zhangci］ VisionPro 数码相机计算机视觉人工智能 VisionPro 机器视觉
链接相机,加载tb,检测FrameGrabber链接相机拍照usingSystem;usingSystem.Collections;usingSystem.Collections.Generic;usingSystem.ComponentModel;usingSystem.Data;usingSystem.Drawing;usingSystem.Linq;usingSystem.Text;usin
EI检索-机器视觉、图像处理与影像技术国际学术会议（MVIPIT 2023）邀您参会！诗远Yolanda 图像处理人工智能计算机视觉
机器视觉是计算机学科的一个重要分支，它综合了光学、机械、电子、计算机软硬件等方面的技术，涉及到计算机、图像处理、模式识别、人工智能、信号处理、光机电一体化等多个领域。而图像处理等技术的快速发展也推动了机器视觉的发展。机器视觉在我国具有广泛的工业应用，核心功能包括：测量，检测，识别，定位等。第一届机器视觉、图像处理与影像技术国际学术会议（MVIPIT2023）将于2023年7月26日-28日在浙江杭
学习Halcon可以从以下几个方面入手视觉人机器视觉机器视觉Halcon大总结学习人工智能深度学习图像处理计算机视觉视觉检测
‌基础理论学习‌：‌了解Halcon的基本概念、‌架构和主要技术，‌包括图像处理、‌机器视觉、‌深度学习等方面的知识。‌‌官方文档和教程‌：‌阅读Halcon的官方文档和教程，‌这是学习Halcon最直接、‌最权威的途径。‌官方文档详细介绍了Halcon的各种功能和算子，‌是学习Halcon不可或缺的资源。‌‌实践项目‌：‌通过参与实际项目来巩固所学知识，‌提升实践能力。‌可以从简单的项目开始，‌
最新2024年国际EI会议集合 AC学术中心 EI论文
最新2024年国际EI会议集合，要说哪个渠道录用最快，当属EI会议，最快1个月录用，超级快的可能仅需15天，非常适合计算机、机械、工程技术等理工科方向。除了录用周期的优势外，EI会议相较于SCI、EI源刊、国内核心等价格更便宜，几千元即可发表EI会议论文。下面AC学术中心给大家介绍一下近期要举办的EI会议。第二届机器视觉、图像处理与影像技术国际会议（MVIPIT2024）会议时间：2024年9月1
acm会议什么档次_盘点AI国际顶级会议 weixin_39531992 acm会议什么档次
人工智能(英文全称ArtificialIntelligence,缩写为AI)从其字面意思理解是由人制造出来在机器上体现出的类似于人类的智能，其技术研究包含机器视觉、机器学习、自然语言处理、机器运动和控制等众多方面。如同四大时装周是世界时尚潮流的风向标，人工智能领域的国际顶尖会议也往往汇集了人工智能各分支技术的最新发展状态和未来发展方向。今天，小编就来为大家盘点一下人工智能领域的国际顶级会议。\\\
【机器视觉--光学】工业相机成像原理 Vision Z 机器视觉镜头工业相机机器视觉
相机成像原理分为透镜成像原理和小孔成像原理，工业相机原理与透镜成像类似。透镜成像原理凸透镜的成像规律是即：物距的倒数与像距的倒数之和等于焦距的倒数对焦原理工业相机镜头分为定焦、定倍、变焦镜头，常用的是定焦和定倍，定倍镜头调整相距，达到清晰的成像，根据上面的公式，想要得到远处清晰的成像，镜片组到芯片距离需要增加，想要得到近距离的成像时，镜片组到芯片距离需要减小。定倍镜头放大倍数已知，工作距离已知，安
关于光源的明场和暗场照明 InvokeLife 机器视觉光源
明场：光源与被测物成一定角度，使得绝大部分的光反射到摄像机，我们称作明场照明[1]。暗场：光源位置使得大部分的光没有反射到摄像机，仅仅将照射到被测物的特定部分的光反射到摄像机，我们称此种照明为暗场照明[1]。如下，明场和暗场的示意图[2]。根据直射、漫射，以及正面背面还可以再分。未完待续。[1]《机器视觉算法与应用》第二版[2]《默然光源选型手册》
机器视觉-4 检测原理之OpenCV Blob特征检测 dingkm666 机器视觉计算机视觉人工智能深度学习
在OpenCV中，BLOB（BinaryLargeOBjects）检测是一种用于识别和分析二值图像中连通区域的技术。OpenCV提供了专门的工具类SimpleBlobDetector来帮助实现这一功能。以下是关于OpenCV中BLOB检测的详细说明，包括其原理、使用方法和应用场景。一.什么是BLOB？在图像处理的背景下，BLOB指的是图像中颜色一致且连接在一起的像素区域。在二值图像中，这些区域通常
机器视觉-1 常用的机器视觉开发库 dingkm666 机器视觉机器学习
机器视觉-1常用的机器视觉开发库前言：工欲善其事必先利其器，选择一个合适的视觉开发库是在机器视觉领域的发展的重要基础。1.OpenCV（OpenSourceComputerVisionLibrary）简介:OpenCV是最著名和最广泛使用的开源计算机视觉库之一。由Intel于1999年开发，目前由OpenCV.org维护，支持C++、Python、Java和MATLAB等多种编程语言。功能:图像处
工业相机参数之帧率相关知识详解小白学视觉人工智能 java python 计算机视觉编程语言
点击上方“小白学视觉”，选择加"星标"或“置顶”重磅干货，第一时间送达工业相机是机器视觉系统的重要组成部分之一,在机器视觉系统中有着非常重要的作用。工业相机已经被广泛应用于工业生产线在线检测、智能交通,机器视觉,科研,军事科学,航天航空等众多领域。工业相机的主要参数包括:分辨率、帧率、像素、像元尺寸、光谱响应特性等。下面我们来对工业相机帧率的相关知识进行讲解:帧率(Framerate)是用于测量显
机器视觉按需求选择工业相机的方法鸦芽_hujiamei 图像处理机器视觉机器视觉相机选择
信号工业相机的信号类型有模拟信号和数字信号两种。模拟相机必须有图像采集卡，标准的模拟相机分辨率很低，采集到的是模拟信号，经数字采集卡转换为数字信号进行传输存储。工业数字相机采集到的是数字信号，数字信号不受电噪声影响，因此，数字相机的动态范围更高，能够向计算机传输更精确的信号。分辨率根据具体需求来选择相机分辨率的大小，如果一个像素对应一个缺陷的话，那么这样的系统一定会极不稳定，所以我们为了提高系统的
工业相机测长仪的组成部分蓝鹏测控自动化制造其他
关键字:工业相机测长仪,高精度测长仪,视觉测量系统,蓝鹏测控测长仪,工业测长仪,本文介绍了蓝鹏测控公司机器视觉业务测长仪的核心产品及技术特点，主要涵盖相机部分、相机防护系统、补光系统和软件部分。（一）相机部分我司的机器视觉业务聚焦工业视觉传感应用，专注光学技术、嵌入式硬件技术和底层算法软件，为客户提供领先的机器视觉硬件产品和算法平台。公司拥有成熟的研发及质量管控体系，从设计源头确保每一款产品的高品
视觉系统的革新：嵌入式AI摄像头 7aa5938c2f5f
学号：17050610006姓名：韦运泽文章链接：https://mp.weixin.qq.com/s/VzuM-ewcCu88D7nYjeE3BQ功能强大的精简型单板计算机的推出带动了一些新产品的设计，在通过小型化优化成本及效率的应用中，它的效用尤为明显。另外，视觉系统可以利用功能全面的板级机器视觉摄像头进一步缩小产品总体尺寸并实现运行灵活性，同时还支持定制或非标准光学部件。它们被用于：医疗诊断
国内十大AGV厂家排行互联网之声人工智能大数据
国内agv机器人公司排名1.海康机器人成立时间：2016年4月20日海康机器人成立于2016年。杭州的一家机器人技术公司主要从事移动机器人、机器视觉、无人机等领域的业务。到目前为止，它还拥有许多专利产品，并一直为世界提供许多相应的产品和结局计划。2.坤厚机器人成立时间：坤厚自动化科技有限公司成立于2015年，从成立至今申请了多项发明及实用新型专利，并且拥有国内领先的AGV技术，紧密结合市场应用需求
什么是计算机视觉？龙腾AI 计算机视觉人工智能自然语言处理深度学习 ai
计算机视觉概述计算机视觉（ComputerVision）又称机器视觉（MachineVision），是一门让机器学会如何去“看”的学科，是深度学习技术的一个重要应用领域，被广泛应用到安防、工业质检和自动驾驶等场景。具体的说，就是让机器去识别摄像机拍摄的图片或视频中的物体，检测出物体所在的位置，并对目标物体进行跟踪，从而理解并描述出图片或视频里的场景和故事，以此来模拟人脑视觉系统。因此，计算机视觉也
嵌入式机器视觉的流水线分拣机器人：OpenCV、 FreeRTOS、 TensorFlow（代码详解）极客小张机器人 opencv tensorflow stm32 系统架构计算机视觉物联网
一、项目概述在现代自动化生产中，分拣机器人作为提高生产效率和准确度的重要工具，正逐渐成为工业流水线的核心组成部分。本项目旨在设计一款基于嵌入式机器视觉的流水线分拣机器人，通过高效的图像处理与实时控制技术，实现对物品的快速识别与自动分拣。该项目的主要目标包括：提高分拣精度：通过高效的机器视觉算法，确保机器人能够准确识别不同类型的物品。提升作业效率：利用实时操作系统和嵌入式AI推理引擎，实现快速响应与
简述Ifocus自动对焦模块 51camera 机器视觉视觉检测视觉系统
在2024上海机器视觉展中，51camera的合作厂商iCore展出的自动对焦模块吸引不少观众驻足，那么什么是自动对焦呢？顾名思义，是指被测物的成像平面偏离了镜头的焦距范围，导致成像模糊，利用辅助装置可使成像平面重新回到镜头最佳焦距范围。自动对焦的作用？首先我们先了解一下“景深”，景深（DepthofField,DOF）是关于空间中可以清晰成像的距离范围，镜头对焦面物体拍摄时，背景虚化，对焦背景时
iLight混合点光源激光与LED技术的结合 51camera LED光源视觉系统视觉检测
51camera机器视觉产品资料查询平台的光源种类比较丰富，今天我们一起来看看其合作厂商iCore的明星产品iLight混合点光源，该产品提供了比LED更高的亮度，作为传统LED和氙气灯的替代品，它将激光和LED技术的结合，提供了长达10,000小时的寿命，没有氙气灯短寿命和亮度波动的缺点。iLight混合光系统由一个大功率光源控制器和一个专门为机器视觉应用设计的混合光组成。它具有高速控制和高效运
加速自动驾驶模型迭代，数据存算一体是关键 virtaitech OrionX 自动驾驶人工智能机器学习 AI AI算力资源池化科技 OrionX
自动驾驶的每一个业务阶段都会涉及到AI深度学习算法和算力的参与，机器视觉，深度学习，传感器技术等均在自动驾驶领域发挥着重要的作用。自动驾驶系统不断迭代的前提是算法的持续优化，目前，自动驾驶发展的瓶颈主要在于AI底层技术和AI算力发展水平上能否实现突破。近日，焱融高性能分布式文件存储系统YRCloudFile联合趋动科技OrionXAI算力资源池化软件与GeminiAI开发训练平台，共同打造自动驾驶
大创项目推荐深度学习 opencv python 公式识别(图像识别机器视觉) laafeer python
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
软件杯深度学习 opencv python 公式识别(图像识别机器视觉) Mr.D学长 python java
文章目录0前言1课题说明2效果展示3具体实现4关键代码实现5算法综合效果6最后0前言优质竞赛项目系列，今天要分享的是基于深度学习的数学公式识别算法实现该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：4分创新点：4分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题
计算机设计大赛行人重识别(person reid) - 机器视觉深度学习 opencv python iuerfee python
文章目录0前言1技术背景2技术介绍3重识别技术实现3.1数据集3.2PersonREID3.2.1算法原理3.2.2算法流程图4实现效果5部分代码6最后0前言优质竞赛项目系列，今天要分享的是深度学习行人重识别(personreid)系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目分享：https:
挑战杯基于设深度学习的人脸性别年龄识别系统 laafeer python
文章目录0前言1课题描述2实现效果3算法实现原理3.1数据集3.2深度学习识别算法3.3特征提取主干网络3.4总体实现流程4具体实现4.1预训练数据格式4.2部分实现代码5最后0前言优质竞赛项目系列，今天要分享的是基于深度学习机器视觉的人脸性别年龄识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/po
互联网加竞赛机器视觉目标检测 - opencv 深度学习 Mr.D学长 python java
文章目录0前言2目标检测概念3目标分类、定位、检测示例4传统目标检测5两类目标检测算法5.1相关研究5.1.1选择性搜索5.1.2OverFeat5.2基于区域提名的方法5.2.1R-CNN5.2.2SPP-net5.2.3FastR-CNN5.3端到端的方法YOLOSSD6人体检测结果7最后0前言优质竞赛项目系列，今天要分享的是机器视觉opencv深度学习目标检测该项目较为新颖，适合作为竞赛课题
挑战杯基于机器视觉的图像拼接算法 laafeer python
前言图像拼接在实际的应用场景很广，比如无人机航拍，遥感图像等等，图像拼接是进一步做图像理解基础步骤，拼接效果的好坏直接影响接下来的工作，所以一个好的图像拼接算法非常重要。再举一个身边的例子吧，你用你的手机对某一场景拍照，但是你没有办法一次将所有你要拍的景物全部拍下来，所以你对该场景从左往右依次拍了好几张图，来把你要拍的所有景物记录下来。那么我们能不能把这些图像拼接成一个大图呢？这是一个较为新颖的竞
挑战杯基于机器视觉的火车票识别系统 laafeer python
文章目录0前言1课题意义课题难点：2实现方法2.1图像预处理2.2字符分割2.3字符识别部分实现代码3实现效果最后0前言优质竞赛项目系列，今天要分享的是基于机器视觉的火车票识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1课题意义目前火车乘务员在卧铺旅客在上车前为其提供将火车
挑战杯基于机器视觉的二维码识别检测 - opencv 二维码识别检测机器视觉 laafeer python
文章目录0简介1二维码检测2算法实现流程3特征提取4特征分类5后处理6代码实现5最后0简介优质竞赛项目系列，今天要分享的是基于机器学习的二维码识别检测-opencv二维码识别检测机器视觉该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1二维码检测物体检测就是对数字图像中一类特定的物体
计算机设计大赛深度学习人体跌倒检测 -yolo 机器视觉 opencv python iuerfee python
0前言优质竞赛项目系列，今天要分享的是**基于深度学习的人体跌倒检测算法研究与实现**该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：5分更多资料,项目分享：https://gitee.com/dancheng-senior/postgraduate1.前言人体跌倒是人们日常生活中常见姿态之一，且跌倒的发生具有随机、难
计算机设计大赛深度学习人脸表情识别算法 - opencv python 机器视觉 iuerfee python
文章目录0前言1技术介绍1.1技术概括1.2目前表情识别实现技术2实现效果3深度学习表情识别实现过程3.1网络架构3.2数据3.3实现流程3.4部分实现代码4最后0前言优质竞赛项目系列，今天要分享的是深度学习人脸表情识别系统该项目较为新颖，适合作为竞赛课题方向，学长非常推荐！学长这里给一个题目综合评分(每项满分5分)难度系数：3分工作量：3分创新点：4分更多资料,项目分享：https://gite
巡检机器人与机器视觉的融合：巡检运维的未来趋势超维机器人机器人运维人工智能大数据计算机视觉
2023世界机器人大会的数据显示，中国工业机器人装机量已经占据了全球市场的超过50%的比重，成为全球最大的工业机器人市场。巡检机器人作为一种高度复杂的自动化装置，被广泛应用于工业领域，能实现各种工业场景下智能巡检运维，推动传统产业智能化改造和数字化转型；因其在智能巡检运维领域占据重要地位，被誉为“皇冠上的明珠”。机器视觉技术使得智能巡检机器人能够自动检测目标物体、识别设备状态、发现异常情况，并采取
多线程编程之理财周凡杨 java 多线程生产者消费者理财
现实生活中，我们一边工作，一边消费，正常情况下会把多余的钱存起来，比如存到余额宝，还可以多挣点钱，现在就有这个情况：我每月可以发工资20000万元（暂定每月的1号），每月消费5000（租房+生活费）元（暂定每月的1号），其中租金是大头占90%，交房租的方式可以选择（一月一交，两月一交、三月一交），理财：1万元存余额宝一天可以赚1元钱，
[Zookeeper学习笔记之三]Zookeeper会话超时机制 bit1129 zookeeper
首先，会话超时是由Zookeeper服务端通知客户端会话已经超时，客户端不能自行决定会话已经超时，不过客户端可以通过调用Zookeeper.close()主动的发起会话结束请求，如下的代码输出内容 Created /zoo-739160015 CONNECTEDCONNECTED .............CONNECTEDCONNECTED CONNECTEDCLOSEDCLOSED
SecureCRT快捷键 daizj secureCRT 快捷键
ctrl + a : 移动光标到行首ctrl + e ：移动光标到行尾crtl + b: 光标前移1个字符crtl + f: 光标后移1个字符crtl + h : 删除光标之前的一个字符ctrl + d ：删除光标之后的一个字符crtl + k ：删除光标到行尾所有字符crtl + u : 删除光标至行首所有字符crtl + w: 删除光标至行首
Java 子类与父类这间的转换周凡杨 java 父类与子类的转换
最近同事调的一个服务报错，查看后是日期之间转换出的问题。代码里是把 java.sql.Date 类型的对象强制转换为 java.sql.Timestamp 类型的对象。报java.lang.ClassCastException。代码：
可视化swing界面编辑朱辉辉33 eclipse swing
今天发现了一个WindowBuilder插件，功能好强大，啊哈哈，从此告别手动编辑swing界面代码，直接像VB那样编辑界面，代码会自动生成。首先在Eclipse中点击help，选择Install New Software,然后在Work with中输入WindowBui
web报表工具FineReport常用函数的用法总结（文本函数）老A不折腾 finereport web报表工具报表软件 java报表
文本函数 CHAR CHAR(number):根据指定数字返回对应的字符。CHAR函数可将计算机其他类型的数字代码转换为字符。 Number:用于指定字符的数字，介于1Number:用于指定字符的数字，介于165535之间（包括1和65535）。示例: CHAR(88)等于“X”。 CHAR(45)等于“-”。 CODE CODE(text):计算文本串中第一个字
mysql安装出错林鹤霄 mysql安装
[root@localhost ~]# rpm -ivh MySQL-server-5.5.24-1.linux2.6.x86_64.rpm Preparing... #####################
linux下编译libuv aigo libuv
下载最新版本的libuv源码，解压后执行： ./autogen.sh 这时会提醒找不到automake命令，通过一下命令执行安装（redhat系用yum，Debian系用apt-get）： # yum -y install automake # yum -y install libtool 如果提示错误：make: *** No targe
中国行政区数据及三级联动菜单 alxw4616
近期做项目需要三级联动菜单,上网查了半天竟然没有发现一个能直接用的! 呵呵,都要自己填数据....我了个去这东西麻烦就麻烦的数据上. 哎,自己没办法动手写吧. 现将这些数据共享出了,以方便大家.嗯,代码也可以直接使用文件说明 lib\area.sql -- 县及县以上行政区划分代码（截止2013年8月31日)来源：国家统计局发布时间：2014-01-17 15:0
哈夫曼加密文件百合不是茶哈夫曼压缩哈夫曼加密二叉树
在上一篇介绍过哈夫曼编码的基础知识,下面就直接介绍使用哈夫曼编码怎么来做文件加密或者压缩与解压的软件,对于新手来是有点难度的,主要还是要理清楚步骤; 加密步骤: 1,统计文件中字节出现的次数,作为权值 2,创建节点和哈夫曼树 3,得到每个子节点01串 4,使用哈夫曼编码表示每个字节
JDK1.5 Cyclicbarrier实例 bijian1013 java thread java多线程 Cyclicbarrier
CyclicBarrier类一个同步辅助类，它允许一组线程互相等待，直到到达某个公共屏障点 (common barrier point)。在涉及一组固定大小的线程的程序中，这些线程必须不时地互相等待，此时 CyclicBarrier 很有用。因为该 barrier 在释放等待线程后可以重用，所以称它为循环的 barrier。 CyclicBarrier支持一个可选的 Runnable 命令，
九项重要的职业规划 bijian1013 工作学习
一. 学习的步伐不停止古人说，活到老，学到老。终身学习应该是您的座右铭。世界在不断变化，每个人都在寻找各自的事业途径。您只有保证了足够的技能储
【Java范型四】范型方法 bit1129 java
范型参数不仅仅可以用于类型的声明上，例如 package com.tom.lang.generics; import java.util.List; public class Generics<T> { private T value; public Generics(T value) { this.value =
【Hadoop十三】HDFS Java API基本操作 bit1129 hadoop
package com.examples.hadoop; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FileStatus; import org.apache.hadoo
ua实现split字符串分隔 ronin47 lua split
LUA并不象其它许多"大而全"的语言那样，包括很多功能，比如网络通讯、图形界面等。但是LUA可以很容易地被扩展：由宿主语言(通常是C或 C++)提供这些功能，LUA可以使用它们，就像是本来就内置的功能一样。LUA只包括一个精简的核心和最基本的库。这使得LUA体积小、启动速度快，从而适合嵌入在别的程序里。因此在lua中并没有其他语言那样多的系统函数。习惯了其他语言的字符串分割函
java-从先序遍历和中序遍历重建二叉树 bylijinnan java
public class BuildTreePreOrderInOrder { /** * Build Binary Tree from PreOrder and InOrder * _______7______ / \ __10__ ___2 / \ / 4
openfire开发指南《连接和登陆》开窍的石头 openfire 开发指南 smack
第一步官网下载smack.jar包下载地址：http://www.igniterealtime.org/downloads/index.jsp#smack 第二步把smack里边的jar导入你新建的java项目中开始编写smack连接openfire代码 p
[移动通讯]手机后盖应该按需要能够随时开启 comsci 移动
看到新的手机，很多由金属材质做的外壳，内存和闪存容量越来越大，CPU速度越来越快，对于这些改进，我们非常高兴，也非常欢迎但是，对于手机的新设计，有几点我们也要注意第一：手机的后盖应该能够被用户自行取下来，手机的电池的可更换性应该是必须保留的设计,
20款国外知名的php开源cms系统 cuiyadll cms
内容管理系统，简称CMS，是一种简易的发布和管理新闻的程序。用户可以在后端管理系统中发布，编辑和删除文章，即使您不需要懂得HTML和其他脚本语言，这就是CMS的优点。在这里我决定介绍20款目前国外市面上最流行的开源的PHP内容管理系统，以便没有PHP知识的读者也可以通过国外内容管理系统建立自己的网站。 1. Wordpress WordPress的是一个功能强大且易于使用的内容管
Java生成全局唯一标识符 darrenzhu java uuid unique identifier id
How to generate a globally unique identifier in Java http://stackoverflow.com/questions/21536572/generate-unique-id-in-java-to-label-groups-of-related-entries-in-a-log http://stackoverflow
php安装模块检测是否已安装过, 使用的SQL语句 dcj3sjt126com sql
SHOW [FULL] TABLES [FROM db_name] [LIKE 'pattern'] SHOW TABLES列举了给定数据库中的非TEMPORARY表。您也可以使用mysqlshow db_name命令得到此清单。本命令也列举数据库中的其它视图。支持FULL修改符，这样SHOW FULL TABLES就可以显示第二个输出列。对于一个表，第二列的值为BASE T
5天学会一种 web 开发框架 dcj3sjt126com Web 框架 framework
web framework层出不穷，特别是ruby/python,各有10+个,php/java也是一大堆根据我自己的经验写了一个to do list,按照这个清单，一条一条的学习，事半功倍，很快就能掌握一共25条，即便很磨蹭，2小时也能搞定一条，25*2=50。只需要50小时就能掌握任意一种web框架各类web框架大同小异:现代web开发框架的6大元素，把握主线，就不会迷路建议把本文
Gson使用三(Map集合的处理,一对多处理) eksliang json gson Gson map Gson 集合处理
转载请出自出处：http://eksliang.iteye.com/blog/2175532 一、概述 Map保存的是键值对的形式，Json的格式也是键值对的，所以正常情况下，map跟json之间的转换应当是理所当然的事情。二、Map参考实例 package com.ickes.json; import java.lang.refl
cordova实现“再点击一次退出”效果 gundumw100 android
基本的写法如下： document.addEventListener("deviceready", onDeviceReady, false); function onDeviceReady() { //navigator.splashscreen.hide(); document.addEventListener("b
openldap configuration leaning note iwindyforest configuration
hostname // to display the computer name hostname <changed name> // to change go to: /etc/sysconfig/network, add/modify HOSTNAME=NEWNAME to change permenately dont forget to change /etc/hosts
Nullability and Objective-C 啸笑天 Objective-C
https://developer.apple.com/swift/blog/?id=25 http://www.cocoachina.com/ios/20150601/11989.html http://blog.csdn.net/zhangao0086/article/details/44409913 http://blog.sunnyxx
jsp中实现参数隐藏的两种方法 macroli JavaScript jsp
在一个JSP页面有一个链接，//确定是一个链接?点击弹出一个页面，需要传给这个页面一些参数。//正常的方法是设置弹出页面的src="***.do?p1=aaa&p2=bbb&p3=ccc"//确定目标URL是Action来处理?但是这样会在页面上看到传过来的参数，可能会不安全。要求实现src="***.do"，参数通过其他方法传！//////
Bootstrap A标签关闭modal并打开新的链接解决方案 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
Bootstrap里面的js modal控件使用起来很方便，关闭也很简单。只需添加标签 data-dismiss="modal" 即可。可是偏偏有时候需要a标签既要关闭modal，有要打开新的链接，尝试多种方法未果。只好使用原始js来控制。 <a href="#/group-buy" class="btn bt
二维数组在Java和C中的区别流淚的芥末 java c 二维数组数组
Java代码： public class test03 { public static void main(String[] args) { int[][] a = {{1},{2,3},{4,5,6}}; System.out.println(a[0][1]); } } 运行结果： Exception in thread "mai
systemctl命令用法 wmlJava linux systemctl
对比表，以 apache / httpd 为例任务旧指令新指令使某服务自动启动 chkconfig --level 3 httpd on systemctl enable httpd.service 使某服务不自动启动 chkconfig --level 3 httpd off systemctl disable httpd.service 检查服务状态 service h