我是一个对称矩阵

MicroNet: Improving Image Recognition with Extremely Low FLOPs--Yunsheng Li

0、摘要
1、引入
2、相关工作
3、Micro-Factorized Convolution
- 3.1 Micro-Factorized Pointwise Convolution
- 3.2 Micro-Factorized Depthwise Convolution
4、Dynamic Shift-Max
- 4.1 通道打乱
- 4.2 两组权重怎么来？
- 4.3 融合
5、MicroNet
- 5.1 Micro-Blocks
- 5.2 结构
- 5.3 之前的相关工作（直接翻译的）
6、实验
- 6.1 ImageNet Classification
- - 6.1.1 消融实验
  - 6.1.2 与先前的网络比较
  - 6.1.3 推理延迟
  - 6.1.4 讨论
7、总结

本文重点解决在极低FLOPs条件下设计准确率更高的网络，通过Micro-Factorized Convolution在保证节点连接性条件下减低计算量，通过Dynamic Shift-Max激活函数加强通道间的联系，改善非线性，以弥补网络不能太深所带来的缺陷。

通过实验看出MicroNet比MobileNetV3等轻量化网络不经拥有更低的FLOPs，而且在精度上的提升非常巨大。

0、摘要

面临的问题：
本文旨在解决在极低计算量条件下性能下降的问题（比如在ImageNet分类使用5MFLOPs）。

依据：
我们发现sparse connectivity（稀疏连通）和dynamic activation function（动态激活函数）对提高精度是有效的，前者避免了网络宽度的显著减小，后者缓解了网络深度减小的不利影响。

解决办法：
所以我们提出了micro-factorized convolution（微因式分解卷积），它将卷积矩阵分解成低阶矩阵，将稀疏连通性融入卷积中。我们还提出了一种新的动态激活函数，称为Dynamic Shift Max，通过最大限度地利用输入特征映射与其圆形通道位移之间地多个动态融合来改善非线性（“via maxing out multiple dynamic fusions between an input feature map and its circular channel shift”）。

效果：
基于这两个新算子，我们得到了一类称为MicroNet的网络，该网络在低FLOP领域下取得了显著的性能提升，比如在12MFLOPs的约束下，MicroNet在ImageNet分类上达到了59.4%的Top1准确率，比MobileNetV3高出了9.6%，代码开源在：MicroNet

1、引入

最近在CNN方面的进展将ImageNet分类的计算成本从3.8G FLOPs降低了两个数量级到约40M FLOPs（比如MobileNet、ShuffleNet），同时性能下降也比较合理（轻量级在精度上肯定有下降，但是能够接受）。
但是当进一步降低计算成本是，性能就出现了显著下降，以MobileNetV3为例，当计算成本从44M下降到21M和12M MAdds时，Top1准确率分别从65.4%下降到58.0%和49.8%

在本文中，我们旨在从21M降低到4M MAdds这样的极端低FLOP条件下提高精度，这标志着计算成本降低到了新的数量级（原来是G到40M，现在从40M到4M）

考虑到2.7M Madds计算资源被stem layer层（1个输入3通道，输出8通道，stride=2的3x3卷积，且作用在112x112的网格上）消耗了，设计一个极低的预算计算成本（4M~21M FLOPs）的网络非常具有挑战性。剩余的计算资源太有限，无法设计有效分类所需要的卷积层和1000类分类器。

如图1，如MobileNet或ShuffleNet等普通的减少网络跨度或深度的策略，会导致严重的性能下降。

注意，我们的重点是设计新的操作符上，输入分辨率固定为224x224，预算为4M FLOPs。
本文从node connectivity（节点连通性）和与网络宽度和深度相关的non-linearity（非线性）两个角度来处理极低FLOPs。首先我们证明了降低节点连通性来扩大网络宽度对于给定计算预算是一个很好的权衡。其次我们依靠改进的层非线性来补偿减小的网络深度。这两个因素促使设计更高效的卷积和激活函数。
（总之就是，计算资源预算低，所以网络不能太宽和太深，但是通过高效的卷积可以在控制计算资源时扩宽宽度，通过激活函数弥补网路太浅的缺陷）

对于高效卷积，我们提出了一种为MF-Conv (Micro-Factorized convolution)将逐点卷积（pointwise conv)分解为两组卷积层，其中分组数量G是根据通道数C自适应计算得到：
$G=\sqrt{C/R}$
$R$ 代表通道压缩率，我们可以通过该超参数来控制想要压缩的倍数，而分组数根据C和R自适应计算出分组数。如3.1节分析的，对于给定的计算成本，该公式在通道数量和节点连接性之间实现了良好的折衷。

对于非线性方面，我们提出了一种新的激活函数DY-Shift-Max，它将通道与动态系数进行非线性融合。这个新的激活会迫使网络去学习使用适应于输入的系数，来混合输入特征图中不同的circular channel shifts，并在这些融合中选择最好的。结果表明该方法以极小的计算代价提高了组分解的表征能力。

基于这两种新算子（MF-Conv 和DY-Shift-Max）得到了MicroNet家族。图1中展示了在ImageNet上的性能，MicroNet远超SOTA水平，特别是在12M和22M FLOPs的MicroNet在top1准确率上分别比MobileNetV3高出了9.6%和4.5%。对于极端的6M FLOPs，MicroNet实现了51.4%的top1精度，比MobileNetV3（12M FLOPs版本）高出了1.6%。

尽管MicroNet是为理论上FLOPs而手动设计的，但它在边缘设备上的快速推理性能优于MobileNetV3(基于推理延迟)。此外，我们的MicroNet在对象检测和关键点检测方面优于MobileNetV3，但计算成本大大低于MobileNetV3。

2、相关工作

略

3、Micro-Factorized Convolution

MFConv的目的是优化平衡通道数和节点连接性。每层的连接性E定义为每个输出节点的路径数，一条路径连接输入和输出节点。比如下图输入通道12，输出通道6，每一根线就代表一条路径，这些线的代表节点连接性。

3.1 Micro-Factorized Pointwise Convolution

这部分就是将MFConv用于逐点卷积pointwise conv。因为在轻量化卷积神经网络中深度可分离卷积出场率很高，而深度可分离卷积中pointwise conv占的计算量很大（比如ShufllNet中就是使用分组卷积优化pointwise conv进一步降低计算量）

首先来看看Micro-Factorized Pointwise Convolution是如何实现了（个人感觉就是对称的分组卷积，中间是Channel Shuffle）

首先，作者提出使用组自适应卷积来分解一个pointwise卷积（实际上就是对pointwise卷积改为分组卷积，在ShuffleNet中就是如此，不过本文新增自适应组数功能）。为了简洁起见，假设输入通道=输出通道= $C$ ，忽略bias。

卷积核矩阵 $W$ 被分解为两个组自适应卷积，其中组数根据通道数 $C$ 和压缩率 $R$ 计算得到：
$W=PΦQ^T，$
其中 $W$ 是 $C * C$ 矩阵， $Q$ 是一个 $C * C / R$ 矩阵，它将通道数压缩 $R$ 倍， $P$ 是一个 $C * C / R$ 矩阵，它将通道数扩展回 $C$ 。 $P$ 和 $Q$ 是带有 $G$ 块的对角矩阵（因为分成了 $G$ 组），每个块都一个小组卷积。 $Q$ 是一个 $C / R * C / R$ 的排列矩阵，实现通道混洗功能，其混洗顺序和ShuffleNet中一样。分解层的计算复杂度 $O=\frac{2C^2}{RG}$ 。图2左边展示了分组的样例，图中 $C$ =18， $R = 2$ ， $G = 3$

对于Micro-Factorized Pointwise Convolution的理解，下图是按照个人理解画的图，个人感觉就是ShuffleNet的优化，ShuffleNet也是针对1x1卷积的大计算量优化的，使用的是针对1x1卷积的分组卷积+Channel Shuffle，ShuffleNet论文可以看ShuffleNet: An Extremely Efficient Convolutional Neural Network for Mobile Devices–Xiangyu Zhang

从计算量来看，如果使用分组卷积（分三组），那么通路有 $6 * 6 * 3 = 108$ ，卷积核18个，但是分组卷积使用的卷积核为 $1 * 1 * 6$

下面图中红色是普通卷积的连接方式。

从参数量来对比（就是路径数，MFConv中卷的直连和Channel Shuffle不算）：

普通卷积：共有 $18 * 18 = 324$ 个参数
分组卷积：共有 $6 * 6 * 3 = 108$ 个参数
Micro-Factorized Pointwise Convolution：共有 $6 * 9 + 3 * 18 = 108$

似乎Micro-Factorized Pointwise Convolution和分组卷积差不了多少，但是Micro-Factorized Pointwise Convolution的优势在于使用同样的参数量增强了特征提取能力。从下文可以看出Micro-Factorized Pointwise Convolution实现了每个输出都和每个输入节点有“连接”，而分组卷积要实现这种功能，需要在Group Conv+Channel Shuffle的后面再来一次卷积，从而再次增加参数量。
（个人感觉在“连接”能力上Micro-Factorized Pointwise Convolution=Group Conv+Channel Shuffle+Conv，而参数量Micro-Factorized Pointwise Convolution=Group Conv+Channel Shuffle）

中间 $Φ$ 表示为隐藏通道，分组操作限制了 $Φ$ 的通道数，每个 $Φ$ 通道和 $\frac{C}{G}$ 个输入通道连接，每个输出通道和 $\frac{C}{RG}$ 个 $Φ$ 通道连接。每个输出节点的“输入-输出”连接性 $E=\frac{C^2}{RG^2}$ ，计算示意图如下图。

当计算成本预算 $O=\frac{2C^2}{RG}$ 和压缩因子R固定时，通道数C和连接性E会随着G变化：
$C=\sqrt{\frac{ORG}{2}}，E=\frac{O}{2G}$

如图3所示，当分组数G和通道数C增加时，连接性E会降低，当两个曲线相交时（C=E）（交点代表平衡，最好的折衷）：
$G=\sqrt{\frac{C}{R}}，（3）$
以上便是自适应分组的理论依据，推导出自适应公式为上面这个

3.2 Micro-Factorized Depthwise Convolution

这部分是将MFConv应用于depthwiseConv。

图2中间部分展示micro-factorization是如何被应用到kxk的depthwise卷积上的。这个卷积核被因式分解为kx1和1xk卷积核上，每个通道 $k * k$ 核矩阵 $W$ ，向量 $P$ 为 $k * 1$ ，向量 $Q^T$ 为 $1 * k$ ， $Φ$ 是一个标量=1，被分解后计算复杂度从 $O(k^2C)$ 降低到 $O (k C)$ 。

结合Micro-Factorized Pointwise Convolution和Micro-Factorized Depthwise Convolution： 这两种MFConv可以用两种不同方法结合：1）常规组合；2）精简组合。

常规组合就是简单将两种卷积组合起来。

精简组合如图2右图，使用Micro-Factorized Depthwise Convolution，通过为每个通道应用多个空间滤波器扩展通道数。然后应用一个自适应组卷积（group-adaptive convolution）来融合和压缩通道数。与常规组合相比，它通过节省通道融合（Pointwise )计算，花费了更多的资源在学习空间滤波器上(Depthwise），实验证明，这对实现较低FLOPs的网络层是更有效的。

（首先每个节点就是一个通道图，其大小为 $W * H$ ，上面个人认为在蓝色部分，为每个通道应用两个卷积核，每个卷积核被分解为向量，就有两个行向量和两个列向量，从而最后通道扩大4倍。在灰色部分就是Micro-Factorized Pointwise Convolution的前部分，就是分组卷积，数组自适应而已）

4、Dynamic Shift-Max

到目前为止，我们已经讨论了有效的静态网络的设计，它不根据输入改变其权重（？）。我们现在介绍动态移位极大(DY-ShiftMax)，这是一种加强通过micro-factorization创建的group之间的联系的动态非线性。这对于聚焦组内连接性的Micro-Factorized pointwise convolution起到了补充（加强）作用。

设 $x={x_i}(i=1,...,C)$ 表示一个输入vector（或tensor），然后通道 $C$ 会倍分成 $G$ 组，每个 $G$ 有 $\frac{C}{G}$ 个通道。

$x$ 的第 $j$ 组的circular shift（shifting $j\frac{C}{G}通道$ ）表示为向量 $\hat {x}^j_i=x_{(i+j\frac{C}{G})mod C}$ 。

Dynamic Shift-Max将输出K个混合的最大值，多组（ $J$ ）位移如下组合（each of which combines multiple (J) group shifts as:）

$a^k_{i,j}(x)$ 是动态权重，动态是因为依赖于输入 $x$ ，由均值池化，两个全连接层和一个sigmoid层组成，就像是Squeeze-and-Excitation（SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size）。
$i$ ：第i通道
$j$ ：第j组

（一堆理论分析），当J=2和K=2时，分类性能和复杂度得到了很好的折衷

以下是根据论文和代码进行的分析

先给出代码（下方代码和解释都以输入输出通道=9，且分组=3为例）：

import torch
import torch.nn as nn


class h_sigmoid(nn.Module):
    def __init__(self, inplace=True, h_max=1):
        super(h_sigmoid, self).__init__()
        self.relu = nn.ReLU6(inplace=inplace)
        self.h_max = h_max / 6

    def forward(self, x):
        return self.relu(x + 3) * self.h_max


def _make_divisible(v, divisor, min_value=None):
    """
    This function is taken from the original tf repo.
    It ensures that all layers have a channel number that is divisible by 8
    It can be seen here:
    https://github.com/tensorflow/models/blob/master/research/slim/nets/mobilenet/mobilenet.py
    :param v:
    :param divisor:
    :param min_value:
    :return:
    """
    if min_value is None:
        min_value = divisor
    new_v = max(min_value, int(v + divisor / 2) // divisor * divisor)
    # Make sure that round down does not go down by more than 10%.
    if new_v < 0.9 * v:
        new_v += divisor
    return new_v


class DYShiftMax(nn.Module):
    """
    1）：对于通道间的交流实际上就是不同通道的融合，可以看self.index的产生就是将通道按一定顺序打乱
        比如初始x_out的通道顺序=[0,1,2,3,4,5,6,7,8]
        按顺序打乱的通道顺序x_2=[4,5,3,7,8,6,1,2,0]，可以画图看对于的顺序，有一定的规律
        然后将x_out和x_2按权重(a,b)融合，实际上就是（a*通道0+b*通道4）完成第一输出通道的融合，以此类推
    2）：上面提到了权重，本文中使用了两组权重(a1,b1)和(a2,b2)，就会得到两个融合特征图，使用max选择最大的那个融合特征图
        那么权重的来源是输入x经过pooling和fc扩大后，再分割生成2两组权重。
    一句话来讲就是x经过操作后生成两组权重，再将打乱后的特征图按两组权重融合，然后择取最大的作为输出。
    """

    def __init__(self, inp, oup, reduction=4, act_max=1.0, act_relu=True, init_a=[0.0, 0.0], init_b=[0.0, 0.0],
                 relu_before_pool=False, g=None, expansion=False):
        """

        :param inp: 输入通道数
        :param oup: 输出通道数（和输入通道数相同）
        :param reduction:
        :param act_max:
        :param act_relu:
        :param init_a:
        :param init_b:
        :param relu_before_pool:
        :param g: 分组数
        :param expansion:
        """
        # 以下参数注释都是 layer = DYShiftMax(inp=9, oup=9, act_max=2.0, act_relu=True, init_a=[1.0, 0.5], reduction=8,
        # init_b=[0.0, 0.5],g=(0, 3), expansion=False) 的值
        self.info = {"inp": inp,  # 9
                     "oup": oup,  # 9
                     "reduction": reduction,  # 8
                     "act_max": act_max,  # 2
                     "act_relu": act_relu,  # True
                     "init_a": init_a,  # [1.0, 0.5]
                     "init_b": init_b,  # [0.0, 0.5]
                     "relu_before_pool": relu_before_pool,  # False
                     "g": g,  # [0, 3]
                     "expansion": expansion}  # False
        super(DYShiftMax, self).__init__()
        self.oup = oup
        self.act_max = act_max * 2
        self.act_relu = act_relu
        self.avg_pool = nn.Sequential(
            nn.ReLU(inplace=True) if relu_before_pool == True else nn.Sequential(),
            nn.AdaptiveAvgPool2d(1)
        )

        self.exp = 4 if act_relu else 2
        self.init_a = init_a
        self.init_b = init_b

        # determine squeeze
        squeeze = _make_divisible(inp // reduction, 4)
        if squeeze < 4:
            squeeze = 4
        self.squeeze = squeeze  # 8
        self.fc = nn.Sequential(
            nn.Linear(inp, squeeze),  # inp=48
            nn.ReLU(inplace=True),
            nn.Linear(squeeze, oup * self.exp),  # oup=48 exp=4
            h_sigmoid()
        )
        if g is None:
            g = 1
        self.g = g[1]
        if self.g != 1 and expansion:
            self.g = inp // self.g
        # self.g=12  self.gc=4
        self.gc = inp // self.g
        index = torch.Tensor(range(inp)).view(1, inp, 1, 1)  # tensor([0,1,2,3,4,5,6,7,8])
        index = index.view(1, self.g, self.gc, 1, 1)  # shape=[1,3,3,1,1]
        indexgs = torch.split(index, [1, self.g - 1], dim=1)  # 在dim=1上划分为1:2,即得到shape为[1,1,3,1,1]和[1,2,3,1,1]的两个tensor
        indexgs = torch.cat((indexgs[1], indexgs[0]), dim=1)  # shape=[1,3,3,1,1]
        indexs = torch.split(indexgs, [1, self.gc - 1], dim=2)  # 在dim=1上划分为1:2,即得到shape为[1,3,1,1,1]和[1,3,2,1,1]的两个tensor
        indexs = torch.cat((indexs[1], indexs[0]), dim=2)

        self.index = indexs.view(inp).type(
            torch.LongTensor)  # shape=(9,)  tensor([4,5,3,7,8,6,1,2,0])  LongTensor：int64
        self.expansion = expansion

    def forward(self, x):  # x.shape=[1,9,56,56]
        x_in = x
        x_out = x

        b, c, _, _ = x_in.size()

        y = self.avg_pool(x_in).view(b, c)  # y.shape=[1,9]
        y = self.fc(y).view(b, self.oup * self.exp, 1, 1)
        y = (y - 0.5) * self.act_max  # act_max=4

        n2, c2, h2, w2 = x_out.size()
        x2 = x_out[:, self.index, :, :]  # 根据通道打乱后重新排列得到x2

        if self.exp == 4:
            # (a1,b1)和(a2,b2)是由x运算后得到了两组权重
            a1, b1, a2, b2 = torch.split(y, self.oup, dim=1)  # 将y分割得到两组权重，shape都=[1,9,1,1]
            a1 = a1 + self.init_a[0]
            a2 = a2 + self.init_a[1]
            b1 = b1 + self.init_b[0]
            b2 = b2 + self.init_b[1]

            z1 = x_out * a1 + x2 * b1
            z2 = x_out * a2 + x2 * b2

            out = torch.max(z1, z2)

        elif self.exp == 2:
            a1, b1 = torch.split(y, self.oup, dim=1)
            a1 = a1 + self.init_a[0]
            b1 = b1 + self.init_b[0]
            out = x_out * a1 + x2 * b1

        return out


layer = DYShiftMax(inp=9, oup=9, act_max=2.0, act_relu=True, init_a=[1.0, 0.5], reduction=8, init_b=[0.0, 0.5],
                   g=(0, 3), expansion=False)

x = torch.rand([1, 9, 56, 56], dtype=torch.float32)  # x.shape=[10,48,56,56]
output = layer(x)
print(output.shape)

代码看起来比较复杂，一些细节我也还没弄懂，但是抓住核心两个点：
1）通道打乱：就是将原通道顺序打乱，形成新的打乱张量
2）权重生成：通过输入张量x生成融合阶段所需要的权重
2）融合：原始输入和打乱的张量进行加权和融合，再通过max获取最大的作为输出

通道打乱如下图所示，这样就形成了 $x\_out$ 和 $x 2$ ，融合本质就是加权和，表示为：
$fuse=a*x\_out+b*x2$
在官方代码中，作者使用了两组权重，也就是会有两个融合，也就是代码中的：
$z1 = x\_out * a1 + x2 * b1$
$z2 = x\_out * a2 + x2 * b2$
然后从 $z 1 和 z 2$ 中选取融合特征最大的作为输出。

4.1 通道打乱

从上图可以看出当通道数为9，组数为3时的通道打乱的结果，但是是如何打乱的呢？

代码中是从index 到self.index变量这段代码就是在打乱通道顺序，也可以从下图可以看出，实际上就是将index张量切割-拼接-再切割-再拼接的过程，只不过前两步在dim=1上进行，后两步在dim=2上进行。

4.2 两组权重怎么来？

权重也就是代码中的y，可以看到y的流程：输入张量 $x\_in$ 经过avgpooling、fc等算子后得到新的y，此时y.shape=[1,36,1,1]，然后再通过a1, b1, a2, b2 = torch.split(y, self.oup, dim=1)将y划分为4个参数，也就是两组权重(a1,b1)和(a2,b2)，这四个参数的shape=[1,9,1,1]。

至此两组权重就产生了，实际上因为是根据输入张量生成的，输入不同权重也就不同，所以这也是该激活函数中动态的来源

4.3 融合

到这里就很简单了，通道打乱前后的张量有了，权重也有了，剩下的就是加权和：

# 通过两组权重生成两个融合特征
z1 = x_out * a1 + x2 * b1
z2 = x_out * a2 + x2 * b2

# 选择融合特征最大的作为输出
out = torch.max(z1, z2)

综合以上可以看到，Dynamic Shift-Max就是将通道打乱前后的特征图进行加权和，将本不属于同一组的特征进行了融合，从而加强了组间的连接。

而Dynamic Shift-Max的非线性表现在两方面：
1）输出K（这里也就是2组权重）个融合特征中的最大值（像ReLU就是max(0,x)，就具有非线性，只不过这里是max(fuse1,fuse2)而已）。
2）动态地根据输入张量来生成权重值，进行加权融合。

这两种操作增加了网络的表示能力，弥补了减少的层数所固有的损失。

5、MicroNet

基于以上我们设计的Micro-Factorized convolution和dynamic Shift-Max，构建了MocrioNet家族。

5.1 Micro-Blocks

MicroNet包含了三种Micro-Blocks，如图4所示，以不同的方法结合Micro-Factorized pointwise和depthwise convolutions。所有的Micro-Blocks都使用dynamic Shift-Max激活函数。

Micro-Factorized pointwise Conv和前文的形式一样，可以理解
而MF pointwise Conv半个（梯形）就是分组卷积
Micro-Factorized pointwise Conv可以通过几组1xk和kx1扩展通道数

Micro-Block-A：
Micro-Block-A如图4a，使用了Micro-Factorized pointwise 和depthwise convolutions构成的精简组合，在图2右可以看到。它使用MF depthwise conv扩展通道数，然后使用group-adaptive卷积压缩通道数。它最适合高分辨率（比如112x112或56x56）下的低网络层（应该是靠近输入端分辨率高，就适合使用这个块）

Micro-Block-B：
如图4b，用于连接Micro-Block-A和Micro-Block-C。不同于Micro-Block-A，它使用full Micro-Factorized pointwise convolution（包含两个group-adaptive conv）。因此，它同时压缩和扩展通道数。所有的MicroNet模型都有一个Micro-Block-B

Micro-Block-C：
如图4c是一个常规的Micro-Factorized depthwise and pointwise convolutions组合。它最适合更高的网络层（靠近输出端），因为与精简组合相比，它为channel fusion（pointwise）分配了更多的计算力。当输入和输出右相同维度时，使用skip connection。

每一个micro-block右三个超参数：核尺寸k，输出通道c，Micro-Factorized pointwise convolution的bottleneck的通道压缩因子R。注意分组数是由两个group-adaptive convolutions确定（见公式3）

5.2 结构

所有的模型为了优化FLOPs都是手动去设计的，没有使用NAS去搜索。因为在当前，FLOPs在所有硬件上相当于推理延迟。

我们提出了4个模型M0、M1、M2、M3，它们的计算成本分别为4M、6M、12M、21M MAdds。表1列出了他们完整结构

结合前面介绍的Micro-Blocks：Micro-A扩展通道再压缩，所以在输入端更适用，并且可能计算量（毕竟叫精简组合）更小，在输入端的分辨率高，所以使用精简组合能降低计算量。而Micro-C更注重通道融合，在后期通道更多，所以在输出端更适用。

（所以来讲，输入端分辨率高，为其设计计算量小的模型，而输出端通道多，为其设计加强通道连接的模块）

所有的模型都按以下方式来设计：

stem layer – Micro-Block-A – Micro-Block-B – Micro-Block-C。

网络的超参数基于这样的规则：R在模型中固定（M0中R=4，M1~3中R=6），通道C从low到high上升，深度从M0~M1也增加。对于最深的M3模型，我们在仅使用一个dynamic Shift-Max（在block后面的depthwise conv）。stem层包括一个3x1卷积和一个1x3组卷积，后面跟着一个ReLU激活函数。第二个卷积扩展了通道数。

5.3 之前的相关工作（直接翻译的）

（Micronet与最近的深度学习文献有各种联系，它与流行的MobileNet和ShuffleNet模型有关。它与MobileNet共享反向瓶颈结构，并与ShuffleNet共享分组卷积的使用。相反，微网在卷积和激活函数上都与这些模型不同，首先，它将逐点卷积分解为组自适应卷积，其组数G=√C/R是信道自适应的，并保证最小路径冗余。其次，它分解了深度卷积。第三，它依赖于一种新的激活函数Dynamic Shift-Max，以一种非线性和依赖于输入的方式来加强群的连通性。Dynamic ShiftMax本身推广了最近提出的动态REU(即，动态REU是J=1的特例，每个通道单独被激活)。）

6、实验

我们验证MicroNet在三个任务上：1）图像分类；2）目标检测；3）关键点检测。在下面的实验中，我们使用MobileNetV3指的是MobileNetV3-Small。

（个人兴趣问题，以下只总结图像分类的实验）

6.1 ImageNet Classification

我们首先评估四个MicroNet(M0-M3)对ImageNet分类的任务。ImageNet有1000个类别，其中1281,167个图像用于train，50,000个图像用于validation。

所有的模型都使用SGD（0.9momentum）优化器。图像分辨率为224x224。数据增强使用standard random cropping and flipping。我们使用mini-batch size=512，学习率=0.02（因为作者实验使用了多卡，而多卡数量和学习率存在倍数关系）。每个模型训练600epochs（使用cosine learning rate decay）。在M0、M1和M2中weight decay=3e-5，dropout rate=0.05。在M3中weight decay=4e-5，dropout rate=0.1。

6.1.1 消融实验

使用MicroNet-M2进行了几次消融实验。所有的模型训练300epoch，默认超参数DY-Shift-Max设置J=2，K=2.

From MobileNet to MicroNet：

表2展示了从MobileNet到MicroNet的路径

两者都有inverted bottleneck逆瓶颈层结构。修改MobileNetV2使其和MicroNet有相似的复杂性（MAdds）

分组数G：
Micro-Factorized pointwise convolution 包括了两个group adaptive卷积，而分组数根据 $\sqrt{\frac{C}{R}}$ 确定。表3a比较了相似结构和FLOPs（10.5MAdds）的网络，在固定分组和自适应组数的结果，可以看出自适应分组卷积得到了更高的精度，表明其在输入/输出连接和通道数量之间进行最佳权衡的重要性。

表3b比较了不同系数λ的影响： $G=λ\sqrt{\frac{C}{R}}$ ，更大的λ代表更多的通道但是更少的input/output连接性，可以看出最佳平衡是当λ在0.5到1之间。当λ从该最佳点（=1）增加(更多通道但连接更少)或降低(通道更少但连接更多)时，Top-1准确率会下降。（这里需要结合图3，从图三标题可以看到说的是固定计算成本O和R，那么随着分组数增加，通道数C就会增加，但是连接性E会降低）

Lite combination：

表3c比较了在不同层使用lite combination精简组合。发现精简组合在lower layers（靠近输入）层更加有效。与普通组合相比，它节省了通道融合(pointwise)的计算，以允许更多的空间过滤器(depthwise)。

激活函数：

Dynamic Shift-Max与之前的三个激活函数进行了比较：ReLU、SE+ReLU和动态ReLU。表4显示，Dynamic Shift-Max的性能明显优于这三种算法(至少2.5%)。

DY-Shift-Max的位置：
$A_1、A_2、A_3$ 分别代表图4中按顺序的蓝色激活函数模块位置（当然第一个只有 $A_1和A_2$ 两个位置）

DY-Shift-Max中的超参数：

6.1.2 与先前的网络比较

表7将MicroNet与最先进的模型进行了比较，后者的复杂性低于24M Flop。由于前人工作缺乏10M FLOPs预算内的结果，我们将流行的MobileNetV3分别使用宽度乘数0.2和0.15，扩展到6M和4M FLOPs作为基线。他们与MicroNet使用相同的训练配置。

带#表示MAdds一样，但参数量不一定相同。不带#表示参数量相同但是MAdds不一定相同。

6.1.3 推理延迟

我们在Intel® Xeon® CPU E5-2620 v4 (2.10GHz)设备上计算延迟，我们在单线程模型下测试了batchsize=1.测试了5000张224x224图像的平均推理延迟。

可以看出在有相同时延上MicroNet比MobileNetV3精度更高，特别是4ms时延上，MicroNet比MobileNetV3高出了10%。

6.1.4 讨论

如图5所示，在相同的FLOPs下，MicroNet的性能明显优于MobileNetV3，但在相同的延迟下，差距会缩小。这是由于两个原因：1）与通过搜索优化延迟的MobileNetV3不同，MicroNet是基于理论上的FLOPs手动设计的。2）分组卷积和dynamic Shift-Max算法的实现不是最优的(我们使用了PyTorch来实现)。我们观察到，组卷积的延迟并不是随着组数的增加而成比例地减小，并且dynamic Shift-Max显著慢于相同浮点数的卷积。

我们相信，通过使用硬件感知体系结构搜索来寻找延迟友好的MicroFactorized convolution and dynamic Shift-Max组合，可以进一步提高MicroNet的运行时性能。MicroNet还可以利用分组卷积和Dynamic Shift-Max中的优化改进来加快推理速度。我们将在未来的工作中对这些进行研究。

7、总结

在本文中，我们提出了MicroNet来处理极低的计算开销，它建立在两个提出的算子：Micro-Factorized convolution and Dynamic Shift-Max。前者通过点卷积和深度卷积的低阶近似，在通道数和输入/输出连通性之间取得平衡。后者fuses consecutive channel groups dynamically，增强节点连通性和非线性，以补偿深度较浅带来的不利影响。一个MicroNets族在极低的FLOPs下实现了三个任务(图像分类、目标检测和人体姿态估计)的坚实改进。我们希望这项工作能为多视觉任务中高效的CNN提供良好的baseline。

你可能感兴趣的:(论文集,深度学习,cnn,人工智能)

222222222222222 智能与优化开发语言
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、pandas是什么？二、使用步骤1.引入库2.读入数据总结前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas是基于Nu
月之暗面改进并开源了 Muon 优化算法，对行业有哪些影响？互联网之路. 知识点开源算法
互联网各领域资料分享专区(不定期更新)：Sheet正文月之暗面团队改进并开源的Muon优化算法在深度学习和大模型训练领域引发了广泛关注，其核心创新在于显著降低算力需求（相比AdamW减少48%的FLOPs）并提升训练效率，同时通过开源推动技术生态的共建。1.显著降低大模型训练成本，推动技术普惠算力需求锐减：Muon通过引入权重衰减和一致的RMS更新，解决了原始Muon在大规模训练中的稳定性问题，使
Spring Boot 动态配置数据源全解析 ♢.＊ spring boot 后端 java
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！引言在企业级应用开发中，单一数据源往往
深入解析：如何编写 Mapper 文件 ♢.＊ oracle 数据库 mybatis
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！在软件开发尤其是涉及数据库交互的项目中
Spring Boot 中 @Transactional 注解全面解析 ♢.＊ spring boot 数据库 sql
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、Java与Python的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！引言在企业级应用开发中，数据的一致性和
向量数据库实战介绍 Zhank10 数据库
本文将介绍三种常用的向量数据库：faiss,Milvus和Qdrant，并给出一个具体的使用例子。向量数据库（VectorDatabase）是一种专门用于存储、管理、查询、检索向量的数据库，主要应用于人工智能、机器学习、数据挖掘等领域。在向量数据库中，数据以向量的形式进行存储和处理，需要将原始的非向量型数据转化为向量表示（比如文本使用Embedding技术获得其表征向量）。这种数据库能够高效地进行
DeepSeek 持续火爆；微信蓝包首秀；世界级人工智能科学家许主洪加盟阿里巴巴...|网易数智日报网易数智网易数智日报人工智能大数据业界资讯 ai 云计算
DeepSeek持续火爆，多个云平台上线相关模型「抢食」算力需求AI公司DeepSeek旗下大模型DeepSeek-R1「爆火」后，多个云平台宣布上线DeepSeek旗下模型。2月5日，阅文集团宣布，旗下作家辅助创作应用“作家助手”已集成幻方量化旗下AI公司深度求索（DeepSeek）的DeepSeek-R1大模型。这是DeepSeek首次应用于网文领域，旨在为作家提供更智能的创作支持。2月4日，
A100高效架构深度解析智能计算研究中心其他
内容概要NVIDIAA100GPU作为面向人工智能与高性能计算的关键硬件载体，其架构创新标志着计算范式的重要演进。本文通过系统性拆解A100的核心技术模块，重点探讨其在计算密度、互联效率与资源利用率三个维度的突破性设计。在计算架构层面，第三代TensorCore通过引入细粒度结构化稀疏支持与新型数据格式，显著提升矩阵运算效率；多实例GPU（MIG）技术则通过物理级硬件隔离实现单卡多任务并行处理，为
深度学习模型优化与医疗诊断应用突破智能计算研究中心其他
内容概要近年来，深度学习技术的迭代演进正在重塑医疗诊断领域的实践范式。随着PyTorch与TensorFlow等开源框架的持续优化，模型开发效率显著提升，为医疗场景下的复杂数据处理提供了技术基座。当前研究聚焦于迁移学习与模型压缩算法的协同创新，通过复用预训练模型的泛化能力与降低计算负载，有效解决了医疗数据样本稀缺与硬件资源受限的痛点问题。与此同时，自适应学习机制通过动态调整网络参数更新策略，在病理
跨框架模型演进与行业应用路径智能计算研究中心其他
内容概要在人工智能技术持续迭代的背景下，模型框架的演进与行业应用的深度融合已成为推动产业智能化升级的核心驱动力。本文系统性梳理TensorFlow、PyTorch、MXNet等主流框架的技术发展脉络，重点分析其从通用计算架构向多模态、轻量化方向的转型路径。同时，针对模型优化技术领域，深入探讨迁移学习、超参数调优及模型压缩等方法的创新突破，揭示其在降低计算资源消耗、提升推理效率方面的关键作用。在行业
人工智能算法安全优化实践路径智能计算研究中心其他
内容概要在人工智能技术深度融入产业实践的进程中，算法安全优化已成为保障系统可靠性与社会信任的核心命题。本文系统性梳理从数据预处理到模型落地的全流程安全实践路径，聚焦金融风控、医疗影像诊断、自动驾驶等关键场景，揭示算法开发中潜藏的伦理风险与技术挑战。通过整合自动化机器学习与联邦学习技术，构建跨数据孤岛的协作框架，同时引入可解释性算法增强模型透明度，确保决策逻辑可追溯、可验证。在模型优化维度，重点解析
金融风控与医疗影像算法创新前沿智能计算研究中心其他
内容概要在金融风控与医疗影像交叉领域，算法创新正推动两大行业的技术范式变革。联邦学习算法通过分布式数据协作机制，在保证隐私安全的前提下，显著提升金融风险预测模型的泛化能力。医疗影像诊断领域则依托三维卷积神经网络（3D-CNN）架构，实现了对CT、MRI等多模态影像的精准病灶分割，诊断准确率较传统方法提升23.6%。值得关注的是，可解释性算法（如LIME和SHAP）的深度应用，使两类场景中的模型决策
人工智能的未来发展趋势及其对社会的深远影响智能计算研究中心其他
内容概要在当今科技飞速发展的时代，人工智能（AI）已成为推动社会变革的重要力量。本文将探讨人工智能未来的发展趋势，分析其在各个领域的应用前景，尤其是在技术革新、市场需求及伦理挑战等方面。通过对相关趋势的深入分析，我们可以更好地理解人工智能如何重塑劳动力市场、提升生活质量以及推动社会整体进步。探索人工智能的潜力，为未来的发展奠定基础。随着技术的不断进步，人工智能正在经历一场深刻的变革。从机器学习到深
BagelDB：AI的开源向量数据库 qahaj 人工智能数据库 python
BagelDB：AI的开源向量数据库BagelDB(OpenVectorDatabaseforAI)是一个类似于GitHub的AI数据协作平台。用户可以在这里创建、分享和管理向量数据集。BagelDB支持独立开发者的私有项目、企业内部的协作以及数据DAO的公共贡献。技术背景介绍随着人工智能和机器学习的快速发展，各种数据的重要性也在不断凸显。向量数据库作为存储向量化数据的重要工具，越来越受到开发者和
阿里云服务器的作用腾云服务器阿里云服务器云计算
使用阿里云服务器能做什么？大家都知道可以用来搭建网站、数据库、机器学习、Python爬虫、大数据分析等应用，阿里云服务器网来详细说下使用阿里云服务器常见的玩法以及企业或个人用户常见的使用场景：玩转阿里云服务器使用阿里云服务器最常见的应用就是用来搭建网站，例如个人博客、企业网站等；除了搭建网站还可以利用阿里云GPU服务器搭建机器学习和深度学习等AI应用；使用阿里云大数据类型云服务器做数据分析；利用云
阿里云人工智能与机器学习 HaoHao_010 阿里云云服务器云计算服务器
阿里云的人工智能（AI）与机器学习（ML）服务为企业提供了全面的AI解决方案，帮助用户在多个行业实现数据智能化，提升决策效率，推动业务创新。阿里云通过先进的技术和丰富的工具，支持用户开发、部署和管理AI应用。以下是阿里云在人工智能和机器学习方面的主要产品与服务：1.云上机器学习平台—PaaS服务PAI(PlatformforAI)PAI是阿里云推出的人工智能平台，提供一系列机器学习与深度学习工具和
AI探索笔记：浅谈人工智能算法分类安意诚Matrix 机器学习笔记人工智能笔记
人工智能算法分类这是一张经典的图片，基本概况了人工智能算法的现状。这张图片通过三个同心圆展示了人工智能、机器学习和深度学习之间的包含关系，其中人工智能是最广泛的范畴，机器学习是其子集，专注于数据驱动的算法改进，而深度学习则是机器学习中利用多层神经网络进行学习的特定方法。但是随着时代的发展，这张图片表达得也不是太全面了。我更喜欢把人工智能算法做如下的分类：传统机器学习算法-线性回归、逻辑回归、支持向
VQ-Diffusion 深度解析与实战指南晏灵昀Odette
VQ-Diffusion深度解析与实战指南VQ-Diffusion项目地址:https://gitcode.com/gh_mirrors/vqd/VQ-Diffusion1.项目介绍VQ-Diffusion是一个用于文本到图像合成的深度学习模型，基于矢量量化变分自编码器（VQ-VAE）和去噪扩散概率模型（DenoisingDiffusionProbabilisticModel）。该模型通过将DDP
【模块】AKConv卷积模块 dearr__ 扒网络模块深度学习人工智能
论文《AKConv:ConvolutionalKernelwithArbitrarySampledShapesandArbitraryNumberofParameters》1、作用AKConv旨在解决深度学习中标准卷积操作的两个固有限制：限定在局部窗口内，限制了从其他位置捕获信息的能力；卷积核固定大小，限制了对不同目标形状和大小的适应能力。这种新方法允许卷积核具有任意参数和采样形状，提供了一种灵活
【人工智能算法】人工智能算法都包括什么？请详细列出和解释资源存储库算法强化学习人工智能算法
目录人工智能算法都包括什么？请详细列出和解释1.机器学习算法（MachineLearningAlgorithms）监督学习算法（SupervisedLearning）无监督学习算法（UnsupervisedLearning）强化学习算法（ReinforcementLearning）2.进化算法（EvolutionaryAlgorithms）3.模拟退火（SimulatedAnnealing）4.粒
AI笔记——浅谈发展历程 Bqiuer AI AI笔记人工智能 ai
2023年，要说最让人震惊的热点，无疑就是AI技术的大爆发！从1950年的“图灵测试”标志着人工智能雏形的诞生，一些最顶尖的技术团队、技术学科进行研究，到如今几十年的时间。一、AI的历史进程人工智能（ArtificialIntelligence，AI）的历史进程可以追溯到上世纪50年代。1950年代-1960年代：起步阶段1950年，英国数学家艾伦·图灵提出了“图灵测试”，这是第一个旨在检验机器智
AI产品怎样才能打造出像人类一样聪明和有情商？ AI天才研究院 Python实战 DeepSeek R1 &大数据AI人工智能大模型 AI实战大数据人工智能语言模型 Java Python 架构设计
作者：禅与计算机程序设计艺术1.简介随着人工智能技术的飞速发展、算法能力的不断增强、数据集的积累、计算设备的普及，人工智能已经成为各个行业、各个领域的重要突破性技术。然而，面对这一技术带来的巨大变革，如何为用户提供更加人性化的服务，并让人工智能模型对用户输入做出智能回应，则成为了一个长期且艰难的挑战。今天，我们将讨论一些常见的人机交互相关的问题，如语言模型、对话系统、生成模型等，并从中可以窥视到人
最全中文对话数据集（不定期更新）数据猎手小k 人工智能大数据
随着人工智能技术的发展，自然语言处理（NLP）领域中的对话系统逐渐成为研究的热点。为了提升对话系统的性能，需要大量的高质量对话数据来训练和优化模型。然而，中文对话数据相对于英文来说较为稀缺，且质量参差不齐，这限制了中文对话系统的发展。因此，构建大规模、高质量的中文对话数据集成为了一个迫切的需求。一、研究意义1、推动中文NLP发展：大规模高质量的中文对话数据集能够为中文自然语言处理领域的研究提供基础
DCMNet一种用于目标检测的轻量级骨干结构模型详解及代码复现清风AI 深度学习算法详解及代码复现深度学习机器学习计算机视觉人工智能算法目标检测
模型背景在深度学习技术快速发展的背景下，目标检测领域取得了显著进展。早期的手工特征提取方法如Viola-Jones和HOG逐渐被卷积神经网络（CNN）取代，其中AlexNet在2012年的ILSVRC比赛中表现突出，推动了CNN在计算机视觉中的广泛应用。然而，这些早期模型在精度和效率方面仍存在不足，尤其是在处理复杂场景和小目标时表现不佳。这为DCMNet等新型轻量化目标检测模型的出现提供了契机，旨
Python人工智能学习路线，来自阿里巴巴佛系Python程序员的指南阿里P6+ 2024年程序员学习 python 人工智能学习
其实，这两方面都是存在的，但都很片面，这里不加赘述。客观地说，数字化、智能化是人类社会发展的趋势，而当下人工智能无疑是一大热门，那是蓝海还是火海？我们回到老道理——水的深度，只有你自己去试试水才知道。当你对上面情况有了初步的了解并想试试水，需要面对的问题是：AI入门容易吗？答案其实是否定的，难！AI领域需要钻研算法原理、大量复杂的公式及符号、无所适从的项目都是劝退一时热度初学者的原因。但对于一个初
DeepSeek全栈接入指南：从零到生产环境的深度实践量子纠缠BUG DeepSeek部署 AI DeepSeek 人工智能深度学习机器学习
第一章：DeepSeek技术体系全景解析1.1认知DeepSeek技术生态DeepSeek作为新一代人工智能技术平台，构建了覆盖算法开发、模型训练、服务部署的全链路技术栈。其核心能力体现在：1.1.1多模态智能引擎自然语言处理：支持文本生成（NLG）、语义理解（NLU）、情感分析等计算机视觉：提供图像分类、目标检测、OCR识别等CV能力语音交互：包含语音识别（ASR）、语音合成（TTS）及声纹识别
百度安全获得中国信通院深度伪造视频检测服务评估优秀级安全
近年来深度合成技术迅猛发展的背后，“真实”和“虚假”的界限愈发难以分辨，技术滥用和恶意应用已经引发了一系列风险。随着技术的快速发展，党和国家高度重视深度合成技术的治理工作，先后发布了《互联网信息服务深度合成管理规定》、《生成式人工智能服务管理暂行办法》，旨在加强互联网信息服务深度合成管理，促进深度合成服务健康发展，防范相关安全风险。中国信息通信研究院持续跟进深度合成技术及其应用的发展态势，自201
AIoT安全与隐私自动化建设：实践与展望 ITPUB-微风安全自动化运维
随着物联网（IoT）的快速发展，AIoT（人工智能物联网）已成为新时代的技术趋势。然而，随着设备的增多和应用的广泛，AIoT的安全与隐私问题也日益凸显。本文将探讨AIoT安全与隐私自动化建设的实践与展望。一、背景AIoT设备数量的激增带来了诸多安全挑战，如僵尸网络、中间人攻击、隐私泄露等。这些威胁不仅影响设备的正常运行，还可能对用户隐私造成严重损害。因此，建立有效的AIoT安全与隐私保护机制迫在眉
消费者产品报告2025-在通用人工智能时代重新获得相关性报告300+份集萃解读|附PDF下载数据挖掘深度学习机器学习算法
原文链接：https://tecdat.cn/?p=40823在全球经济形势复杂多变、技术革新加速的当下，消费品行业正经历深刻变革。本报告汇总解读基于权威数据，深入剖析该行业在2024-2025年的发展态势，为企业提供市场洞察与策略建议，助力其在通用人工智能时代找准方向、重塑竞争优势。本报告汇总洞察基于文末470份消费者行业研究报告的数据，报告合集已分享在交流群，阅读原文进群和500+行业人士共同
在Linux环境下安装和使用Pyenv：详细指南 I'mAlex Python三方库 #Python linux 运维服务器 python pyenv
Pyenv是一个用于管理多个Python版本的强大工具，特别适合在Linux环境下使用。本文将详细介绍如何在Linux系统上安装和使用Pyenv，以便更好地管理Python开发环境。博主简介：现任阿里巴巴嵌入式技术专家，15年工作经验，深耕嵌入式+人工智能领域，精通嵌入式领域开发、技术管理、简历招聘面试。CSDN优质创作者，提供产品测评、学习辅导、简历面试辅导、毕设辅导、项目开发、C/C++/Ja
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><