Amusi（CVer）

DeepMind重新设计高性能ResNet！无需激活归一化层

点击上方“CVer”，选择加"星标"置顶

重磅干货，第一时间送达

本文转载自：AI人工智能初学者

Characterizing signal propagation to close the performance gap in unnormalized ResNets

论文：arxiv.org/abs/2101.08692

本文提出Normalizer-Free方法，可用于设计没有激活归一化层的深度残差网络！并能直接应用于ResNet、RegNet等网络，在相同FLOP预算下，性能可比肩EfficientNet，代码已开源！！！
作者单位：DeepMind

1 简介

Batch Normalization几乎是所有最新图像分类器中的关键组件，但同时也带来了实际挑战：它打破了Batch内训练样本之间的独立性，可能会导致计算和内存的开销，并经常导致意外的错误。

基于对初始化时深度ResNet的最新理论分析，本文提出了一套简单的分析工具来表征前向信号的传播，并利用这些工具设计高性能无需激活归一化层的ResNet。本方法的关键是最近提出的Weight Standardization的改编版本。本文所提出的分析工具展示了该技术如何在确保具有ReLU或Swish激活功能的同时每通道不会随网络深度增长而丢失信号。

本文主要贡献：

1 介绍了Signal Propagation Plots(SPPs):一组简单的可视化方法，帮助查看深度残差网络的前向传递初始化时信号传播；
2 提出了比例权重标准化，阻止了均值信号的增长，使得性能得到大幅提升；
3 将normalization-free结构与Scaled Weight Standardization一起应用于ImageNet上的ResNets，在此基础上首次实现了在288层的网络上比批量标准化的ResNets更好的性能。
4 将normalization-free应用于RegNet架构。通过将这种架构与复合缩放策略相结合开发了没有标准化层的模型，并达到SOTA效果。

2 背景动机

BatchNorm和skip连接的结合使得从业者能够训练具有数百或数千层的Resnet。为了理解这种效应，许多论文在初始化时分析了信号在normalized ResNets中的传播。在最近的一项工作中，最近有研究表明，在高斯初始化的normalized ResNets中，相对于Skip Path上的激活规模，第 Residual Branch上的激活被因子抑制。这使得deep ResNets中的Residual块在初始化时偏向于identity function，确保了表现良好梯度的传递。

在unnormalized网络中，可以通过在每个Residual Branch的末尾引入一个可学习的标量，初始化为零来保持这一好处。这个简单的改进足以在没有normalized的情况下训练带有数千个层的深度网络。然而，尽管该方法易于实现，并在训练集上取得了很好的收敛性，但与well-tuned baselines相比，它的测试精度仍低于normalized网络。

这些来自batch-normalized ResNets研究的idea也得到了unnormalized网络理论分析的支持。这些研究表明，在具有identity skip connections的ResNets中，如果信号在前向传递时不出现梯度爆炸，梯度在后向传递时既不会爆炸也不会消失。Hanin&Rolnick在自己的研究中总结得出结论，将残差分支上的隐藏激活乘以一个因子或更小，其中d表示网络深度，足以保证初始化时的可训练性。

为了抵消BatchNorm在不同情况下的局限性，已经提出了一系列替代的规范化方案，每个方案都在隐藏激活的不同组件上运行。这包括LayerNorm, instancnorm, GroupNorm等等。

虽然这些替代方案消除了对batch sizes的依赖，并且通常在非常小的batch sizes上比BatchNorm工作得更好，但它们也引入了自己的限制，比如在推理时引入额外的计算成本。

此外，对于图像分类，这些替代方案的测试精度往往低于well-tuned baselines。本文作者也注意到GroupNorm与Weight Standardization的结合最近被确定为ResNet-50中BatchNorm的一个比较好的替代方案。

3 Signal Propagation Plots

最近有论文从理论上分析了ResNets中的信号传播，但在设计新模型或提出对现有架构的修改时，实践者很少从经验上评估特定深度网络中不同深度隐藏激活的规模。相比之下，本文作者发现，在一批随机高斯输入或真实训练实例的条件下，绘制网络内不同点隐藏激活的统计数据是非常有益的。

这种实践能够在启动一个注定失败的训练运行之前，立即检测到实现中隐藏的bug。

因此，作者通过引入信号传播图(SPPs)来可视化信号在深度ResNets的前向传递上的传播。

假设identity residual blocks形式为，其中表示第块的输入，表示第 residual分支计算的函数。考虑4维的输入和输出张量，其维数用NHWC表示，其中N表示Batch，C表示Channel，H和W表示两个空间维数。为了生成spp，作者根据网络初始化方案初始化一组权值，然后向网络提供一批单位高斯分布的输入样本。然后，在每个residual blocks的输出处绘制以下隐藏的激活统计信息：

Average Channel Squared Mean：通过NHW轴计算平均值的平方，然后在C轴上求平均值。在一个信号传播良好的网络中，期望每个通道上的平均激活，在一批例子中平均，接近于零。这里有必要测量平均值平方的平均值，因为不同通道的平均值可能有相反的符号。
Average Channel Variance：通过在NHW轴上取通道方差，然后在C轴上取平均值来计算得到。这最能提供信息的信号大小测量，并清楚地显示信号梯度的爆炸或弥散。
在Residual分支的末端Average Channel Variance：在与skip path合并之前。这有助于评估Residual分支上的层是否被正确初始化。

spp并没有捕捉到信号传播的所有特性，它们只考虑了正向传递的统计信息。但是只要正向传递的信号表现良好，反向传递通常不会爆炸或消失。

举例如下：

在Figure 1中展示了600层预激活的带有BatchNorm、ReLU激活和He初始化的ResNet的SPP。比较了标准的BN-ReLU-Conv排序和较不常见的ReLU-BN-Conv排序。

首先，实验发现Average Channel Variance在给定阶段会随深度线性增长，并且在每个transition block 上重置到接近1的固定值。这里出现线性增长是因为在初始化时激活的方差满足：，而BatchNorm确保每个residual分支结束时激活的Variance与深度无关(可以看出上图的b中在block结束时出现了正交的坐标，因此与Depth无关)。在每个transition block上重置Variance，因为在这些块中，Skip Connection在标准化输入上操作的卷积代替，消除了前面块中Skip Path上的任何信号增长。

在BN-ReLU-Conv在训练时Average Squared Channel Means显示类似的规律在transition blocks之间随深度线性增长。期望BatchNorm以激活为中心。然而，通过这种排序在一个residual分支上的最终卷积接收到一个整流具有正均值的输入。这会导致分支在任何单个通道上的输出也具有非零均值，并解释了为什么在所有深度上都约等于0.68。尽管这种均值偏移会被后续residual分支中的规范化层显式抵消，但当试图删除规范化层时，它将产生严重的后果。与之相反，ReLU-BN-Conv训练时在避免均值转移问题的同时具有同等稳定性，这里对于所有的而言约等于1。

4.NF ResNets

通过使用spp分析，本文作者开发了不带归一化层的ResNet的变体，它不仅具有良好的信号传播能力，并且在训练期间是稳定的，并获得了与批量归一化后的ResNet差不多的效果和精度。首先，对于standard initializations，BatchNorm以与输入的标准差成比例的因子将每个residual block输入进行downscales。其次，每个residual block使信号的方差增加一个Contant Factor。这里使用形式为的残差块来模拟，其中表示第一个残差块的输入，表示第一个残差分支。

用于残差分支计算的函数，这里会被参数化为初始化时的方差，即。这个约束使推理网络中的信号增长不受深度的影响，并可以分析与估计方差。
是一个为固定的标量，初始化时激活的预期经验标准差。这保证了的输入具有unit variance。
是控制块间方差增长率的标量超参数。

根据解析计算剩余块的期望经验方差，初始期望方差，并设。由于shortcut convolution接收到规范化输入，规范化ResNets中的信号方差在每个transition layer重置。

为了确保每个阶段开始时的单位信号方差每个转换层之后的，这里通过让transition layer中的shortcut convolution操作，而不是来模拟这种重置。这种简单的缩放策略的残差网络称为NF-ResNets。

4.1 包含均值漂移的ReLU

在之前的实验中作者观察到Average Channel Squared Mean随着深度的增加而迅速增长并达到或超过Average Channel Squared Mean的大值，这表明了一个较大的均值偏移，即不同训练输入的隐藏激活是紧密相关的；正如前面所观察到的BN-ReLU-Conv网络，残差分支的经验方差规模始终小于1。

为了确定这些现象的来源，在Figure 7中，作者为线性化的ResNetV2-600提供了一个类似的SPP，该版本没有ReLU激活功能。当移除ReLU激活时，所有区块深度的Average Channel Squared Mean保持接近于零，residual分支的经验方差在1上下波动。这引发了以下问题:为什么重新激活会导致Channel平均激活的规模增长?

为了对该现象有一个直观的认识，考虑变换，其中是arbitrary and fixed，是一个激活函数，以组件方式作用于输入。因此，可以是任何常用的激活函数，如ReLU、tanh、SiLU等。对所有i,设 , ，可以直接表示输出的任意单个单位的期望值和方差为:

其中，和分别为的第行均值和标准差;

假设为ReLU激活函数，即。然后，这意味着对线性层的输入具有正的均值(忽略所有输入小于或等于0时的边界情况)。特别地，如果对于所有服从，那么。因为 ,如果也是非零的，那么变换的输出也将是一个非零的均值。

重要的是，即使从以0为中心的分布中采样，从这个分布中得出的任何特定权重矩阵几乎肯定会有一个非零的经验均值，因此任何特定通道上residual分支的输出将具有非零的均值。因此，这个具有he初始化权值的简单的NF-ResNet模型往往不稳定，并且随着深度的增加训练变得越来越困难。

4.2 Scaled Weighted Standardization

为了防止均值偏移的出现，并确保残差分支保持方差，作者提出了Scaled Weighted Standardization，该标准化也与中心权重标准化密切相关。重新参数化卷积层：

其中的均值和方差是通过卷积滤波器的扇入范围计算的。从高斯权值初始化潜在参数W，而是一个固定常数。在整个训练过程中将这个约束作为网络向前传递的可微分操作。使用缩放的变换的输出，对所有的期望值，从而消除了均值偏移。

此外，方差，这意味着对于一个正确选择的，它依赖于非线性g，该层将保持方差。

Scale Weight标准化在训练以及Inference的过程中性价比都很高，不引入批处理元素之间的依赖性，训练和测试也没有差异，而且它的实现在分布式训练中没有区别。这些理想的特性使它成为替代BatchNorm的选择。

Figure 2中显示的是采用缩放WS的normalizer-free ResNet-600的SPP(青色)。正如所看到的，缩放权重标准化消除了初始化时Average Channel Squared Mean的增长。事实上，对于使用ReLU-BN-Conv的批归一化网络，spp几乎是相同的，如红色所示。注意，选择常数是为了确保residual分支上的Channel方差接近于1。由于0 padding，residual分支的方差在网络的末端附近略有衰减。

4.3 确定Nonlinearrity-Specific常量

最后，需要确定增益的值，以确保在初始化时residual分支上隐藏激活的方差接近1。注意，的值将取决于在网络中使用的specific nonlinearity。假定非线性的输入服从。对于ReLU网络，这意味着输出将从修正的高斯分布中采样。

因为，为了确保，设。当网络宽度很大时，服从通常不正确，除此之外作者发现这种近似在实践中很好地工作。

对于简单的非线性，如ReLU或tanh，当从单位法向量得出时，非线性的解析方差可能是已知的或容易推导的。

对于其他非线性，如SiLU(最近以Swish的形式推广)，分析确定方差可能涉及求解困难的积分，甚至可能没有解析形式。

在实践中发现从高斯分布中得到许多N维向量，计算每个向量的经验方差，并对这个经验方差的平均值取平方根，这样一个简单的过程在数值上近似这个值是足够的。

4.4 模块构建与约束松弛

本文方法通常要求在网络中使用的任何额外操作保持良好的信号传播，这意味着许多常见的构建块必须修改。与选择值一样，必要的修正可以通过分析或经验来确定。

例如，Squeeze-and-Excitation操作(S+E)，，涉及到[0,1]中激活的乘法，容易使信号衰减，使模型不稳定。这个衰减在normalizer-free ResNet中通过SPP可以明显看到：

如果单独检查这个操作使用简单的数值发现预期的方差是0.5,表明只需要输出乘以2恢复良好的信号传播。实践验证了这种简单的改变足以恢复训练的稳定性。

在实践中发现，对任何给定的操作进行类似的简单修改就足以保持良好的信号传播，或者网络对由操作引起的退化有足够的鲁棒性，无需修改就能很好地训练。作者也探索了可以在多大程度上放松约束，仍然保持稳定的训练。

作为一个例子，为了恢复正常卷积的一些表达能力，作者向缩放的WS层引入了可学习的仿射增益和偏差(增益应用于权值，而偏差被添加到激活，这是典型的)。虽然可以约束这些值来加强良好的信号传播，例如，将输出与增益值成比例地缩小一个标量，但这对稳定训练是不必要的，当这些参数自由变化时，稳定性不会受到影响。

作者也发现在residual分支初始化为0的末端使用一个可学习的标量乘子在训练超过150层的网络时是有帮助的，即使在计算时忽略这个修改。在最终的模型中在不影响训练稳定性的情况下使用了几个这样的松弛。

Normalization-Free Block源码：

class NormalizationFreeBlock(nn.Module):
    """Normalization-free pre-activation block.
    """

    def __init__(
            self, in_chs, out_chs=None, stride=1, dilation=1, first_dilation=None,
            alpha=1.0, beta=1.0, bottle_ratio=0.25, efficient=True, ch_div=1, group_size=None,
            attn_layer=None, attn_gain=2.0, act_layer=None, conv_layer=None, drop_path_rate=0., skipinit=False):
        super().__init__()
        first_dilation = first_dilation or dilation
        out_chs = out_chs or in_chs
        # EfficientNet-like models scale bottleneck from in_chs, otherwise scale from out_chs like ResNet
        mid_chs = make_divisible(in_chs * bottle_ratio if efficient else out_chs * bottle_ratio, ch_div)
        groups = 1 if group_size is None else mid_chs // group_size
        if group_size and group_size % ch_div == 0:
            mid_chs = group_size * groups  # correct mid_chs if group_size divisible by ch_div, otherwise error
        self.alpha = alpha
        self.beta = beta
        self.attn_gain = attn_gain

        if in_chs != out_chs or stride != 1 or dilation != first_dilation:
            self.downsample = DownsampleAvg(
                in_chs, out_chs, stride=stride, dilation=dilation, first_dilation=first_dilation, conv_layer=conv_layer)
        else:
            self.downsample = None

        self.act1 = act_layer()
        self.conv1 = conv_layer(in_chs, mid_chs, 1)
        self.act2 = act_layer(inplace=True)
        self.conv2 = conv_layer(mid_chs, mid_chs, 3, stride=stride, dilation=first_dilation, groups=groups)
        if attn_layer is not None:
            self.attn = attn_layer(mid_chs)
        else:
            self.attn = None
        self.act3 = act_layer()
        self.conv3 = conv_layer(mid_chs, out_chs, 1)
        self.drop_path = DropPath(drop_path_rate) if drop_path_rate > 0 else nn.Identity()
        self.skipinit_gain = nn.Parameter(torch.tensor(0.)) if skipinit else None

    def forward(self, x):
        out = self.act1(x) * self.beta

        # shortcut branch
        shortcut = x
        if self.downsample is not None:
            shortcut = self.downsample(out)

        # residual branch
        out = self.conv1(out)
        out = self.conv2(self.act2(out))
        if self.attn is not None:
            out = self.attn_gain * self.attn(out)
        out = self.conv3(self.act3(out))
        out = self.drop_path(out)
        if self.skipinit_gain is None:
            out = out * self.alpha + shortcut
        else:
            # this really slows things down for some reason, TBD
            out = out * self.alpha * self.skipinit_gain + shortcut
        return out

5 实验与分析

在表1中，将网络(NF-ResNets)的性能与BaseLine(BNResNets)进行了比较，这些网络的深度范围很广。在引入额外的正则化之后，NFResNets的性能优于FixUp/SkipInit，并在所有网络深度上与BN相当，正则化NF-ResNet-288实现了79.5%的最高精度。

在图中比较了EfficientNets和NF-RegNets在ImageNet上的测试精度，这里对于每个数据增强NF-RegNets获得了与EfficientNets相当但略低的测试精度，同时训练速度大大提高。在数据增强中，对比自动增强(AA)或随机增强(RA)的结果发现使用CutMix+MixUp训练EfficientNets的效果更好。

然而，AA和RA都会降低NF-RegNets的性能和稳定性，因此使用CutMix+Mixup替代的NF-RegNets中的数据增强的结果。假设这是因为AA和RA是通过对批归一化模型应用架构搜索而开发的，因此当删除归一化层时，它们可能会改变数据集的统计数据，从而对信号传播产生负面影响。为了支持这个说法，在NF-RegNet的第1次卷积后插入单个BatchNorm可以消除这些不稳定性，并能够使用AA或RA进行稳定训练，尽管这种方法不能获得更高的测试集精度。

下表为对比的具体数值：

6 参考

[1].Characterizing signal propagation to close the performance gap in unnormalized ResNets

[2].https://github.com/rwightman/pytorch-image-models/tree/master/timm/models

原文获取方式，点击下方卡片

CVer后台回复【NF】即可获取论文与源码

CV资源下载

后台回复：CVPR2020，即可下载代码开源的论文合集

后台回复：ECCV2020，即可下载代码开源的论文合集

后台回复：YOLO，即可下载YOLOv4论文和代码

后台回复：Transformer综述，即可下载两个最新的视觉Transformer综述PDF，肝起来！

重磅！CVer-细分垂直交流群成立

扫码添加CVer助手，可申请加入CVer-细分垂直方向 微信交流群，也可申请加入CVer大群，细分方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、Transformer、PyTorch和TensorFlow等群。

一定要备注：研究方向+地点+学校/公司+昵称（如目标检测+上海+上交+卡卡），根据格式备注，才能通过且邀请进群

▲长按加微信群

▲长按关注CVer公众号

整理不易，请给CVer点赞和在看！

Python生态系统中拥有丰富的第三方库 ___Y1 python python
Python生态系统中拥有丰富的第三方库，这些库覆盖了几乎所有领域，包括科学计算、数据分析、机器学习、人工智能、Web开发等。这些库的存在极大地丰富了Python的功能，使其成为一门强大而灵活的编程语言。以下是一些常用的Python第三方库：1.**科学计算与数据处理：**-**NumPy：**提供高性能的多维数组对象，以及相关工具，用于处理这些数组。-**Pandas：**提供数据结构和数据分析
【ChatBI】text2sql-不需要访问数据表-超轻量Python库Vanna快速上手，对接oneapi 机器玄学实践者 oneapi vanna chatbi dbgpt nl2sql
oneapi准备首先确保你有oneapi，然后申请kimi的api需要去MoonshotAI-开放平台然后添加一个apikey然后打开oneapi的渠道界面，添加kimi。然后点击测试，如果能生成响应时间，就是配置正确。然后创建令牌http://xxx:3000/token,模型名是moonshot-v1-8k然后复制token，token是sk开头的一串密码。其他平台接入也是类似操作，不懂的读者
人工智能 Python ZSup{A} 人工智能 java 前端服务器
人工智能Python（一）一．基本语法1.在python中严格区分大小写2.Python中的每一行就是一条语句，每条语句以换行结束3.Python每一行语句不要过长（规范中建议每行不要超过80个字符）“rulers”:[80]4.一条语句可以分多行编写，语句后面以\结尾5.Python是缩进严格的语言，所以在Python中不要随便写缩进6.在Python使用#表示注释，#后面的内容都属于注释，注释
【人工智能】Python常用库-PyTorch常用方法教程 IT古董人工智能机器学习 Python 人工智能 python pytorch 机器学习
PyTorch是一个强大的开源深度学习框架，以其灵活性和动态计算图而广受欢迎。以下是PyTorch的详细教程，涵盖从基础到实际应用的使用方法。1.安装与导入1.1安装PyTorch访问PyTorch官方网站，根据系统、Python版本和CUDA支持选择安装命令。常用安装命令：pipinstalltorchtorchvisiontorchaudio1.2导入库importtorchimporttor
【人工智能】Python常用库-TensorFlow常用方法教程 IT古董人工智能机器学习 Python 人工智能 python tensorflow 机器学习
TensorFlow是一个广泛应用的开源深度学习框架，支持多种机器学习任务，如深度学习、神经网络、强化学习等。以下是TensorFlow的详细教程，涵盖基础使用方法和示例代码。1.安装与导入安装TensorFlow：pipinstalltensorflow导入TensorFlow：importtensorflowastfimportnumpyasnp验证安装：print(tf.__version_
【人工智能】Python常用库-Matplotlib常用方法教程 IT古董人工智能机器学习 Python 人工智能 python matplotlib
Matplotlib是一个强大的Python数据可视化库，用于绘制各种图形。以下是Matplotlib常用方法的详细说明及示例，帮助你快速上手。1.安装和导入Matplotlib安装Matplotlib：pipinstallmatplotlib导入Matplotlib：importmatplotlib.pyplotasplt2.基本绘图绘制简单折线图importmatplotlib.pyplota
python 命名实体识别_Python NLTK学习11（命名实体识别和关系抽取） weixin_39630762 python 命名实体识别
PythonNLTK学习11(命名实体识别和关系抽取)发表于:2017年7月27日阅读:18262除特别注明外，本站所有文章均为小杰Code原创本系列博客为学习《用Python进行自然语言处理》一书的学习笔记。命名实体识别命名实体识别(NER)系统的目标是识别所有文字提及的命名实体。可以分解成两个子任务：确定NE的边界和确定其类型。命名实体识别非常适用于基于分类器类型的方法来处理的任务。NLTK有
python断点调试出现问题_python的断点调试 weixin_39689870 python断点调试出现问题
在Python中也可以像gcc/gdb那样调试程序，只要在运行Python程序时引入pdb模块（假设要调试的程序名为d.py）：1$vid.py12345678#!/usr/bin/pythondefmain():i,sum=1,0foriinxrange(100):sum=sum+iprintsumif__name__=='__main__':main()1$python-mpdbd.py运行上
python命名实体识别工具,斯坦福大学使用NLTK命名实体识别器（NER）功能宇宙探索未解之迷 python命名实体识别工具
Isthispossible:toget(similarto)StanfordNamedEntityRecognizerfunctionalityusingjustNLTK?Isthereanyexample?Inparticular,IaminterestedinextractionLOCATIONpartoftext.Forexample,fromtextThemeetingwillbehel
乐学智伴：基于人工智能与大数据的学生个性化学习辅助平台 IT源码大师人工智能大数据学习
详细描述：1.引言：教育科技的时代背景在信息化和数字化的浪潮下，教育领域正经历着深刻的变革。传统的教学模式以教师为中心，难以满足学生个性化学习的需求。随着人工智能、大数据和云计算等技术的快速发展，教育科技（EdTech）为个性化学习提供了全新的解决方案。通过智能化工具和数据分析，学生可以根据自身的学习特点和进度，制定个性化的学习计划，从而提高学习效率和效果。“乐学智伴”是一款基于人工智能与大数据技
【小白学AI系列】NLP 核心知识点（六）Softmax函数介绍 Blankspace空白人工智能自然语言处理 transformer
Softmax函数Softmax函数是一种常用的数学函数，广泛应用于机器学习中的分类问题，尤其是在神经网络的输出层。它的主要作用是将一个实数向量“压缩”成一个概率分布，使得所有输出的值在0到1之间，并且总和为1。换句话说，Softmax将模型的原始输出（logits）转化为概率，帮助我们做分类决策。定义与公式假设我们有一个向量z=[z1,z2,…,zn]\mathbf{z}=[z_1,z_2,\d
android前台服务 Android西红柿 Android基础 android
关于作者：CSDN内容合伙人、技术专家，从零开始做日活千万级APP。专注于分享各领域原创系列文章，擅长java后端、移动开发、商业变现、人工智能等，希望大家多多支持。未经允许不得转载目录一、导读二、使用2.1添加权限2.2新建一个服务2.3构建通知消息2.4启动与停止服务三、推荐阅读一、导读我们继续总结学习基础知识，温故知新。今天记录下android前台服务（ForegroundService），
python做个游戏辅助_8个用于辅助项目的出色Python库 cumj63710 数据库 python java 大数据编程语言
python做个游戏辅助在Python/Django世界中我们有一句俗语：我们是为语言而来的，而是为社区而留下的。对我们大多数人来说都是如此，但是让我们留在Python世界中的另一件事是，有了一个想法并在午餐或晚上几个小时内快速地解决它是多么容易。本月，我们将深入研究我们喜欢用来快速擦除那些附带项目或午餐时间痒的Python库。即时将数据保存在数据库中：数据集当我们快速想要收集数据并将其保存到数据
用Python做一个绝地求生压枪版程序媛了了 python 开发语言
一、概述1.1效果总的来说，这种方式是通过图像识别来完成的，不侵入游戏，不读取内存，安全不被检测。1.2前置知识游戏中有各种不同的枪械，不同的枪械后坐力不一样，射速也不同。相同的枪械，装上不同的配件后，后坐力也会发生变化。枪械的y轴上移是固定的，x轴是随机的，因此我们程序只移动鼠标y轴。x轴游戏中手动操作。1.3实现原理简述通过python中的pynput模块监听键盘鼠标。监听鼠标左键按下，这个时
[论文总结] 深度学习在农业领域应用论文笔记14 落痕的寒假论文总结深度学习论文阅读人工智能
当下，深度学习在农业领域的研究热度持续攀升，相关论文发表量呈现出迅猛增长的态势。但繁荣背后，质量却不尽人意。相当一部分论文内容空洞无物，缺乏能够落地转化的实际价值，“凑数”的痕迹十分明显。在农业信息化领域的顶刊《ComputersandElectronicsinAgriculture》中也大面积存在。众多论文在研究方法上存在严重缺陷，过于简单粗放。只是机械地把深度学习方法生硬地套用到特定农业问题中
Python开发FastAPI从入门到精通赵梓宇 Python权威教程合集 fastapi python 前端
想用Python写API快到飞起？FastAPI就是你的“代码瑞士军刀”！这本书不讲玄学，只教真功夫——从零搭建高性能API，到微服务、分布式事务、熔断限流，连异步编程都能玩成魔法！小白也能变大神：路由、依赖注入、数据库集成手把手教学；老鸟直呼内行：服务网格、Saga模式、K8s部署实战全覆盖。附赠三个硬核项目：任务管理、在线商城、实时聊天系统，代码跑起来比老裁缝织毛衣还丝滑！别说我没提醒你：翻开
NLTK命名实体识别（NER） Mr数据杨 Python 自然语言技术 NLTK 自然语言处理 1024程序员节
命名实体识别（NamedEntityRecognition,NER）是自然语言处理（NLP）中的一项核心技术，旨在从文本中识别出具有特定意义的实体，如人名、地名、组织名等。通过对文本的自动化处理，NER能够帮助计算机理解和组织大量的非结构化数据，为信息抽取、搜索引擎优化、数据分析等领域提供强有力的技术支持。NLTK（NaturalLanguageToolkit）是一个广泛使用的Python库，提供
【算法】经典博弈论问题——威佐夫博弈 python 查理零世算法 python 开发语言
目录威佐夫博弈(WythoffGame)【模板】威佐夫博弈(WythoffGame)有两堆石子，数量任意，可以不同，游戏开始由两个人轮流取石子游戏规定，每次有两种不同的取法1)在任意的一堆中取走任意多的石子2)可以在两堆中同时取走相同数量的石子最后把石子全部取完者为胜者现在给出初始的两堆石子的数目，返回先手能不能获胜结论：小！=（大-小）*黄金分割比例，先手赢小=（大-小）*黄金分割比例，后手赢证
python 的sm2 生成密钥的方法，gmssl里没有提供密钥生成 CissSimkey python 算法机器学习
"""Author:tangleiDateTime:2024-11#importrandom#random不安全所以替换为secrets中的算法#选择素域，设置椭圆曲线参数"""importsecretsclassSM2_Key():default_ecc_table={'n':'FFFFFFFEFFFFFFFFFFFFFFFFFFFFFFFF7203DF6B21C6052B53BBF40939D
详解三种常用标准化：Batch Norm、Layer Norm和RMSNorm yyytucj batch 开发语言
在深度学习中，标准化技术是提升模型训练速度、稳定性和性能的重要手段。本文将详细介绍三种常用的标准化方法：BatchNormalization（批量标准化）、LayerNormalization（层标准化）和RMSNormalization（RMS标准化），并对其原理、实现和应用场景进行深入分析。一、BatchNormalization1.1BatchNormalization的原理BatchNor
基于Python第三方模块fuzzywuzzy实现字符串匹配和相似度比较袁袁袁袁满 Python实用技巧大全 python 开发语言 fuzzywuzzy 符串匹配和相似度比较
文章目录一、引言二、安装三、核心模块与功能1.fuzz模块的主要函数2.process模块的主要函数四、应用场景五、性能与优化一、引言fuzzywuzzy是一个强大的Python库，专门用于执行模糊字符串匹配和相似度比较。由SeatGeek开发并开源，它基于Levenshtein距离（编辑距离）算法，能够处理字符串之间的拼写错误、格式差异以及部分匹配等问题。fuzzywuzzy在数据清洗、文本匹配
常见的反爬机制及应对策略极客点儿 #网络爬虫 Python 爬虫反爬
1.Headers:从用户的headers进行反爬是最常见的反爬策略,Headers是一种最常见的反爬机制Headers是一种区分浏览器行为和机器行为中最简单的方法，还有一些网站会对Referer（上级链接）进行检测从而实现爬虫。相应的解决措施：通过审查元素或者开发者工具获取相应的headers然后把相应的headers传输给python的requests，这样就能很好地绕过。2.IP限制一些网站
Python3 【函数】：见证算法的优雅与力量李智 - 重庆 Python 精讲精练 -从入门到实战算法 python 经验分享案例学习编程技巧学习方法
Python3【函数】：见证算法的优雅与力量一、问题描述使用3种不同的算法编写函数，实现如下功能：找出3个数中的最大数。二、算法实现使用if-elif-else语句实现defmax_of_three(a,b,c):ifa>=banda>=c:returnaelifb>=aandb>=c:returnbelse:returnc#示例调用print(max_of_three(10,20,15))#输出
企业数字化转型AI能力中台（总体架构、系统功能）建设方案公众号：优享智库数字化转型数据治理主数据数据仓库人工智能架构
**企业数字化转型AI能力中台建设方案**一、建设背景与目标随着大数据、云计算、人工智能等技术的快速发展，企业正面临着数字化转型的重要机遇。为了提升企业的智能化水平，加快业务创新，建设AI能力中台成为企业的迫切需求。本方案旨在为企业打造一套功能完善的AI能力中台，实现数据采集与整合、算法模型管理、智能分析与可视化等核心功能，推动企业在各个业务领域实现智能化升级和创新。二、总体架构设计AI能力中台采
【Python3爬虫】Scrapy入门教程 TM0831 Python3爬虫 Python3 网络爬虫
Python版本：3.5系统：Windows一、准备工作需要先安装几个库（pip，lxml，pywin32，Twisted，pyOpenSSL），这些都比较容易，如果使用的是Pycharm，就可以更方便的安装模块，在settings里可以选择版本进行下载。如果在命令行模式下输入pip-V出现'pip'不是内部或外部命令，也不是可运行的程序或批处理文件，先确保自己在环境变量中配置E:\Python3
Python 爬虫中的反爬策略及详细应对方法 winner8881 python 爬虫开发语言
在构建Python爬虫的过程中，网站为了保护自身资源和用户体验，常常会采取一系列反爬策略来限制或阻止自动化程序的访问。了解这些策略对于设计更智能、更合规的爬虫至关重要。以下是详细的反爬措施及其应对方法：1.User-Agent检测策略描述：许多网站会检查HTTP请求头中的User-Agent字段，以判断请求是否来自浏览器。如果发现是来自非标准用户代理（如Python默认的requests库），可能
1. Python Web 框架要点徐红珍 python django
PythonWeb框架要点1.Web应用程序处理流程2.Web程序框架的意义用于搭建Web应用程序免去不同Web应用相同代码部分的重复编写，只需关心Web应用核心的业务逻辑实现3.Web应用程序的本质接收并解析HTTP请求，获取具体的请求信息处理本次HTTP请求，即完成本次请求的业务逻辑处理构造并返回处理结果——HTTP响应百度ip地址：14.215.177.394.Web框架学习方法如何搭建工程
Miniforge详细安装教程（macOs和Windows）一直在学习的小白~ macos windows conda
(注：主要是解决商业应用anaconda收费问题，这是轻量级的代替，个人完全可以使用anaconda和miniconda)Miniforge是一个轻量级的包管理器，类似于Anaconda和Miniconda。它主要用于安装基于conda的Python环境，专注于兼容ARM架构的设备（如AppleM1/M2/M3芯片）和其它CPU架构。Miniforge使用conda-forge作为默认的包管理渠道
38个基于Python的Web 开发框架快乐星球没有乐 python 前端数据库
Web开发是Python应用中重要的一部分，下面总结了38个基于Python的Web开发框架！其中有的历史悠久，有的发展迅速，还有的已经停止维护，大家可以根据情况参考学习。1Django框架官网：https://github.com/django/django.gitDjango是一个开放源代码的Web应用框架，由纯Python写成，是目前Python语言中主流de三大Web框架之一(flask、
Python 简单爬虫教程 ANTennaaa Python python
就是突然想玩一下这里是一个下载网页内图片的例子环境Python3.7需首先安装pipinstalllxml-ihttps://mirrors.aliyun.com/pypi/simple#fromurllib.requestimporturlretrieve#第一种方法importrequests#第二种方法frombs4importBeautifulSoup'''Ifthetargetdirec
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分