UISEE 2031

驭势导读 | 如何让CNN模型在计算资源受限的应用场景中跑更快？

自驭势科技AI男子天团出道以来，大家都在求“不是博士的小伙伴韦涛的心理阴影面积”。

正确答案是，他的内心没有阴影！他忙着给大家解读一篇有意思的论文呢！

韦涛，毕业于北京大学软件与微电子学院，处女座……

他用“乐观，踏实，好奇心重”三个词来形容自己。作为驭势科技AI天团成员，除了顔值，还需要会写代码，会搞算法，会调板子，会调车子。如果问他，怎么给好基友介绍驭势科技？韦涛说，这里是一个仰望星空，脚踏实地的地方。而青春，就意味着努力工作。

对于那些对AI感兴趣的朋友，韦涛特别推荐《深度学习》“大花书”给大家。

能不能看懂，就看你的IQ了~

该论文主要通过利用Batchnorm Layer中的Scale参数来对模型中通道重要程度进行建模，并引入了L1正则项来对该通道权值进行稀疏化训练，使得最终得到的模型可以更有效的实现通道剪枝，达到网络稀疏化的目标。该论文的通道稀疏化的实现方式非常巧妙。

更多内容，请大家参看原始论文，如果你有什么想法，也欢迎留言我们一起讨论学习~

论文链接：https://arxiv.org/abs/1708.06519

作者github:https://github.com/liuzhuang13/slimming

【论文导读】近些年来，CNN由于其出色的表现，渐渐成为了图像领域中主流的算法框架。

在自动驾驶领域中，许多任务同样可被抽象为图像分类、图像分割、目标检测三个基础问题，因此，CNN在自动驾驶领域中的应用也越来越广泛。

CNN的表现如此突出主要是因为CNN模型有大量的可学习参数，使得CNN模型具备很强的学习能力和表达能力，然而，也正因为这些大量的参数使得在硬件平台上部署CNN模型时有较大困难，尤其是在一些计算资源非常受限的平台上，如移动设备、嵌入式设备等。

在自动驾驶场景中，视觉系统在整个车辆系统中一直扮演着一个十分重要的角色，在视觉算法实际投入应用时，不仅需要算法精度达到极高的指标，也对算法的实时性提出了较高的要求，与此同时，由于场景的特殊性，在自动驾驶场景中算法往往会被部署在一些计算能力较弱的嵌入式开发平台上，因此，如何让CNN模型在计算资源受限的应用场景中跑的更快成为了一个越来越重要的课题。

目前对CNN模型进行加速的方法很多，例如，从快速网络结构设计的角度出发设计设计一些小而精的模型(squeezenet、mobilenet、enet等)，从网络压缩角度出发对训练好的网络在保证精度不变或小幅下降的前提下进行压缩剪枝(deep compression、channel-pruning等)等。

摘要

一直以来，由于受限于CNN模型的计算量，在各种实际应用场景中部署CNN模型一直都是个问题。本文提出了一种新型的网络学习方法以达到如下的三个目标：（1）减少模型大小（2）减小运行时内存（3）减少计算量。

为了实现上述目标，本文主要通过强制增加channel-level的参数并对该参数进行稀疏化训练来实现。与其他的方法不同的是，本文的算法直接应用于训练的环节中，以增加少量计算开销的前提下实现了网络的稀疏化训练。

本文将该算法称作network slimming，该算法的输入是一个“宽大”的网络，在训练过程中，那些不重要的通道会随着训练权值逐渐降低，并通过后处理算法进行通道裁剪，最终得到一个没有精度损失的“瘦小”的网络。

本文在主流的CNN网络结构上验证了该方法，包括VGGNet， ResNet，DenseNet等，并在多个数据集上进行了验证。对于VGGNet，在经过多次network slimming以后，该模型达到了20倍的模型尺寸压缩比以及5倍的模型计算量压缩比。

引言

近些年来，CNN在多种视觉任务中已经变成了一种主流的方法，比如图像分类，目标检测以及图像分割任务等。随着大规模数据集、高端gpu以及新型网络结构的出现，使得一些大模型的部署成为了可能。比如，imagenet比赛中的冠军模型从AlexNet、VGGNet以及GoogLeNet再到ResNet，模型规模逐渐从8层演变成100层以上。

虽然这些大模型具备较强的表达能力，但是这些模型对计算资源的需求也更苛刻。例如像ResNet-152这样的模型，由于需要大量的计算量，因此很难被部署在移动设备以及其他的IOT设备上。

上述提及的部署困难主要受限于如下的三个因素：

1.模型尺寸。CNN模型的强表达能力主要来源于他具有大量可学习的参数，而这些参数将和网络的结构信息一起被保存在存储介质上，当需要使用模型做inference时，再从硬盘上进行读取。举例来说，存储一个典型的在 ImageNet上训练好的模型需要大约300MB的空间，这对于嵌入式设备来说是一个非常大的开销。

2.运行时内存的消耗。在inference过程中，即使batchsize =1,中间层的计算需要消耗远大于模型参数量的内存空间。这对于一些高端的GPU可能不是什么问题，但是对于一些计算资源比较紧张的设备而言，这是一个比较大的部署问题。

3.计算量的大小。当把一款大型CNN模型部署于移动设备上时，由于计算量大同时移动设备计算性能弱，因此可能会消耗数分钟去处理一张图片，这对于一款模型被部署于真实应用中是一个比较大的问题。

当然，现在有很多工作提出可以通过压缩CNN模型来使得模型具备更快的inference性能，这些方法主要包括低秩分解、模型量化、模型二值化、参数剪枝等。然而上述所说的方法都只能解决之前所提到的三个主要问题中的一个或两个，同时，部分方法还需要软件或硬件的支持才能实现真正的加速。

另一个减少CNN计算资源消耗的方法就是网络稀疏化。稀疏化可被应用于不同的层级。本文提出了一种network slimming的网络稀疏化方法，该方法解决了在资源有限的场景下上述所提到的问题。

本文的方法中，主要通过对BatchNorm layer中的scale参数应用了L1正则项，从而非常方便的在当前的框架下实现了通道稀疏化。在该方法中，L1正则项将会使得不重要的通道的BatchNorm Layer中的scale参数推向0附近，通过这样的方法，算法筛选出了不重要的通道，为后续的通道剪枝带来了很多的便利。

与此同时，在该算法中引入的L1正则项并没有带来精度的损失，相反，在一些案例中，反而得到了更高的精度。在做通道剪枝的过程中，裁剪掉一些不重要的通道（即低权值的通道）可能会带来一些精度的损失，但是这些损失的精度可以通过后续的fine-tuning操作补偿回来。剪枝得到的压缩版网络在模型尺寸、运行时内存占用以及计算量方面与初始的网络相比更具竞争力。上述所说的过程可以被重复数次，在进行多道裁剪工序后将会得到压缩比越来越高的网络模型。

根据本文在多个数据集上的实验结果可以验证本文的网络在经过slimming操作后，实现了20倍的模型尺寸压缩以及5倍的模型计算量压缩，而在精度方面没有损失，甚至反而比原始模型更高。此外，由于本文的算法并没有对网络进行参数存储方式对修改，因此该方法可适用于在常规的硬件平台以及软件包上实现网络压缩以及inference加速。

Network Slimming

本文的目标是提供一个简单的策略在CNN上实现通道稀疏。在本章节将对channel-level稀疏的优势以及难点做一些分析，并且介绍了本文如何通过BatchNormLayer的scale参数来实现通道稀疏化。

（1）channel-level 稀疏化的优势

网络稀疏化可以被应用于不同的层级中，主要可分为weigh-level、kernel-level、channel-level或者layer-level。weight-level的稀疏化通常具备高度的灵活性以及通用性，并带来了较大的压缩比，但是该方案通常需要特殊的软硬件加速的支持才能实现最终的加速。

与此相反，layer-level的方案不需要特殊软硬件加速的支持即可实现最终的加速，但是这种方案相比weight-level不够灵活，部分层需要被整个裁剪掉，同时，该方案只会在网络层数特别深的前提下才会显得比较有效。因此，根据上述的对比，channel-level的稀疏化在灵活性以及实现难度方面达到了一个较好的平衡，该方案可被用于各种典型的CNN模型中，为每一个原始模型生成一个“瘦身”版的网络模型，该模型可以在各个常规的CNN平台上高效的运行。

（2）channel-level稀疏化的挑战

要实现channel-level的稀疏化需要裁剪掉所有与被裁剪通道相关的输入通道以及输出通道。直接用算法根据通道权值去裁剪一个预训练模型的通道会比较低效，因为不是所有的通道权值都会分布在0附近。如论文［23］所阐述的，直接在预训练好的ResNet中裁剪时，在精度不损失的前提下，只能裁剪掉～10％的通道。论文［35］通过引入了强制的稀疏正则项来实现通道权值的稀疏化，令通道的权值分布在0附近。本文提出了一种新方法来解决上述问题。

本文的方法就是为每一个通道引入一个scale 因子，该因子将对该通道的输出做乘积运算，从而实现对通道重要程度的建模，本文对模型参数以及scale因子进行联合训练,最后把那些scale因子小的通道裁剪掉并fine-tune整个网络。在引入了正则项以后，优化的目标函数如下式所示：

上式中，(x,y)表示训练的输入项与目标项，W表示可训练的参数，第一项表示CNN常规的训练损失, g(.)是一个引入在scale因子γ上的惩罚项，入表示第一项与第二项之间的权重比。在本文在实现中采用了g(s)=|s|,即L1正则项，被广泛应用于实现网络稀疏化，同时采用了subgradient descent的优化方法来优化L1正则项。

如上图Figure 1所示，当需要裁剪一个通道时仅需要移除该通道的输入与输出的连接即可得到一个压缩后的模型而不需要做其他的一些特殊操作。同时，由于在训练过程中，scale因子实现了对通道的重要程度的建模，因此，当后续做剪枝时，仅需要直接移除那些不重要的通道即可而不会影响模型整体的泛化能力。

（1）利用BatchNorm Layer进行channel-wise的稀疏化

BatchNorm 层已经被广泛的应用于各种CNN结构中，作为一种标准的方法来实现快速收敛以及增强泛化能力。BatchNorm Layer的设计思路启发了作者去设计一种简单有效的方法来实现channel-wise稀疏化。BatchNorm Layer的计算定义如下：

其中zin与zout分别代表Batchnorm Layer 的输入和输出，与分别表示当前mini-batch下面的均值与方差，而与是可学习的参数，可以将规范化后的分布返回到任何一种原始尺度下。

将BN层放置在Convolution层的后面是一种非常通用的方法。因此，可以直接利用BN层中的γ参数来建模通道的重要性，通过这样的设计,不需要引入额外的实现就能达到算法的设计目标，事实上，这是可以用来实现channel-wise稀疏化的最有效也是最快捷的方法。接下来讨论一下ScaleLayer的放置问题。

1.假如只是在Convolution后面增加了scale层而没有使用Batchnorm Layer，Scale层学到的参数对于评估通道的重要性没有意义，因为，Convolutionlayer和Scale layer都是线性变换，可以通过减少Scale因子的值同时放大Convolution Layer的参数值来达到同样的目标。

2.假如将Scale Layer放置在BatchnormLayer前，Scale Layer的效果会被BatchnormLayer 的规范化效果完全抵消掉。

3.将ScaleLayer 插入在Batchnorm Layer 之后时，就可以为每一个通道提供两个scale参数进行通道建模了。

（2）通道剪枝以及Finetune

在引入L1正则项进行网络稀疏化训练以后就可以得到一个多数通道权值在0附近的模型。之后对网络这些权值在0附近的通道进行裁剪，将这些通道对应的输入输出的连接移除。在裁剪过程中，本文采用了一个全局裁剪阈值，比如，当需要裁剪70％的通道时，本文会选取一个裁剪百分位为70％的阈值。通过这样的操作即可得到裁剪后的模型。

经过上述的裁剪操作后，如果采用的裁剪比例较高可能会带来部分精度的损失，但是这部分损失可以通过后续的Finetune操作补偿回来。在作者的实践过程中发现，在进行Finetune操作后，裁剪后的模型往往会比原始的未裁剪的网络精度高。

（3）多次循环剪枝

本文的方法可以从单步操作推广到多步操作。操作流程如下图所示：

根据本文的实践经验发现multi-pass得到的结果往往会得到更高的压缩比。

（4）对Cross Layer Connections 以及 Pre-activation 结构剪枝.

network slimming的方法可以被直接应用于VGGNet、AlexNet这样的网络结构，但是当需要把该方法应用于ResNet、DenseNet这样的网络结构时需要做其他的一些特殊设计。对于这样的网络，前一个网络的输出往往会被作为后面多个网络模块的输入，这些网络中 BN层的放置将被放置在Convolution层前。在这样的网络结构中，为了在inference时实现网络参数以及网络计算量的压缩，需要在不重要的通道前放置一个channel-selection-layer来屏蔽不需要的channel。

结果分析

在Cifar10、Cifar100、SVHN上，本文采用了三种模型结构进行了测试分析。分别为VGGNet、ResNet164、DenseNet-40。在ImageNet数据集上，本文采用了VGGNet-A网络进行了测试分析。下图table 1为在Cifar数据集以及SVHN数据集上进行验证的一些结果。

如上表table1所示，分别在Cifar10、Cifar100以及SVHN三个数据集进行了训练测试，可以看到在这三个数据集中，每一个模型在进行了60％以上的channel-pruning以后，均能保持与原始模型几乎一致的结果，甚至部分模型裁剪后的结果还有提升。

如下图table2所示为VGGNet-A网络在ImageNet上训练测试的一个结果表。当采用了50％的通道裁剪以后，参数裁剪比例超过了5倍，但是Flops裁剪比例仅为30.4％，这是因为在卷积层中只有378个通道被裁剪掉了，而在全连接层中，有5094个通道被裁剪掉。

如下表table4，展示了在VGGNet在Cifar10以及Cifar100上进行multi-pass裁剪的一个对比结果。如在Cifar10数据集上，随着迭代次数的提升，裁剪比例越来越高，在iter 5的时候，得到了最低的test error。此时该模型达到了20x的参数减少和5x的计算量减少。而在Cifar100上，在iter3上，test error开始增加。这可能是因为在cifar100上，类别数目大于Cifar10，所以裁剪的太厉害会影响最终的结果，但是仍然实现了接近90%的参数减少以及接近70%的计算量下降。

如下图Figure 4为本文采用VGGNet在Cifar100上作稀疏化训练一些对比实验，可以发现随着入的增大，模型通道权重的结果会越来越稀疏。

我们的一些实践

由于作者公布的代码是在torch框架下的代码，因此，我们根据作者的论文在Caffe上对上述结果进行了一次简单的验证。在验证过程中采用了VGGNet-A网络作为实验网络，并采用的Cifar10作为训练数据集。

如下图所示，左上为入=0，在iteration = 10000时的入参数分布图，右上为入=0，iteration＝45000的参数分布图。左下为入=10e-4，iteration = 45000的参数统计图，右下为入=10-3, iteration = 45000下的参数统计图。［横轴值除以100为参数实际区间］

根据上面这一组图我们发现如下几点得到了验证。

（1）随着训练次数的增加，入参数在正则项的影响下，逐步左移，重要的通道权值逐步凸显，不重要的通道权值逐步抑制，与论文中Figure6的结论相符

（2）随着入参数的增大，L1正则项的影响越来越大，参数越来越向0点靠拢，稀疏比例提高

（3）在增加L1正则项以后，实现了对通道的稀疏化但训练的结果并没有下降甚至反而有所提升，考虑在训练过程中，“噪声”通道由于L1正则项的引入被抑制，而真正的有效通道被凸显。

因此，我们认为slimming的方法对于channel-wise的稀疏化是有效的。我们也采用同样的参数在ImageNet数据集上进行了实验，实验发现效果并不如在cifar10数据集上那么好，虽然也有参数稀疏化的效果但是并不如cifar10上那么明显，同时参数稀疏化后大部分主要分布在0.2附近，后续我们将进一步进行试验。

总而言之，channel-slimming利用了BatchNorm Layer的特性巧妙的对通道重要性建模并最后实现通道的稀疏化还是非常值得学习的。

重磅推出

驭势科技AI天团最新咖位

计算机视觉算法工程师

工作职责

用视觉识别和理解复杂环境，为视觉主导的无人驾驶系统在感知和定位方提供强有力的支撑。

职位要求

·有扎实的图像分析和模式识别理论基础，精通目标检测、跟踪、识别等常见的计算机视觉处理任务

·有扎实的数学基础，精通常见的几何、统计学等，并熟悉这些技术在图像识别领域中的应用

·有很强的工程能力，精通 C++ 语言以及至少另一种常见编程语言·对计算机结构有深刻的认识，能够开发高性能、实时运行的图像处理软件

·有发明创造的理想和热情，致力于创造解决实际问题的视觉感知技术

优先考虑

· 熟悉VISUAL SLAM 等在机器人定位和导航领域中常用的经典方法 · 熟悉STEREO ， STRUCTURED LIGHT， TOF 等三维成像原理和方法

· 熟悉图像识别领域的常见工具如 OPENCV 等

· 熟悉高性能运算加速工具如 NEON 以及GPGPU 技术如 GLES， CUDA 和OPENCL 等

· 发表过CVPR/ECCV/ICCV/NIPS/ICML 等视觉和 AI 领域会议文章

· 熟悉图像识别领域的常见工具如 OPENCV 、MATLAB 等

机器学习/深度学习算法工程师

工作职责

既要让自动驾驶更好的理解周围

又要挑战更多ML用于无人驾驶的可能

职位要求

· 熟悉机器学习的基本方法 ( 降维、分类、回归、排序等等 )熟悉深度学习原理和基本模型

· 熟练使用 CAFFE ，THEANO 或其他常用深度学习工具，并能够灵活的解决实际问题熟悉计算机视觉和图像处理的常用方法 ( 物体检测、跟踪、分割、分类识别等 ) 。

· 学习能力强，读机器学习、计算机视觉领域的论文易如反掌

· 有很强的工程能力，精通 C++ 语言以及至少另一种常见编程语言· 对计算机架构有深刻的认识，能够开发高性能、实时运行的图像处理软件

· 有发明创造的理想和热情，致力于创造解决实际问题的视觉感知技术尝试将机器学习和深度学习技术应用于非识别领域

优先考虑

· 发表过CVPR/ECCV/ICCV/NIPS/ICML 等视觉和 AI 领域会议文章

· 熟悉图像识别领域的常见工具如 OPENCV 等

· 熟悉高性能运算加速工具如 NEON 以及GPGPU 技术如 GLES， CUDA 和OPENCL等

高性能计算工程师

工作职责

通过GPU和CPU多核加速等一切方式, 实现人工智能算法的极致加速在NVIDIA JETSON等嵌入式平台开发最高效实用的自动驾驶应用程序

任职要求

· 熟练掌握GPU并行算法设计

· 熟练掌握GPU体系结构和CUDA代码调试与优化技术

· 三年以上相关工作经验

· 有TK1/TX1/TX2开发经验和算法移植与优化经验

优先考虑

熟悉常用的计算机视觉、深度学习算法者优先

在驭势AI天团中

你将接触和熟悉最前沿的人工智能算法

与最棒的AI算法工程师合作

完成最高效能低成本的自动驾驶落地产品

更多招聘岗位欢迎点击WWW.UISEE.COM

扫描二维码，驭势科技官网上投简历咯！

软件代码测试如何进行?专业第三方软件测评机构分享第三方软件测评软件测试
软件代码测试是对软件应用程序进行评估的过程，旨在发现软件中的缺陷、错误或潜在问题，确保软件的功能、性能和安全性满足预定的要求。简而言之，软件测试可以看作是对代码进行的一次“健康检查”，通过系统的测试手段，发现并修复程序中的问题。一、软件代码测试的流程1、明确测试目标:设定要测试的功能、性能要求及其他重要标准。2、设计测试用例:根据需求文档和设计文档编写详细的测试用例，涵盖各个测试维度。3、执行测试
软件测试流程有哪些？第三方软件检测机构测试方案推荐第三方软件测评软件测试软件测试
在软件开发周期中，很多软件测试工作与开发工作是同步进行的，人们对于软件测试流程的重视程度也不够，可能在测试工作中就容易造成很多重复性和不规范操作。实际上，理清楚软件测试流程对提高后期软件测试工作效率有很大好处。所以，卓码软件测评小编对软件测试流程进行简单梳理，供大家参考。软件测试流程步骤分析需求文档这一步需要明确用户测试需要文档，对测试业务范围、测试人员分配、测试场景等各个业务流程进行分析。尽可能
leetcode-sql数据库面试题冲刺（高频SQL五十题）我想吃烤肉肉 sql 测试面试数据库 leetcode sql
题目：1633.各赛事的用户注册率用户表：Users±------------±--------+|ColumnName|Type|±------------±--------+|user_id|int||user_name|varchar|±------------±--------+user_id是该表的主键(具有唯一值的列)。该表中的每行包括用户ID和用户名。注册表：Register±---
深入探索iOS底层原理：多线程技术与编程学习 CqppDeveloper ios 学习 cocoa 编程学习
在iOS开发中，多线程技术是至关重要的。它可以帮助我们实现并发执行任务、提高应用程序的响应性能，并充分利用设备的多核处理能力。本文将深入探讨iOS底层原理中与多线程相关的概念和技术，并提供相应的源代码示例。线程与进程的基本概念在开始之前，我们需要了解一些基本概念。线程（Thread）是操作系统调度的最小单位，它是程序执行的单个路径。一个进程（Process）可以包含多个线程，它们共享进程的内存空间
C#中的设计模式：构建更加优雅的代码 Envyᥫᩣᩚ c#开发语言
C#在面向对象编程（OOP）方面的强大支持，我们可以探讨“C#中的设计模式”。这不仅有助于理解如何更好地组织代码，还能提高代码的可维护性和可扩展性。引言设计模式是软件工程中经过实践验证的解决方案模板，它们提供了一种标准化的方法来解决常见的开发问题。对于使用C#进行开发的程序员来说，理解和应用这些模式可以帮助创建结构良好、易于维护和扩展的应用程序。本文将介绍几种常用的设计模式，并展示如何用C#实现它
Python处理CSV文件的12个高效技巧宇宙大豹发 python 开发语言
今天，我们的Python之旅，目标是那片由逗号分隔的宝藏——CSV文件。别看它简单，掌握这些技巧，你的数据处理能力将直线上升，轻松驾驭千行万列的数据海洋。让我们一起，用Python的魔力，让CSV舞动起来吧！1.初次见面，你好，CSV！安装pandas，是这场冒险的起点。它，是Python数据分析的瑞士军刀。pipinstallpandas导入我们的英雄——pandas，并亲切地叫它pd。impo
Python初学者第一天小熊h python初学者 python编译 python语言 python python基础 python初学者
目录一、问答题（1）什么是硬件？什么是软件？（2）比特是什么？字节是什么？（3）内存和存储设备最主要的区别是什么？（4）解释语言和编译语言之间的区别是什么？（5）操作系统的主要任务是什么？（6）可以使用两种模式运行Python。解释这两种模式。（7）找出下面代码中的错误（8）列举代码当中四种异常错误，说明错误原因（9）下面哪些标识符是有效的？哪些是Python关键字？（10）如何使用Python编
高级线程管理_第九章_《C++并发编程实战》笔记郭涤生 #并发线程 c/c++c++并发编程
高级线程管理1.线程池（ThreadPool）1.1线程池结构要素1.2线程池实现步骤2.线程中断（InterruptibleThreads）2.1中断机制实现多选题多选题答案设计题目设计题目答案1.线程池（ThreadPool）核心目的：避免频繁创建/销毁线程，复用固定数量的线程处理任务队列。1.1线程池结构要素任务队列：存储待执行的任务（函数对象）工作线程集合：执行任务的线程同步机制：互斥锁（
为什么需要进行软件测试需求分析?专业第三方软件测评中心分享第三方软件测评需求分析
一、什么是软件测试需求分析?软件测试需求就是了解软件测试要测试什么项目，只有明确了测试需求，才能确定如何进行测试工作、测试时间、测试人员、测试环境、测试工具等等，这些都是测试计划设计的基本要素，因此测试需求则是测试计划的基础与重点。测试需求分析是分析软件应满足的用户需求点，总结出一份软件需求规格说明书，测试人员按照需求规格说明书进行测试。二、为什么要进行软件测试需求分析?1、软件测试需求是设计测试
嵌入式硬件设计 — 智能设备背后的隐形架构大师 begei 面试学习路线阿里巴巴嵌入式硬件架构
目录引言?一、嵌入式硬件设计概述（一）需求分析（二）硬件选型（三）电路设计（四）PCB制作与焊接（五）硬件调试与测试（六）软件移植与开发二、嵌入式硬件选型（一）微控制器（MCU）/微处理器（MPU）（二）存储器（三）传感器与执行器（四）电源管理芯片（五）通信接口芯片三、嵌入式硬件代码开发（一）开发环境搭建（二）底层驱动程序开发引言嵌入式系统已经渗透到我们生活的方方面面，从智能手机、智能家居到工业自
Python 潮流周刊#93：为什么“if not list”比len()快2倍？（摘要） python
本周刊由Python猫出品，精心筛选国内外的250+信息源，为你挑选最值得分享的文章、教程、开源项目、软件工具、播客和视频、热门话题等内容。愿景：帮助所有读者精进Python技术，并增长职业和副业的收入。分享了12篇文章，12个开源项目以下是本期摘要：文章&教程①为什么Python中'ifnotlist'比len()快2倍？②掌握Python单体代码库③Python3.14尾调用解释器的性能④Py
贪心算法--将数组和减半的最小操作数 4C++ 数据结构与算法贪心算法算法
本题是力扣2208---点击跳转题目思路：要尽快的把数组和减小，那么每次挑出数组中最大的元素减半即可，由于每次都是找出最值元素，可以用优先队列来存储这些数组元素每次取出最值，减半后再放入优先队列中，操作次数+1，直到数组和小于等于原总和的一半代码：classSolution{public:inthalveArray(vector&nums){doublesum=0;intcnt=0;priorit
聊聊langchain4j的AiServices llm
序本文主要研究一下langchain4j的AiServices示例原生版本publicinterfaceAssistant{Stringchat(StringuserMessage);}构建Assistantassistant=AiServices.create(Assistant.class,chatLanguageModel);Stringresp=assistant.chat(userMes
2280将数组和减少的最少操作次数（贪心算法）分析+源码+证明懒羊羊大王& 算法（贪心算法）c++(初阶)贪心算法算法
题目解析请你返回将nums数组和至少减少一半的最少操作数。这句话相当于最后数组和小于等于最开始数组和的一半。1.1算法原理解法：贪心+大根堆（堆顶为最大值）具体策略：每次挑选数组中最大的数，进行减半，直到数组和减少到至少一半为止。举例：初始nums的和为5+19+8+1=33。以下是将数组和减少至少一半的一种方法：选择数字19并减小为9.5。选择数字9.5并减小为4.75。选择数字8并减小为4。最
人大预算联网监督系统前端产品产品设计
人大财政预算联网监督是建立和完善中国特色社会主义预算审查监督制度的有益探索，是贯彻实施预算法，加强对政府全口径预算决算审查监督，推动实施全面规范、公开透明预算制度的客观需要，是对人大预算审查监督工作的创新发展。项目地址：Github、国内Gitee演示地址：http://silianpan.cn/bss/以下是演示角色和账号（密码同账号）：超级管理员：seal_adminXXX市人大管理员：xxx
Visual Studio Code (VS Code) – C/C++ 入门
——基于VisualStudioCode官方文档的全面的、具体的入门级教程请移步至https://blog.csdn.net/m0_73287396/article/details/128635316
DeepSeek：中国大模型 “破壁者” 引发的四大产业地震赵同学爱学习人工智能 chatgpt DeepSeek 语言模型大模型开源
导语：当全球AI产业还在为GPT-4的1750亿参数惊叹时，中国团队DeepSeek以颠覆性创新撕开了大模型领域的“铁幕”。这款首个引发国际学术界集体关注的中文大模型，正从技术底层重构产业规则，其冲击波已蔓延至硬件、软件、商业模式的每个角落。一、算力霸权瓦解：低成本训推技术改写游戏规则1.1训练成本“悬崖式下降”DeepSeek通过混合专家架构（MoE）动态路由算法，在同等效果下将模型激活参数压缩
CAS：103301-73-1，UDP-alpha-D-Mannose，UDP-alpha-D-葡萄糖醛酸陕西星贝爱科 103301-73-1
UDP-alpha-D-葡萄糖醛酸（UDP-α-D-Glucuronicacid）是一种重要的生物分子，以下是其详细介绍：基本信息CAS号：103301-73-1分子式：C15H22N2O18P2分子量：580.29g/mol结构特点由尿苷二磷酸（UDP）与D-葡萄糖醛酸（Glucuronicacid）组成。其中，核苷部分为尿苷，糖部分为D-葡萄糖醛酸，是葡萄糖的羟基氧化为羧基的衍生物。生理意义糖
a2,3-唾液酸转移酶|a2,3- sialyltransferase (PmST1) 陕西星贝爱科 a2 3-唾液酸转移酶 PmST1
α2,3-唾液酸转移酶是一种重要的酶类，以下是其详细介绍：基本信息名称：α2,3-唾液酸转移酶，通常被称为PmST1。功能：催化唾液酸在α2,3-键从其激活形式（如胞苷单磷酸N-乙酰神经氨酸，CMP-Neu5Ac）转移到糖蛋白或糖脂的末端半乳糖残基。存在形式：这种酶在生物体内广泛存在，包括细菌在内的某些生物体中都有其身影，并在唾液化糖缀合物的生物合成中发挥关键作用。生理功能改变分子表面性质：α2,
小白零基础学数学建模系列-Day1-数学建模入门介绍与案例实践川川菜鸟数学建模小白到精通系列数学建模
目录一、数学建模的定义和重要性1.1什么是数学建模？1.2数学建模的重要性二、常见的数学建模方法概述2.1线性模型和案例2.1.1特点2.1.2应用2.1.3问题2.1.4模型2.1.5数学表达式2.1.6求解算法2.2非线性模型和案例2.2.1特点2.2.2应用2.2.3问题2.2.4模型2.2.5数学表达式2.2.6算法2.3动态模型2.3.1特点2.3.2应用2.3.3常见问题2.3.4模型
Ubuntu Docker 安装 weixin_44585288 ubuntu docker linux
文章目录使用aptinstalldocker.io安装使用aptinstalldocker-ce安装常见问题参考文章在Ubuntu系统上，安装Docker的常见方式有两种，使用aptinstalldocker-ce和aptinstalldocker.io这两个命令。使用aptinstalldocker-ce安装：通过这个命令安装的DockerCE（CommunityEdition，社区版）是由Do
数组作为HashMap的键南京鼎山电子设备维修张师傅学习Java的一些记录 java 算法开发语言
1、数组的hashcode是根据地址引用计算的。2、Arrays.hashcode静态方法能够根据数组的内容创建相应的hashcode。3、hashmap用数组做key时用的是地址引用计算的的hashcode，所以应避免使用数组为键。如果一定要用数组来作为map的key值的话，有两种方法：1，将数组转化为string2，用list代替记录自：力扣-剑指OfferII033.变位词组，链接力扣。
20240306作业水水阿水水算法开发语言 c语言
1.编写一个伪终端：在真正的终端上运行这个伪终端程序之后，能够执行所有的shell指令，甚至再次运行自己#include#include#include#include#include#include#include#include#include/*编写一个伪终端：在真正的终端上运行这个伪终端程序之后，能够执行所有的shell指令，甚至再次运行自己*//*char*strtok(char*str
Linux下的shell指令（二）水水阿水水 linux bash makefile
作业1>编写脚本，实现文件分类的功能。编写脚本的过程中，要特别注意路径问题1.判断用户的家目录($HOME)下是否存在file_dir这个目录文件如果存在，则询问用户是否清空，如果用户输入的是Y，则清空该目录文件如果用户输入的不是Y则不清空，退出脚本（exit）如果不存在，则新建该目录文件#######################################################
虚幻引擎入门指南-世界构建建议 LiliaY 虚幻引擎入门指南 unreal
1.选择工具快速选择一类快速选择使用某资产的actor统计数据面板也可以选择2.让草沉入地下，与地表垂直，并且向上生长
Transformer动画讲解 - 工作原理 ghx3110 transformer 深度学习人工智能
Transformer模型在多模态数据处理中扮演着重要角色，其能够高效、准确地处理包含不同类型（如图像、文本、音频、视频等）的多模态数据。Transformer工作原理四部曲：Embedding（向量化）、Attention（注意力机制）、MLPs（多层感知机）和Unembedding（模型输出）。阶段一：Embedding（向量化）“Embedding”在字面上的翻译是“嵌入”，但在机器学习和自
educoder实训——流程控制【4】 lzl2040 educoder python实训 python educoder
按从小到大顺序输出小于n的非负整数任务描述本关任务：编写一个能在同一行输出小于n的非负整数的小程序。相关知识rangerange类型表示不可变的数字序列，通常用于在for循环中循环指定的次数。range参数必须为整数，如果省略step参数，则默认为1。如果省略start参数，则默认为0。如果step为零，则会引发ValueError。range对象支持除拼接和重复外的通用序列操作range(sto
Java：AI 浪潮中的隐形支柱 —— 探秘 Java 在人工智能领域的独特地位琢磨先生David 人工智能
引言在人工智能技术席卷全球的今天，当人们谈论AI开发时，Python、R语言、C++等工具总是最先被提及。然而在这个充满创新的领域，有一个"老兵"正悄然发挥着不可替代的作用——自1995年诞生至今的Java语言，凭借其独特的工程化基因，正在构建起AI世界的底层基础设施。本文将揭示Java如何在大数据、机器学习、企业级AI系统等领域持续创造价值。一、Java的AI基因解码跨平台优势的现代意义"一次编
【头歌C语言程序与设计】数据类型与基本操作畅游星辰大海 #头歌C语言程序设计 c语言
目录写在前面正文第1关：数值与字符的通用性实验第2关：转义字符实验第3关：浮点数实验第4关：数值类型综合实验写在最后写在前面本文代码是我自己所作，本人水平有限，可能部分代码看着不够简练，运行效率不高,但都能运行成功。另外，如果想了解更多，请订阅专栏头歌C语言程序与设计正文第1关：数值与字符的通用性实验本关任务：了解C语言中字符型和整型的通用性，根据提示，输出字母p-Q的数值大小，理解英文姓名排序方
使用STM32实现LCD显示粉绿色的西瓜大大 stm32 单片机嵌入式硬件
实现LCD显示内容的关键是通过STM32控制LCD的驱动芯片，将要显示的内容以二进制的方式发送给驱动芯片，然后由驱动芯片控制液晶屏幕显示。下面是一个使用STM32实现LCD显示内容的简单案例，详细说明如下：硬件准备：准备一块STM32开发板和一个带有驱动芯片的LCD屏幕。将LCD屏幕与STM32开发板通过引脚连接。引入必要的库文件：在代码中引入STM32的相关库文件，这些库文件包含了对STM32的
iOS http封装 374016526 ios 服务器交互 http 网络请求
程序开发避免不了与服务器的交互，这里打包了一个自己写的http交互库。希望可以帮到大家。内置一个basehttp，当我们创建自己的service可以继承实现。 KuroAppBaseHttp *baseHttp = [[KuroAppBaseHttp alloc] init]; [baseHttp setDelegate:self]; [baseHttp
lolcat ：一个在 Linux 终端中输出彩虹特效的命令行工具 brotherlamp linux linux教程 linux视频 linux自学 linux资料
那些相信 Linux 命令行是单调无聊且没有任何乐趣的人们，你们错了，这里有一些有关 Linux 的文章，它们展示着 Linux 是如何的有趣和“淘气” 。在本文中，我将讨论一个名为“lolcat”的小工具 – 它可以在终端中生成彩虹般的颜色。何为 lolcat ? Lolcat 是一个针对 Linux，BSD 和 OSX 平台的工具，它类似于 cat 命令，并为 cat
MongoDB索引管理（1）——[九] eksliang mongodb MongoDB管理索引
转载请出自出处：http://eksliang.iteye.com/blog/2178427 一、概述数据库的索引与书籍的索引类似，有了索引就不需要翻转整本书。数据库的索引跟这个原理一样，首先在索引中找，在索引中找到条目以后，就可以直接跳转到目标文档的位置，从而使查询速度提高几个数据量级。不使用索引的查询称
Informatica参数及变量 18289753290 Informatica 参数变量
下面是本人通俗的理解，如有不对之处，希望指正 info参数的设置：在info中用到的参数都在server的专门的配置文件中（最好以parma）结尾下面的GLOBAl就是全局的，$开头的是系统级变量，$$开头的变量是自定义变量。如果是在session中或者mapping中用到的变量就是局部变量，那就把global换成对应的session或者mapping名字。 [GLOBAL] $Par
python 解析unicode字符串为utf8编码字符串酷的飞上天空 unicode
php返回的json字符串如果包含中文，则会被转换成\uxx格式的unicode编码字符串返回。在浏览器中能正常识别这种编码，但是后台程序却不能识别，直接输出显示的是\uxx的字符，并未进行转码。转换方式如下 >>> import json >>> q = '{"text":"\u4
Hibernate的总结永夜-极光 Hibernate
1.hibernate的作用,简化对数据库的编码,使开发人员不必再与复杂的sql语句打交道做项目大部分都需要用JAVA来链接数据库，比如你要做一个会员注册的页面，那么获取到用户填写的基本信后，你要把这些基本信息存入数据库对应的表中，不用hibernate还有mybatis之类的框架，都不用的话就得用JDBC，也就是JAVA自己的，用这个东西你要写很多的代码，比如保存注册信
SyntaxError: Non-UTF-8 code starting with '\xc4' 随便小屋 python
刚开始看一下Python语言，传说听强大的，但我感觉还是没Java强吧！写Hello World的时候就遇到一个问题，在Eclipse中写的，代码如下 ''' Created on 2014年10月27日 @author: Logic ''' print("Hello World!"); 运行结果 SyntaxError: Non-UTF-8
学会敬酒礼仪不做酒席菜鸟 aijuans 菜鸟
俗话说，酒是越喝越厚，但在酒桌上也有很多学问讲究，以下总结了一些酒桌上的你不得不注意的小细节。细节一：领导相互喝完才轮到自己敬酒。敬酒一定要站起来，双手举杯。细节二：可以多人敬一人，决不可一人敬多人，除非你是领导。细节三：自己敬别人，如果不碰杯，自己喝多少可视乎情况而定，比如对方酒量，对方喝酒态度，切不可比对方喝得少，要知道是自己敬人。细节四：自己敬别人，如果碰杯，一
《创新者的基因》读书笔记 aoyouzi 读书笔记《创新者的基因》
创新者的基因创新者的“基因”，即最具创意的企业家具备的五种“发现技能”：联想，观察，实验，发问，建立人脉。第一部分破坏性创新，从你开始第一章破坏性创新者的基因如何获得启示：发现以下的因素起到了催化剂的作用：(1) -个挑战现状的问题；(2)对某项技术、某个公司或顾客的观察；(3) -次尝试新鲜事物的经验或实验；(4)与某人进行了一次交谈，为他点醒
表单验证技术百合不是茶 JavaScript DOM对象 String对象事件
js最主要的功能就是验证表单,下面是我对表单验证的一些理解,贴出来与大家交流交流 ,数显我们要知道表单验证需要的技术点, String对象,事件,函数一:String对象;通常是对字符串的操作; 1,String的属性; 字符串.length;表示该字符串的长度; var str= "java"
web.xml配置详解之context-param bijian1013 java servlet web.xml context-param
一.格式定义： <context-param> <param-name>contextConfigLocation</param-name> <param-value>contextConfigLocationValue></param-value> </context-param> 作用：该元
Web系统常见编码漏洞（开发工程师知晓） Bill_chen sql PHP Web fckeditor 脚本
1.头号大敌：SQL Injection 原因：程序中对用户输入检查不严格，用户可以提交一段数据库查询代码，根据程序返回的结果，获得某些他想得知的数据，这就是所谓的SQL Injection，即SQL注入。本质: 对于输入检查不充分，导致SQL语句将用户提交的非法数据当作语句的一部分来执行。示例： String query = "SELECT id FROM users
【MongoDB学习笔记六】MongoDB修改器 bit1129 mongodb
本文首先介绍下MongoDB的基本的增删改查操作，然后，详细介绍MongoDB提供的修改器，以完成各种各样的文档更新操作 MongoDB的主要操作 show dbs 显示当前用户能看到哪些数据库 use foobar 将数据库切换到foobar show collections 显示当前数据库有哪些集合 db.people.update，update不带参数，可
提高职业素养，做好人生规划白糖_ 人生
培训讲师是成都著名的企业培训讲师，他在讲课中提出的一些观点很新颖，在此我收录了一些分享一下。注：讲师的观点不代表本人的观点，这些东西大家自己揣摩。 1、什么是职业规划：职业规划并不完全代表你到什么阶段要当什么官要拿多少钱，这些都只是梦想。职业规划是清楚的认识自己现在缺什么，这个阶段该学习什么，下个阶段缺什么，又应该怎么去规划学习，这样才算是规划。
国外的网站你都到哪边看？ bozch 技术网站国外
学习软件开发技术，如果没有什么英文基础，最好还是看国内的一些技术网站，例如：开源OSchina，csdn，iteye,51cto等等。个人感觉如果英语基础能力不错的话，可以浏览国外的网站来进行软件技术基础的学习，例如java开发中常用的到的网站有apache.org 里面有apache的很多Projects,springframework.org是spring相关的项目网站,还有几个感觉不错的
编程之美-光影切割问题 bylijinnan 编程之美
package a; public class DisorderCount { /**《编程之美》“光影切割问题” * 主要是两个问题： * 1.数学公式（设定没有三条以上的直线交于同一点）： * 两条直线最多一个交点，将平面分成了4个区域； * 三条直线最多三个交点，将平面分成了7个区域； * 可以推出：N条直线 M个交点，区域数为N+M+1。
关于Web跨站执行脚本概念 chenbowen00 Web 安全跨站执行脚本
跨站脚本攻击(XSS)是web应用程序中最危险和最常见的安全漏洞之一。安全研究人员发现这个漏洞在最受欢迎的网站,包括谷歌、Facebook、亚马逊、PayPal,和许多其他网站。如果你看看bug赏金计划,大多数报告的问题属于 XSS。为了防止跨站脚本攻击,浏览器也有自己的过滤器,但安全研究人员总是想方设法绕过这些过滤器。这个漏洞是通常用于执行cookie窃取、恶意软件传播,会话劫持,恶意重定向。在
[开源项目与投资]投资开源项目之前需要统计该项目已有的用户数 comsci 开源项目
现在国内和国外,特别是美国那边,突然出现很多开源项目,但是这些项目的用户有多少,有多少忠诚的粉丝,对于投资者来讲,完全是一个未知数,那么要投资开源项目,我们投资者必须准确无误的知道该项目的全部情况,包括项目发起人的情况,项目的维持时间..项目的技术水平,项目的参与者的势力,项目投入产出的效益.....
oracle alert log file（告警日志文件） daizj oracle 告警日志文件 alert log file
The alert log is a chronological log of messages and errors, and includes the following items: All internal errors (ORA-00600), block corruption errors (ORA-01578), and deadlock errors (ORA-00060)
关于 CAS SSO 文章声明 denger SSO
由于几年前写了几篇 CAS 系列的文章，之后陆续有人参照文章去实现，可都遇到了各种问题，同时经常或多或少的收到不少人的求助。现在这时特此说明几点： 1. 那些文章发表于好几年前了，CAS 已经更新几个很多版本了，由于近年已经没有做该领域方面的事情，所有文章也没有持续更新。 2. 文章只是提供思路，尽管 CAS 版本已经发生变化，但原理和流程仍然一致。最重要的是明白原理，然后
初二上学期难记单词 dcj3sjt126com english word
lesson 课 traffic 交通 matter 要紧；事物 happy 快乐的，幸福的 second 第二的 idea 主意；想法；意见 mean 意味着 important 重要的，重大的 never 从来，决不 afraid 害怕的 fifth 第五的 hometown 故乡，家乡 discuss 讨论；议论 east 东方的 agree 同意；赞成 bo
uicollectionview 纯代码布局, 添加头部视图 dcj3sjt126com Collection
#import <UIKit/UIKit.h> @interface myHeadView : UICollectionReusableView { UILabel *TitleLable; } -(void)setTextTitle; @end #import "myHeadView.h" @implementation m
N 位随机数字串的 JAVA 生成实现 FX夜归人 java Math 随机数 Random
/** * 功能描述随机数工具类<br /> * @author FengXueYeGuiRen * 创建时间 2014-7-25<br /> */ public class RandomUtil { // 随机数生成器 private static java.util.Random random = new java.util.R
Ehcache（09）——缓存Web页面 234390216 ehcache 页面缓存
页面缓存目录 1 SimplePageCachingFilter 1.1 calculateKey 1.2 可配置的初始化参数 1.2.1 cach
spring中少用的注解@primary解析 jackyrong primary
这次看下spring中少见的注解@primary注解，例子 @Component public class MetalSinger implements Singer{ @Override public String sing(String lyrics) { return "I am singing with DIO voice
Java几款性能分析工具的对比 lbwahoo java
Java几款性能分析工具的对比摘自：http://my.oschina.net/liux/blog/51800 在给客户的应用程序维护的过程中，我注意到在高负载下的一些性能问题。理论上，增加对应用程序的负载会使性能等比率的下降。然而，我认为性能下降的比率远远高于负载的增加。我也发现，性能可以通过改变应用程序的逻辑来提升，甚至达到极限。为了更详细的了解这一点，我们需要做一些性能
JVM参数配置大全 nickys jvm 应用服务器
JVM参数配置大全 /usr/local/jdk/bin/java -Dresin.home=/usr/local/resin -server -Xms1800M -Xmx1800M -Xmn300M -Xss512K -XX:PermSize=300M -XX:MaxPermSize=300M -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=5 -
搭建 CentOS 6 服务器(14) - squid、Varnish rensanning varnish
（一）squid 安装 # yum install httpd-tools -y # htpasswd -c -b /etc/squid/passwords squiduser 123456 # yum install squid -y 设置 # cp /etc/squid/squid.conf /etc/squid/squid.conf.bak # vi /etc/
Spring缓存注解@Cache使用 tom_seed spring
参考资料 http://www.ibm.com/developerworks/cn/opensource/os-cn-spring-cache/ http://swiftlet.net/archives/774 缓存注解有以下三个： @Cacheable @CacheEvict @CachePut
dom4j解析XML时出现"java.lang.noclassdeffounderror: org/jaxen/jaxenexception"错误 xp9802
java.lang.NoClassDefFoundError: org/jaxen/JaxenExc 关键字: java.lang.noclassdeffounderror: org/jaxen/jaxenexception 使用dom4j解析XML时，要快速获取某个节点的数据，使用XPath是个不错的方法，dom4j的快速手册里也建议使用这种方式执行时却抛出以下异常： Exceptio

驭势导读 | 如何让CNN模型在计算资源受限的应用场景中跑更快？

你可能感兴趣的:(驭势导读 | 如何让CNN模型在计算资源受限的应用场景中跑更快？)