lart

卷积神经网络之SqueezeNet(2017)

文章目录

SqueezeNet(2017)

架构

AlexNet
SqueezeNet
Fire module

结构效果
论文动机

概述
相关的工作

模型压缩
CNN MICROARCHITECTURE
CNN MACROARCHITECTURE
NEURAL NETWORK DESIGN SPACE EXPLORATION

结构探索

微结构设计空间探索

微结构元参数
挤压比
权衡1X1和3X3滤波器

宏框架设计空间探索

结论

SqueezeNet(2017)

文档存放更新地址：https://github.com/lartpang/ML_markdown

文章书写匆忙，有些使用了网上其他朋友的文字以及图片，但是没有及时复制对应的链接，在此深表歉意，以及深深的感谢。
如有朋友看到了对应的出处，或者作者发现，可以留言，小弟马上修改，添加引用。

翻译参考: https://zhuanlan.zhihu.com/p/35506370

论文参考: https://arxiv.org/abs/1602.07360

架构

我们在本文的主要目标是确定具有很少参数却同时保持有竞争性的精度的CNN架构。为了实现这一点，我们在设计CNN架构时采用了三个主要策略：

策略1 用1x1过滤器代替3x3过滤器。

给定卷积滤波器的数量的预算，我们使这些滤波器中的大多数为1x1，因为1x1滤波器比3x3滤波器少9倍的参数。

策略2 减少输入到3x3过滤器的通道的数量。

一个完全由3x3滤波器组成的卷积层，该层的参数总量为：（输入通道的数量）∗（滤波器的数量）∗（3 * 3）。因此，为了维持CNN的参数总数是少量的，不仅要减少3×3滤波器的数量（见上面的策略1），而且要减少3×3滤波器的输入通道数。我们使用挤压层将输入到3x3个过滤器的通道数量减少。

策略3 在网络后期下采样，使得卷积层具有大的激活图。

卷积网络的每一层都会输出一个激活图，它的分辨率最少是1X1，而更多时候是大于1X1 。激活图的高度和宽度由以下因素控制：

输入数据的大小（例如256X256）

在CNN架构的哪些层进行下采样的选择

最常见的做法是，通过在一些卷积或池化层中设置（stride > 1），将下采样应用到CNN架构（例如（Szegedy等人，2014；Simonyan＆Zisserman，2014；Krizhevsky等人，2012））。如果在网络的早期的那些层使用较大的步幅，那么大部分的层的激活图都会较小。相反，如果大部分的层的步幅都是1，而步幅大于1的层都集中在末端，那么网络中大部分的层都会有大的激活图。我们的直觉是，在其他的因素不变的情况下，大的激活图（由于延迟下采样）会产生更高的分类精度（He＆Sun，2015）。

策略1和2都是关于如何保持准确性的同时减少CNN的参数量。策略3是关于在有限的参数量预算上最大化精度。

我们的Fire模块是我们的CNN架构的构建块，使我们能够成功地应用战略1,2和3。

AlexNet

SqueezeNet

主要有三种SqueezeNet模型.

SqueezeNet是以一个独立的卷积层（conv1）为开端，跟着是8个fire模块（fire2-9），最后以一个最终的卷积层（conv10）结束。
从网络的开始到结束逐渐增加每个fire模块的过滤器数量。
SqueezeNet在层conv1，fire4，fire8之后使用步长为2的max-pooling, 在conv10后使用了全局平均池化
这些相对较后的pooling安排是根据构建策略3。

我们在下表给出了完整的SqueezeNet架构。

SqueezeNet架构尺寸。（这张表的格式受到Inception2论文（Ioffe＆Szegedy，2015）的启发）

在评估SqueezeNet时，我们用AlexNet和与之相关的模型压缩结果作为比较的基础。

为了使扩展模块的1x1和3x3滤波器的输出激活具有相同的高度和宽度，我们对输入到扩展模块的3x3滤波器的数据进行添加零填充的1个像素的边界。
ReLU（Nair＆Hinton，2010）被应用于挤压层和扩展层的激活。
在fire9模块之后使用比率为50％的dropout（Srivastava等人，2014）。
注意SqueezeNet没有全连接层; 这个设计选择是受到NiN启发。
当训练SqueezeNet的时候，从0.04的学习率开始，然后在训练过程中线性地减少学习率，如（Mishkin et al。2016）所述。
Caffe框架本身并不支持包含多个滤波器分辨率的卷积层（例如1x1和3x3）（Jia等人，2014）。为了解决这个问题，我们的扩展层由两个独立的卷积层实现：一个是滤波器为1x1的层和一个滤波器为3x3的层。然后，我们在通道维中将这些层的输出连接在一起。这在数值上等同于实现一个包含1x1和3x3滤波器的层。

Fire module

微结构视图：在Fire模块中组织卷积过滤器。

在这个例子中， $s_{1\times1} = 3，e_{1\times1} = 4，e_{3\times3} = 4$ 。

我们这里展示的是卷积滤波器不是激活。

我们对Fire模块定义如下。

包括挤压卷积层（它仅有1x1滤波器）
包括扩展层——挤压层被输入到该层，由1x1和3x3卷积滤波器的混合组合而成

这里的扩展层是包含不同类型滤波器的卷积层
在fire模块中自由使用1x1过滤器是构建策略1的一个应用。
我们在Fire模块中公开了三个可调整维度（超参数）：，和。
- 是挤压层（所有1x1）的滤波器数量
- 是扩展层中1x1滤波器的数量
- 是扩展层中的3x3滤波器的数量。
我们将 $s_{1\times1}$ 设置为小于（ + ），挤压层有助于限制3x3过滤器的输入通道数，如构造策略2所述。

结构效果

在评估SqueezeNet时，我们用AlexNet和与之相关的模型压缩结果作为比较的基础。

比较SqueezeNet和模型压缩方法。

这里的模型大小是指在训练模型中存储所有参数所需的字节数。

基于SVD的方法能把预训练的AlexNet模型压缩5倍，但top-1精度降低到56.0％（Denton等人，2014）。
使用网络修剪方法，实现模型减少9倍，同时在ImageNet上保持了57.2％的top-1和80.3％的top-5精度的基准（Han 等人，2015b）。
深度压缩使模型尺寸减小35倍，同时仍然保持基准的精度水平（Han 等人，2015a）。
与AlexNet相比，SqueezeNet实现了模型尺寸减少50倍，同时达到甚至超过AlexNet的top-1和top-5精度。

这样看来，我们已经超过了模型压缩社区的最先进的结果：即使使用未压缩的32位值表示模型，在保持或超过基准精度下，SqueeezeNet的模型大小仍比模型压缩社区的最好结果小1.4倍。

直到现在，一个尚未解决的问题是：是小模型适合被压缩，还是小模型“需要”密集浮点值才能提供强大的表示能力？(are small models amenable to compression, or do small models “need” all of the representational power afforded by dense floating-point values?)

为寻找这个问题的答案，我们应用深度压缩（Han等，2015a），33％稀疏度和8位量化，对SqueezeNet进行压缩。

这产生了与AlexNet精度相当的0.66MB模型（比32位AlexNet小363倍）。此外，在SqueezeNet上应用设置为6位和33％稀疏性的深度压缩，我们生成具有同等精度的0.47MB模型（比32位AlexNet小510倍）。我们的小模型确实适合压缩。

此外，这些结果表明，深度压缩（Han等人，2015a）不仅在具有大参数量（例如AlexNet和VGG）的CNN架构上表现良好，而且还能够压缩已经压缩过的，全卷积的SqueezeNet架构。深度压缩将SqueezeNet压缩10倍，而且同时保持精度基准。

总言之：通过将创新的CNN架构（SqueezeNet）与最先进的压缩技术（深度压缩）相结合，我们实现了模型尺寸减少510倍，而且与基准相比精度并没有降低。

最后，注意到深度压缩（Han等人，2015b）架构使用codebook把CNN参数量化成6位或8位精度。

https://zh.wikipedia.org/zh-cn/編碼簿

codebook 编码簿

(自我感觉有点类似于一个编码后的表, 如同索引图像的那个颜色索引表)

因此，在大多数商用处理器上，使用深度压缩方案实现具有8位量化的32/8 = 4x或使用6位量化的32/6 = 5.3x的加速并不是没有价值的。然而，Han等人开发的定制硬件 - 高效推理机（EIE） - 可以更有效地用cookbook量化的CNN（Han等人，2016a）。

此外，在我们发布SqueezeNet的几个月后，P. Gysel开发了一种称为Ristretto的策略，将SqueezeNet线性量化为8位（Gysel，2016）。具体的说，Ristretto确实用8位进行计算，并以8位数据类型存储参数和激活。在使用Ristretto的8位计算策略进行SqueezeNet推理过程中，Gysel发现当使用8位而非32位数据类型时，精度下降小于1个百分点。

论文动机

概述

最近对深度卷积神经网络（CNNs）的研究主要集中在提高精度上。

对于给定的准确度水平，通常存在多个实现该准确度水平的CNN架构。给定等效精度，具有较少参数的CNN架构具有若干优点:

更高效的分布式训练。

服务器间的通信是分布式CNN训练的可扩展性的制约因素。对于分布式的数据并行训练，通信开销与模型中的参数数量成正比（Iandola等，2016）。简言之，小模型需要较少的通信所以训练得更快。
传输模型到客户端的耗费较少。

对于自动驾驶，有些公司，例如特斯拉公司，会定期将新模型从服务器复制到客户的汽车，这种做法通常被称作空中（OTA）升级。消费者报告指出特斯拉Autopilot的半自动驾驶功能的安全性随着近期的空中升级（消费者报告，2016）而逐渐增强。然而现今典型的CNN/DNN模型的空中升级需要大量的数据传输。例如更新AlexNet模型，需要从服务器传输240MB的通信量到汽车。较小的模型需要的通信更少，这样使得频繁的更新变得更可行。
可行的FPGA和嵌入式部署。

FPGA通常仅有小于10MB的片上存储器而且没有片外存储器。当FPGA实时地处理视频流时，一个足够小的模型能直接存放在FPGA上，而不会让存储带宽成为它的瓶颈（Qiu等，2016）。当在专用集成电路（ASIC）上部署CNN时，一个足够小的模型可以直接存储在芯片上，并使ASIC有可能配得上更小的管芯。

为了提供所有这些优势，我们提出了一个名为SqueezeNet的小型CNN架构。SqueezeNet在ImageNet上实现了AlexNet级别的精度，参数减少了50倍。另外，使用模型压缩技术，我们可以将SqueezeNet压缩到小于0.5MB（比AlexNet小510倍）。

结构探索

微结构设计空间探索

到目前为止，我们已经提出了小型模型结构设计策略，并遵循这些理论，创建了SqueezeNet，SqueezeNet比AlexNet小50倍却具有与之同等的精度。然而，SqueezeNet和其他模型仍然是一个广泛并且大部分设计空间未被开发的CNN架构。

在前面, 我们探讨关于设计空间的几个方面。我们将架构探索分为两个主题：微架构探索（每个模块层的维度和配置）和宏架构探索（由模块和其他层构成的高级的端到端组织）。

以开头提出的设计策略为指引，以提供关于微结构设计空间的形状的直观认知为目的，我们在本节里设计并执行实验，注意，在这里我们的目标不是最大化每个实验的准确性，而是理解CNN架构选择对模型大小和精度的影响。

微结构元参数

SqueezeNet的每个fire模块都有我们定义的三维超参数：, 和。SqueezeNet有8个fire模块，共24维超参数。为了对SqueezeNet类的架构的设计空间进行探讨，我们定义了以下一组更高级别的元参数，用于控制CNN中所有fire模块的尺寸。

我们将 $base_{e}$ 定义为CNN的第一个fire模块的扩展过滤器数。在每个 $f r e q$ fire模块后，我们增加个扩展过滤器。也就是说，对于fire模块i，扩展滤波器的数量是。
在fire模块的扩展层，一些过滤器是1X1，一些为3x3. 我们定义 $e_{i}=e_{i,1x1}+e_{i,3x3}$ .

用来作为（范围[0, 1]，被所有fire模块共享）为3X3的扩展过滤器的百分比。换句话说，和。
最后，我们使用称作挤压比（SR）（范围是[0, 1]，在所有Fire模块共享）的元参数，定义fire模块挤压层中的过滤器数量：（或等价地。

SqueezeNet是我们用上述的元参数集生成的示例体系结构。

具体地说，SqueezeNet有以下元参数：

挤压比

前面我们提出通过使用挤压层减少3X3滤波器的输入通道数，从而减少参数量。

我们将挤压比（SR）定义为挤压层的过滤器数量与扩展层的过滤器数量之间的比率。

现在我们设计一个实验，研究挤压比对模型的大小和精度的影响。

探索挤压比（SR）对模型尺寸和精度的影响。

在这些实验中，我们使用前文给出的完整SqueezeNet结构作为起点。

跟在SqueezeNet中一样，这些实验使用以下元参数：。

我们训练多个模型，每个模型有不同的挤压比，挤压比的范围是[0.125, 1.0]。

在上图中，我们展示了这个实验的结果，图上的每个点代表一个独立的模型，这些模型都是从头开始训练的。SqueezeNet是这个图中SR=0.125的点。

当SR的增量超过0.125时，可以使ImageNet的 top-5精确度大大提升，从80.3％（即AlexNet级别) 到86.0％，而模型大小从4.8MB增加到了19MB
当SR=0.75（19MB模型）时，精度稳定在86.0％
设置SR=1.0，即使进一步增加模型尺寸，精度也没有提高

权衡1X1和3X3滤波器

前文我们提议用1X1滤波器替换一些3X3滤波器来减少CNN的参数量。

一个尚未解决的问题是，CNN过滤器的空间分辨率有多重要？

VGG（Simonyan＆Zisserman，2014）架构的大多数层的滤波器的分辨率是3×3的; 而GoogLeNet（Szegedy等人，2014）和Network in Network（NiN）（Lin等人，2013）的一些层中有1X1滤波器。在GoogLeNet和NiN中，作者只是单纯地提出使用一定数量的1X1和3X3的滤波器，并没有进一步分析。我们在这里试图阐明1X1和3X3的滤波器占的比例是如何影响模型的大小和精度。

探索扩展层中3x3过滤器比例（pct3x3）对模型大小和准确性的影响。

在本实验，我们使用以下元参数：，我们将从1％变化到99％。换句话说，每个Fire模块的扩展层的过滤器数量都是预定义好的，而过滤器都是1x1或3x3的。在这里我们将这些过滤器上的旋钮从“大部分是1X1“转换到”大部分是3X3。
与之前的实验一样，这些模型有8个Fire模块，跟前面的结构图所示, 有相同的层次组织结构。我们显示了该实验的结果。注意，上一小节的图和本小节的图所示两个13MB模型有着相同的框架：SR=0.500和 =50%。
在图中可以看到，使用比率为50％的3X3滤波器时，top-5精度稳定在85.6％，进一步增加3X3滤波器所占的百分比会使模型尺寸变大，但是在ImageNet上的精度并没有提高。

宏框架设计空间探索

我们在宏架构层面探讨Fire模块间的高级连接的设计决策。受ResNet的启发（He等人，2015b），我们研究了三种不同的架构：

简单纯粹的 SqueezeNet（如前面的章节所述）。
部分Fire模块间有简单旁路连接的squeezeNet。（受（Srivastava等人，2015; He等人，2015b）的启发。）
其余的Fire模块间建立了复杂旁路连接的squeezeNet。

我们在图中说明了SqueezeNet的这三个变体。

我们的简单旁路架构在fire模块3，5，7，9间建立连接，这些模块需要学习一个关于输出和输入的残差方程。
跟ResNet一样，在Fire3建立旁路连接，我们设置Fire4的输入为（fire2的输出+fire3的输出），前面式子的“+”号是元素级相加。

这些操作改变了Fire模块的参数的正规化，根据ResNet，能够提高最后的精确度，或者改善整个模型的训练能力。

一个限制是，有个简单明了的情况，输入的通道数量和输出的通道数量必须相同; 因此，如中间图所示，仅有一半的Fire模块可以有简单的旁路连接。

当不能满足“相同数量的通道”要求时，我们使用复杂的旁路连接，如右图。简单的旁路是“仅有线”，而复杂旁路则包含1x1卷积层，该层的滤波器的数量等于所需的输出通道的数量。

ResNet中也提到,为了保证输出通道数一直,要使用卷积来进行调整.

ResNet中提到:

如果不是这种情况（例如，当更改输入/输出通道时），我们可以通过快捷连接执行线性投影 $W_s$ 来匹配维度： $y=F(x,W_i)+W_sx$ .

尽管上述符号是关于全连接层的，但它们同样适用于卷积层.

函数 $F(x，W_i)$ 可以表示多个卷积层。元素加法在两个特征图上逐通道进行.

值得注意的是，复杂的旁路连接会给模型添加额外的参数，而简单的旁路连接则不会。

除了改变正则化之外，对我们来说直观的是，添加旁路连接将有助于减轻挤压层引入的表示性瓶颈。

SqueezeNet的挤压比（SR）为0.125，意味着每个挤压层比其相应的扩展层的输出通道少8倍。由于这种严重的维度减少，可以通过挤压层的信息量有限。然而，通过在SqueezeNet的层间添加旁路连接，我们开辟了让信息绕挤压层流动的途径。

我们按照图中的三个宏架构训练SqueezeNet，而模型间的精度和模型大小比较在下表。

使用不同的宏架构配置的SqueezeNet的精度和模型大小

在探索宏架构时，我们按照最前面的完整的SqueezeNet结构参数固定了微结构。

无论是添加了复杂的还是简单的旁路连接都比简单的SqueezeNet架构精度高。
有趣的是，添加了简单的旁路的模型比复杂旁路的模型的精度更高。
添加了简单的旁路连接的模型在不增加模型尺寸的情况下，top-1精度增加了2.9个百分点，top-5精度提高了2.2个百分点。

结论

在本文中，我们提出了一个更严谨的方法来探索卷积神经网络的设计空间。

为实现这个目标，我们提出了SqueezeNet，这个CNN架构的参数比AlexNet少50倍，却在ImageNet上保持着AlexNet级别的精度。我们还将SqueezeNet压缩到小于0.5MB，也就是比没有压缩过的AlexNet小510倍。

我们在2016年以技术报告发表本文后，Song Han和他的同事尝试进一步研究SqueezeNet和模型压缩。基于一种称为密集稀疏密度（DSD）的新方法（Han等人，2016b），Han等人在训练时使用模型压缩作为正则化器，进一步提高精度。他们的研究生成了压缩的SqueezeNet参数集，它们在ImageNet-1k上的精度提高了1.2个百分点，他们还生成了未压缩的SqueezeNet参数集，与我们在表2中的结果相比高4.3个百分点。

我们在本文开头提到，小模型更适合应用在FPGA上。自从我们发布了SqueezeNet模型，Gschwend开发一些SqueezeNet的变种并在FPGA上实现了（Gschwend，2016）。正如我们的预期，Gschwend能够将一个SqueezeNet类的模型的参数完全存储在FPGA中，而无需用片外存储器加载模型参数。

在本文，我们将ImageNet作为目标数据集。

在ImageNet上训练好的CNN模型用于日常的应用已成为常见的做法，如细粒度物体识别（Zhang等人，2013；Donahue等人，2013），图像中的标志识别（Iandola等人，2015），给看图说话（Fang等人，2015）等。用ImageNet训练过的CNN也被应用于很多与自主驾驶有关的应用，包括图像（Iandola等人，2014; Girshick等人，2015; Ashraf等人，2016）和视频（Chen等，2015b）的行人和车辆检测，以及分割道路的形状（Badrinarayanan等，2015）。我们认为对各个领域的应用而言，SqueezeNet是一个很好的选择，特别是那些对模型的“小”很看重的应用领域。

SqueezeNet 是我们在探索CNN架构设计空间时发现的几个新的CNN之一。我们希望SqueezeNet将激励读者以更系统的方式思考和探索CNN架构的设计空间的广泛的可能性。

你可能感兴趣的:(深度学习,#,深度网络论文学习)

Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
DETR革命：目标检测的Transformer时代加油吧zkf 目标检测 YOLO python 开发语言人工智能图像处理
《DETR从0到1：目标检测Transformer的崛起》为什么会有DETR？在深度学习目标检测发展史上，2014~2019年几乎被基于卷积神经网络（CNN）的检测器统治：两阶段：FasterR-CNN、MaskR-CNN单阶段：YOLO、SSD、RetinaNet这些检测器虽然效果强大，但背后依赖：✅Anchor（先验框）✅NMS（非极大值抑制）✅特征金字塔、手工设计问题：结构复杂、调参困难、不
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
大模型算法工程师技术路线全解析：从基础到资深的能力跃迁 Mr.小海大模型算法数据挖掘人工智能机器学习深度学习机器翻译 web3
文章目录大模型算法工程师技术路线全解析：从基础到资深的能力跃迁一、基础阶段（0-2年经验）：构建核心知识体系与工程入门数学与机器学习基础编程与深度学习框架NLP与Transformer入门二、进阶阶段（2-4年经验）：深化模型技术与工程落地能力大模型预训练与微调技术预训练原理：数据与任务的协同设计微调工具：参数高效适配与工程优化对齐实践：价值观优化与实证效果分布式训练与框架工具并行策略：多维度协同
【深度学习-Day 36】CNN的开山鼻祖：从LeNet-5到AlexNet的架构演进之路吴师兄大模型深度学习入门到精通 python pytorch 开发语言人工智能 CNN 深度学习大模型
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
人脸识别实战：使用Python OpenCV 和深度学习进行人脸识别(2)
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
TensorFlow深度学习实战——DCGAN详解与实现盼小辉丶深度学习 tensorflow 生成对抗网络
TensorFlow深度学习实战——DCGAN详解与实现0.前言1.DCGAN架构2.构建DCGAN生成手写数字图像2.1生成器与判别器架构2.2构建DCGAN相关链接0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetwork,DCGAN)是一种基于生成对抗网络(GenerativeAdversarialNetwork,GAN)的深度学
基于cnn和resnet和mobilenet对比实现驾驶员分心检测深度学习乐园 cnn 人工智能神经网络
演示效果及获取项目源码点击文末名片本项目旨在通过深度学习技术，结合卷积神经网络（CNN）模型、ResNet模型和MobileNet模型，实现对驾驶员分心行为的自动检测。我们通过训练这些模型来识别不同的驾驶员分心行为，包括如发短信、通话、喝水等行为。使用的数据集包含驾驶员行为的图片，并且针对每个行为标注了相应的标签（例如"正常驾驶"、"右手发短信"等）。MobileNetV2是Google于2018
opencv 4.12.0版本发布详解：核心优化与新特性全解析 Risehuxyc #opencv opencv 人工智能计算机视觉
OpenCV4.12.0夏季更新带来核心模块优化、图像处理增强、深度学习支持扩展及新兴硬件适配，全面提升计算机视觉开发效率与性能。引言OpenCV（开源计算机视觉库）作为计算机视觉领域最受欢迎的开源库之一，在2025年7月发布了4.12.0版本。这个夏季更新带来了大量性能优化、新功能和错误修复，覆盖了核心模块、图像处理、3D校准、深度学习等多个领域。本文将详细介绍OpenCV4.12.0的主要更新
如何用深度学习实现图像风格迁移
最近研学过程中发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击链接跳转到网站人工智能及编程语言学习教程。读者们可以通过里面的文章详细了解一下人工智能及其编程等教程和学习方法。下面开始对正文内容的介绍。前言图像风格迁移是人工智能领域中一个非常有趣且富有创意的应用。它能够让一张普通的照片瞬间变成梵高笔下的《星月夜》风格，或者像莫奈的《睡莲》一样充满艺术感。这种技术不仅在
AI人工智能领域TensorFlow的模型训练策略 AIGC应用创新大全人工智能 tensorflow python ai
AI人工智能领域TensorFlow的模型训练策略关键词：TensorFlow、模型训练、深度学习、神经网络、优化策略、分布式训练、迁移学习摘要：本文将深入探讨TensorFlow框架下的模型训练策略，从基础概念到高级技巧，全面解析如何高效训练深度学习模型。我们将从数据准备、模型构建、训练优化到部署应用，一步步揭示TensorFlow模型训练的核心技术，并通过实际代码示例展示最佳实践。背景介绍目的
ROS2 通过相机确定物品坐标位置
要实现通过相机确定物品坐标位置，通常需要相机标定、物体检测和坐标转换几个步骤。下面我将提供一个完整的解决方案，包括相机标定、物体检测和3D坐标估计。1.系统架构相机标定-获取相机内参和畸变系数物体检测-使用OpenCV或深度学习模型检测物品坐标转换-将2D图像坐标转换为3D世界坐标ROS2集成-将上述功能集成到ROS2节点中2.实现步骤2.1创建功能包bashros2pkgcreateobject
【机器学习&深度学习】什么是量化？一叶千舟深度学习【理论】机器学习深度学习人工智能
目录前言一、量化的基本概念1.1量化对比示例1.2量化是如何实现的？二、为什么要进行量化？2.1解决模型体积过大问题2.2降低对算力的依赖2.3加速模型训练和推理2.4优化训练过程2.5降低部署成本小结：量化的应用场景三、量化的类型与实现3.1权重量化（WeightQuantization）3.2激活量化（ActivationQuantization）3.3梯度量化（GradientQuantiz
基于AutoCut实现在文档中按照片段剪辑视频 Mr数据杨 Python 音频技术音视频
本项目致力于通过构建一个具备深度学习支持的多功能视频处理环境，为用户提供高效、智能的视频编辑和字幕生成工具。依托Anaconda环境管理工具和PyTorch的GPU加速能力，用户能够迅速搭建一个符合项目需求的Python环境。结合FunClip的源代码以及相关插件的安装和配置，用户可充分利用项目所支持的图像、音频识别功能，并以极少的配置便获得理想的视频裁剪效果。项目的核心在于简化深度学习项目的环境
基于深度学习的和平精英（吃鸡）内置锁头训练摆烂仙君深度学习人工智能
前言本教程以和平精英为例，主要讲解如何构建深度学习模型对游戏中角色进行头部标注，并控制鼠标对其进行锁定射击，同时围绕其游戏防作弊系统进行算法攻防讲解，该方案对于csgo,cf等游戏也同样适用。请注意，该教程仅供娱乐教学，若本教程评论超过100，将会开源相关代码并对实际的代码部署进行进一步分析。一、和平精英伤害机制分析在《刺激战场》（现为《和平精英》）中，击中头部的伤害远高于身体其他部位，这是由游戏
迁移学习让深度学习更容易城市中迷途小书童
摘要：一文读懂迁移学习及其对深度学习发展的影响！深度学习在一些传统方法难以处理的领域有了很大的进展。这种成功是由于改变了传统机器学习的几个出发点，使其在应用于非结构化数据时性能很好。如今深度学习模型可以玩游戏，检测癌症，和人类交谈，自动驾驶。深度学习变得强大的同时也需要很大的代价。进行深度学习需要大量的数据、昂贵的硬件、甚至更昂贵的精英工程人才。在ClouderaFastForward实验室，我们
股票基金量化开源平台对比 Mr.小海开源开源金融
股票基金量化开源平台对比分析报告引言研究背景与意义在金融科技快速发展的背景下，量化交易已成为现代金融市场中投资者追求高效与精准交易的核心工具。通过程序化方式，投资者能够迅速处理海量市场数据，制定并执行复杂交易策略，其高效性、低情绪干扰及策略多样性等优势显著[1]。特别是随着人工智能技术的深化，2025年基于深度学习与机器学习的开源量化工具持续涌现，推动行业向数据驱动转型——量化交易将决策逻辑从经验
开源基金/股票量化平台调研报告 Mr.小海金融
开源基金/股票量化平台调研报告引言调研背景与目的近年来，随着人工智能技术的持续深化，量化交易领域迎来了深刻变革。2025年，基于深度学习和机器学习的开源工具不断涌现，不仅在技术层面实现突破，更在实际应用中展现出强大竞争优势，推动行业创新与升级[1].作为融合数学、统计与计算机技术的科技驱动型金融策略，量化交易通过自动化与数据驱动方法提升投资决策效率与准确性，已成为金融机构与投资者追求超额收益的重要
Python Gradio：快速搭建人脸识别应用 Python编程之道 Python人工智能与大数据 Python编程之道 python 开发语言 ai
PythonGradio：快速搭建人脸识别应用关键词：Python,Gradio,人脸识别,深度学习,计算机视觉,交互式应用,模型部署摘要：本文详细介绍了如何使用Python的Gradio库快速搭建一个交互式的人脸识别应用。我们将从基础概念出发，逐步讲解人脸识别的核心算法原理、Gradio的界面设计方法，并通过完整的项目实战演示如何将深度学习模型部署为可交互的Web应用。文章包含详细的代码实现、数
DataWhale 二月组队学习-深入浅出pytorch-Task04 －273.15K DataWhale组队学习学习 pytorch 人工智能
一、自定义损失函数1.损失函数的作用与自定义意义在深度学习中，损失函数（LossFunction）用于衡量模型预测结果与真实标签之间的差异，是模型优化的目标。PyTorch内置了多种常用损失函数（如交叉熵损失nn.CrossEntropyLoss、均方误差nn.MSELoss等）。但在实际任务中，可能需要针对特定问题设计自定义损失函数，例如：处理类别不平衡问题（如加权交叉熵）实现特殊业务需求（如对
大模型核心概念 | 嵌入模型（Embedding）、向量模型（Vector Model）
一、核心概念解析1.1嵌入模型（Embedding）作为AI领域的核心基础技术，嵌入模型通过将非结构化数据映射为低维稠密向量，实现语义特征的深度捕捉：文本嵌入：如将语句转换为1536维向量，使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入：支持图像与文本的联合向量空间映射，如CLIP模型实现文图互搜1.2向量模型（VectorModel）作为嵌入技术的下游应用体系，主要包含两大方向
Python实现神经网络算法指南代码编织匠人 python 神经网络算法
Python实现神经网络算法指南神经网络是一种模拟人脑神经元结构进行信息处理的机器学习算法。在深度学习领域中，神经网络是最为强大的算法之一。Python作为一门简单易学的编程语言，也成为了许多人选择实现神经网络算法的首选语言。在本篇文章中，我们将通过Python代码来实现神经网络算法。导入必要的库为了实现神经网络算法，我们需要导入一些必要的Python库，包括numpy和matplotlib。其中
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现神经网络15044 仿真模型神经网络机器学习图像处理 cnn 人工智能机器人
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.引言在当今的互联网通信时代，实时语音通信已成为人们日常生活中不可或缺的一部分。然而，语音通信质量常常受到回声、背景噪声等因素的严重影响。为了解决这些问题，我们需要高效的语音增强技术。本文将详细介绍如何将DTLC-AEC（深度学习回声消
目标检测-YOLOv5 wydxry 深度学习目标检测 YOLO 人工智能深度学习
YOLOv5介绍YOLOv5是YOLO系列的第五个版本，由Ultralytics团队发布。虽然YOLOv5并非JosephRedmon原团队发布，但它在YOLOv4的基础上进行了重要的优化和改进，成为了深度学习目标检测领域中的热门模型之一。YOLOv5的优势不仅体现在其性能上，还包括其简洁易用、部署便捷的特点。相较于YOLOv4，YOLOv5对于代码框架的重构、推理速度的提升，以及模型的轻量化等方
【DW11月-深度学习】Task03前馈神经网络沫2021
参考链接：https://datawhalechina.github.io/unusual-deep-learning/#/4.%E5%89%8D%E9%A6%88%E7%A5%9E%E7%BB%8F%E7%BD%91%E7%BB%9C一、神经元模型2.1神经元1943年，美国神经生理学家沃伦·麦卡洛克(WarrenMcCulloch)和数学家沃尔特·皮茨(WalterPitts)对生物神经元进行
仓库货物检测：基于YOLOv5的深度学习应用与UI界面开发 YOLO实战营 YOLO 深度学习 ui 目标跟踪目标检测人工智能
一、引言随着电商和物流行业的快速发展，仓库货物管理已经成为企业运营中至关重要的环节。为了提高仓库管理的效率和准确性，越来越多的企业开始应用自动化技术来完成货物的盘点、分类、分拣等任务。传统的货物管理方式通常依赖人工检查，不仅效率低下，而且容易出现误差。为了克服这些问题，利用计算机视觉和深度学习技术来实现仓库货物的自动化检测成为了一种有效的解决方案。本博客将介绍如何使用YOLOv5进行仓库货物检测，
Transformer：自注意力驱动的神经网络革命引擎大千AI助手人工智能 Python #OTHER transformer 神经网络深度学习 google 人工智能机器学习大模型
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从语言理解到多模态智能的通用架构基石⚙️一、核心定义与历史意义Transformer是由Google团队在2017年论文《AttentionIsAllYouNeed》中提出的深度学习架构，其颠覆性创新在于：完全摒弃RNN/CNN：仅依赖自注意力机制（S
[特殊字符] LLM（大型语言模型）：智能时代的语言引擎与通用推理基座大千AI助手人工智能 Python #OTHER 语言模型人工智能自然语言处理 LLM 大模型 Transformer
本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！从千亿参数到人类认知的AI革命一、核心定义与核心特征LLM（LargeLanguageModel）是基于海量文本数据训练的深度学习模型，通过神经网络架构（尤其是Transformer）模拟人类语言的复杂规律，实现文本理解、生成与推理任务。其核心特征可概
SQL的各种连接查询 xieke90 UNION ALL UNION 外连接内连接 JOIN
一、内连接概念：内连接就是使用比较运算符根据每个表共有的列的值匹配两个表中的行。内连接（join 或者inner join ） SQL语法： select * fron
java编程思想--复用类百合不是茶 java 继承代理组合 final类
复用类看着标题都不知道是什么,再加上java编程思想翻译的比价难懂,所以知道现在才看这本软件界的奇书一:组合语法:就是将对象的引用放到新类中即可代码: package com.wj.reuse; /** * * @author Administrator 组
[开源与生态系统]国产CPU的生态系统 comsci cpu
计算机要从娃娃抓起...而孩子最喜欢玩游戏.... 要让国产CPU在国内市场形成自己的生态系统和产业链,国家和企业就不能够忘记游戏这个非常关键的环节.... 投入一些资金和资源,人力和政策,让游
JVM内存区域划分Eden Space、Survivor Space、Tenured Gen，Perm Gen解释商人shang jvm内存
jvm区域总体分两类，heap区和非heap区。heap区又分：Eden Space（伊甸园）、Survivor Space(幸存者区)、Tenured Gen（老年代-养老区）。非heap区又分：Code Cache(代码缓存区)、Perm Gen（永久代）、Jvm Stack(java虚拟机栈)、Local Method Statck(本地方法栈)。 HotSpot虚拟机GC算法采用分代收
页面上调用 QQ oloz qq
<A href="tencent://message/?uin=707321921&Site=有事Q我&Menu=yes"> <img style="border:0px;" src=http://wpa.qq.com/pa?p=1:707321921:1></a>
一些问题文强chu 问题
1.eclipse 导出 doc 出现“The Javadoc command does not exist.” javadoc command 选择 jdk/bin/javadoc.exe 2.tomcate 配置 web 项目 ..... SQL:3.mysql * 必须得放前面否则 select&nbs
生活没有安全感小桔子生活孤独安全感
圈子好小，身边朋友没几个，交心的更是少之又少。在深圳，除了男朋友，没几个亲密的人。不知不觉男朋友成了唯一的依靠，毫不夸张的说，业余生活的全部。现在感情好，也很幸福的。但是说不准难免人心会变嘛，不发生什么大家都乐融融，发生什么很难处理。我想说如果不幸被分手(无论原因如何)，生活难免变化很大，在深圳，我没交心的朋友。明
php 基础语法 aichenglong php 基本语法
1 .1 php变量必须以$开头 <?php $a=” b”; echo ?> 1 .2 php基本数据库类型 Integer float/double Boolean string 1 .3 复合数据类型数组array和对象 object 1 .4 特殊数据类型 null 资源类型(resource) $co
mybatis tools 配置详解 AILIKES mybatis
MyBatis Generator中文文档 MyBatis Generator中文文档地址： http://generator.sturgeon.mopaas.com/ 该中文文档由于尽可能和原文内容一致，所以有些地方如果不熟悉，看中文版的文档的也会有一定的障碍，所以本章根据该中文文档以及实际应用，使用通俗的语言来讲解详细的配置。本文使用Markdown进行编辑，但是博客显示效
继承与多态的探讨百合不是茶 JAVA面向对象继承对象
继承 extends 多态继承是面向对象最经常使用的特征之一：继承语法是通过继承发、基类的域和方法 //继承就是从现有的类中生成一个新的类，这个新类拥有现有类的所有extends是使用继承的关键字：在A类中定义属性和方法； class A{ //定义属性 int age； //定义方法 public void go
JS的undefined与null的实例 bijian1013 JavaScript JavaScript
<form name="theform" id="theform"> </form> <script language="javascript"> var a alert(typeof(b)); //这里提示undefined if(theform.datas
TDD实践（一） bijian1013 java 敏捷 TDD
一.TDD概述 TDD：测试驱动开发，它的基本思想就是在开发功能代码之前，先编写测试代码。也就是说在明确要开发某个功能后，首先思考如何对这个功能进行测试，并完成测试代码的编写，然后编写相关的代码满足这些测试用例。然后循环进行添加其他功能，直到完全部功能的开发。
[Maven学习笔记十]Maven Profile与资源文件过滤器 bit1129 maven
什么是Maven Profile Maven Profile的含义是针对编译打包环境和编译打包目的配置定制，可以在不同的环境上选择相应的配置，例如DB信息，可以根据是为开发环境编译打包，还是为生产环境编译打包，动态的选择正确的DB配置信息 Profile的激活机制 1.Profile可以手工激活，比如在Intellij Idea的Maven Project视图中可以选择一个P
【Hive八】Hive用户自定义生成表函数(UDTF) bit1129 hive
1. 什么是UDTF UDTF，是User Defined Table-Generating Functions，一眼看上去，貌似是用户自定义生成表函数，这个生成表不应该理解为生成了一个HQL Table，貌似更应该理解为生成了类似关系表的二维行数据集 2. 如何实现UDTF 继承org.apache.hadoop.hive.ql.udf.generic
tfs restful api 加auth 2.0认计 ronin47
　　目前思考如何给tfs的ngx-tfs api增加安全性。有如下两点：　　一是基于客户端的ip设置。这个比较容易实现。　　二是基于OAuth2.0认证，这个需要lua，实现起来相对于一来说，有些难度。　　现在重点介绍第二种方法实现思路。　　前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGe
jdk环境变量配置 byalias java jdk
进行java开发，首先要安装jdk，安装了jdk后还要进行环境变量配置： 1、下载jdk（http://java.sun.com/javase/downloads/index.jsp），我下载的版本是：jdk-7u79-windows-x64.exe 2、安装jdk-7u79-windows-x64.exe 3、配置环境变量：右击"计算机"-->&quo
《代码大全》表驱动法-Table Driven Approach-2 bylijinnan java
package com.ljn.base; import java.io.BufferedReader; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.Collections; import java.uti
SQL 数值四舍五入小数点后保留2位 chicony 四舍五入
1.round() 函数是四舍五入用，第一个参数是我们要被操作的数据，第二个参数是设置我们四舍五入之后小数点后显示几位。 2.numeric 函数的2个参数，第一个表示数据长度，第二个参数表示小数点后位数。例如：　　select cast(round(12.5,2) as numeric(5,2))
c++运算符重载 CrazyMizzz C++
一、加+，减-，乘*，除/ 的运算符重载 Rational operator*(const Rational &x) const{ return Rational(x.a * this->a); } 在这里只写乘法的，加减除的写法类似二、<<输出,>>输入的运算符重载 &nb
hive DDL语法汇总 daizj hive 修改列 DDL 修改表
hive DDL语法汇总１、对表重命名 hive> ALTER TABLE table_name RENAME TO new_table_name; 2、修改表备注 hive> ALTER TABLE table_name SET TBLPROPERTIES ('comment' = new_comm
jbox使用说明 dcj3sjt126com Web
参考网址：http://www.kudystudio.com/jbox/jbox-demo.html jBox v2.3 beta [ 点击下载] 技术交流QQGroup：172543951 100521167 [2011-11-11] jBox v2.3 正式版 - [调整&修复] IE6下有iframe或页面有active、applet控件
UISegmentedControl 开发笔记 dcj3sjt126com
// typedef NS_ENUM(NSInteger, UISegmentedControlStyle) { // UISegmentedControlStylePlain, // large plain &
Slick生成表映射文件 ekian scala
Scala添加SLICK进行数据库操作，需在sbt文件上添加slick-codegen包 "com.typesafe.slick" %% "slick-codegen" % slickVersion 因为我是连接SQL Server数据库，还需添加slick-extensions，jtds包 "com.typesa
ES-TEST gengzg test
package com.MarkNum; import java.io.IOException; import java.util.Date; import java.util.HashMap; import java.util.Map; import javax.servlet.ServletException; import javax.servlet.annotation
为何外键不再推荐使用 hugh.wang mysql DB
表的关联，是一种逻辑关系，并不需要进行物理上的“硬关联”，而且你所期望的关联，其实只是其数据上存在一定的联系而已，而这种联系实际上是在设计之初就定义好的固有逻辑。在业务代码中实现的时候，只要按照设计之初的这种固有关联逻辑来处理数据即可，并不需要在数据库层面进行“硬关联”，因为在数据库层面通过使用外键的方式进行“硬关联”，会带来很多额外的资源消耗来进行一致性和完整性校验，即使很多时候我们并不
领域驱动设计 julyflame VO DAO 设计模式 DTO po
概念： VO（View Object）：视图对象，用于展示层，它的作用是把某个指定页面（或组件）的所有数据封装起来。 DTO（Data Transfer Object）：数据传输对象，这个概念来源于J2EE的设计模式，原来的目的是为了EJB的分布式应用提供粗粒度的数据实体，以减少分布式调用的次数，从而提高分布式调用的性能和降低网络负载，但在这里，我泛指用于展示层与服务层之间的数据传输对
单例设计模式 hm4123660 java Singleton 单例设计模式懒汉式饿汉式
单例模式是一种常用的软件设计模式。在它的核心结构中只包含一个被称为单例类的特殊类。通过单例模式可以保证系统中一个类只有一个实例而且该实例易于外界访问，从而方便对实例个数的控制并节约系统源。如果希望在系统中某个类的对象只能存在一个，单例模式是最好的解决方案。 &nb
logback zhb8015 log logback
一、logback的介绍 Logback是由log4j创始人设计的又一个开源日志组件。logback当前分成三个模块：logback-core,logback- classic和logback-access。logback-core是其它两个模块的基础模块。logback-classic是log4j的一个改良版本。此外logback-class
整合Kafka到Spark Streaming——代码示例和挑战 Stark_Summer spark storm zookeeper PARALLELISM processing
作者Michael G. Noll是瑞士的一位工程师和研究员，效力于Verisign，是Verisign实验室的大规模数据分析基础设施（基础Hadoop）的技术主管。本文，Michael详细的演示了如何将Kafka整合到Spark Streaming中。期间， Michael还提到了将Kafka整合到 Spark Streaming中的一些现状，非常值得阅读，虽然有一些信息在Spark 1.2版
spring-master-slave-commondao 王新春 DAO spring dataSource slave master
互联网的web项目，都有个特点：请求的并发量高，其中请求最耗时的db操作，又是系统优化的重中之重。为此，往往搭建 db的一主多从库的数据库架构。作为web的DAO层，要保证针对主库进行写操作，对多个从库进行读操作。当然在一些请求中，为了避免主从复制的延迟导致的数据不一致性，部分的读操作也要到主库上。（这种需求一般通过业务垂直分开，比如下单业务的代码所部署的机器，读去应该也要从主库读取数