小喵要摸鱼

ResNet 论文理解含视频

- ResNet 论文理解
- - 问题导引论文理解
  - - Q1.神经网络真的越深越好吗?
    - Q2. 为什么加深网络会带来退化问题？
    - Q3. 如何构建更深层的网络？
  - 基于残差的深度学习框架
  - - Residual Learning 的理论依据
  - 网络结构
  - ResNet 的成绩
  - 总结
- 视频理解
- - 引入
  - 恒等映射

ResNet 论文理解

问题导引论文理解

ResNet 网络的论文名字是《Deep Residual Learning for Image Recognition》，发表在2016年的 CVPR 上，获得了 最佳论文奖。ResNet 中的 Res 也是 Residual 的缩写，它的用意在于基于残差学习，让神经网络能够越来越深，准确率越来越高。

深度残差网络（deep residual network）是该论文中提出的一种全新的网络结构，其核心模块是 残差块 residual block。正是由于残差块结构的出现使得深度神经网络模型的层数可以不断加深到100层、1000层甚至更深。

自 2012 年 AlexNet 在 ILSVRC 一战成名后，卷积神经网络便一发不可收拾，后续的各类竞赛中各种神经网络都大发异彩，除了更高的准确率之外，它们普遍的特征就是，网络的层级越来越深 了。

ILSVRC 是 ImageNet Large Scale Visual Recognition Challenge 的缩写，是一个从2010年开始举办的 大规模图像识别竞赛，使用 ImageNet 数据集的一个子集，总共有1000类。
ILSVRC 的目的是评估算法在对象检测和图像分类方面的性能，同时也推动了计算机视觉领域的发展。ILSVRC 每年都有一个相应的研讨会，在其中展示竞赛的方法和结果。
ILSVRC 的获奖网络是指在 图像分类任务中取得最佳成绩的卷积神经网络（CNN）。从2012年开始，ILSVRC 的冠军网络都是基于CNN的深度学习模型，它们在提高图像识别的准确率和效率方面都有重要的贡献。

以下是 ILSVRC 历届冠军网络的简介：

2012年：AlexNet，由 Alex Krizhevsky 等人提出，使用了 8层 CNN 和 ReLU 激活函数，利用GPU加速训练，首次在 ILSVRC 上 大幅度降低了错误率，引发了深度学习的热潮。

2013年：ZFNet，由 Matthew Zeiler 和 Rob Fergus 提出，对AlexNet进行了一些改进，主要是调整了第一层卷积核的大小和步长，以及使用了 可视化 方法来分析网络的特征。

2014年：VGGNet，由牛津大学的 Karen Simonyan 和 Andrew Zisserman 提出，使用了 16层或19层 CNN，统一了卷积核的大小为3x3，展示了 网络深度对性能的影响。

2014年：GoogLeNet，由Google的 Christian Szegedy 等人提出，使用了22层CNN，引入了 Inception 模块，可以有效地增加网络宽度和深度，同时减少参数和计算量。

2015年：ResNet，由微软亚洲研究院的何恺明等人提出，使用了 152层CNN，引入了 残差连接（Residual Connection），可以 有效地解决深度网络的退化问题，刷新了图像识别的记录。

2016年：Inception-v4/Inception-ResNet-v2，由Google的Christian Szegedy等人提出，结合了 Inception 模块和残差连接，进一步提高了网络性能。

2017年：SENet（Squeeze-and-Excitation Network），由牛津大学的Jie Hu等人提出，引入了 SE 模块，可以 自适应地调整特征图的权重，增强了特征表达能力。

Inception 模块是一种图像模型的组成部分，旨在 近似一个最优的局部稀疏结构。简单地说，它 允许我们在一个图像块中使用多种类型的卷积核大小，而不是被限制在一个单一的卷积核大小，然后 将它们拼接起来传递到下一层。

Inception模块的设计思想是 为了减少计算和参数的开销，同时 增加网络的宽度和深度，提高对不同尺度信息的适应性。

Inception 模块有多个版本，如 Inception v1（GoogLeNet），Inception v2，Inception v3，Inception v4和 Inception-ResNet 等，它们都在不同的方面对Inception 模块进行了改进和优化。

Q1.神经网络真的越深越好吗?

深度学习的发展从 LeNet 到 AlexNet，再到 VGGNet 和 GoogLeNet，网络的深度在不断加深，经验表明，网络深度有着至关重要的影响，层数深的网络可以提取出图片的低层、中层和高层特征。

神经网络真的越深越好吗?

情况不是这样的，如果神经网络越来越深，这个神经网络可能会出现退化(degradation) 的现象。即在深度神经网络中，如果不断增加网络的层数，可能会出现一个问题，就是 网络的训练精度和测试精度都不再提高，甚至开始下降。

当更深的网络能够开始收敛时，一个退化问题就暴露出来了：随着网络深度的增加，精度趋于饱和(这可能不足为奇)，然后迅速退化。出乎意料的是，这种退化并 不是由过拟合引起 的，在 适当深度的模型上增加更多的层会导致更高的训练误差。

在 CIFAR-10 这个小型的数据集上，56 层的神经网络的表现比不过 20 层的神经网络。

Q2. 为什么加深网络会带来退化问题？

即使新增的这些 layer 什么都没学习，保持恒等输出(所有的 weight 都设为1)，那么按理说网络的精度也应该 = 原有未加深时的水平；
如果新增的 layer 学习到了有用特征，那么必然加深过后的模型精度会 > 未加深的原网络。

看起来对于网络的精度加深后都应该 >= 加深前才对啊？

实际上，让新增的 layer 保持什么都不学习的恒等状态，恰恰很困难，因为在训练过程中 每一层 layer 都通过线性修正单元 relu 处理，而这样的处理方式会 带来特征的信息损失（不论是有效特征or冗余特征)。

所以上述假设的前提是不成立的，简单的堆叠 layer 可能会带来退化问题。

Q3. 如何构建更深层的网络？

到此，何凯明团队创新地提出了 残差块 的构想，通过 shortcut/skip connection 这样的方式（最初出现在 highway network中），绕过这些 普通的堆叠块，既然保持堆叠块的 identity 恒等性很困难，那就直接绕过它们，通过 shortcut 通路来保持恒等。 如下图：

我对上面的图的理解是：

同样的堆叠块网络，加上恒等映射 $x$ 后，mapping 也随之改变。普通网络的 underlying mapping 是 $\mathcal H(x)$ ，加上恒等映射 $x$ 后，变成了残差 mapping 是 $\mathcal F(x)$ ，那么之前的 $\mathcal H(x)$ 被强制转换为 $\mathcal H(x) := \mathcal F(x) + x$ 。

反向传播算法会自动找最优参数，当经过这些图左边 普通的堆叠块网络，如果 输出的效果比输入更差（那还不如不学习，想让网络输出仍然是 $x$ ），

考虑情况，不加图右边的恒等映射 $x$ ，就是原来的网络要拟合输入 $x$ ，这相当于是 让网络学习恒等映射，这是困难的（实验结果证明）；
而加上恒等映射 $x$ 后，只需要让网络推向0，这是更容易的（实验结果证明）。

这就保证了 深层网络起码不会越学习越差。

这种训练方式称为残差学习，这种结构块也称为 Residual Block 残差块。正是残差结构的出现，使得残差网络能很好的加深网络层数，同时解决退化问题。

基于残差的深度学习框架

论文中说：

有一个解决方案是：在一个的常规的比较浅的模型上添加新的层，而新的层是基于 identity mapping 恒等映射的。

就是在一个浅层的网络模型上进行改造，然后将新的模型与原来的浅层模型相比较，这里有个底线就是，改造后的模型至少不应该比原来的模型表现要差。因为 新加的层可以让它的结果为 0，这样它就等同于原来的模型了。 这个假设是 ResNet 的出发点。

个人觉得，论文中的下图可以这样理解：

这个 比较浅的模型 就是大名鼎鼎的 VGG-19；
然后中间的是在 VGG-19 的模型上 添加新的层后形成的 34-layer 普通网络；
为了保证改造后的模型至少不比原来的模型表现差，加上恒等映射，即右边的 34-layer 残差网络。

从 34-layer plain 到 34-layer residual 不需要额外的参数。

作者引入了 deep residual learning framework，也就是 基于残差的深度学习框架，实际上是对常规的神经网络的改造。

目前流行的神经网络都可以看成是 卷积层的堆叠，可以用栈来表示，我们就叫它卷积栈好了。

输入数据经过每个卷积层都会发生变化，产生新的 feature map ，我们可以说 数据在输入与输出间发生了映射，也就是 mapping。神经网络中的权重参数 一个作用就是 去拟合这种输入与输出之间的 mapping。

ResNet 准备从这一块动手，假设现在有一个栈的卷积层比如说 2 个卷积层堆叠，将 当前这个栈的输入 与 后面的栈的输入(也就是当前这个栈的输出)之间的 mapping 称为 underlying mapping，现在的工作是企图替换它引入一种新的 mapping 关系，ResNet 称之为 residual mapping 去替换常规的 mapping 关系。

意思是与其让卷积栈直接拟合 underlying mapping，不如让它去拟合 residual mapping。而 residual mapping 和 underlying mapping 其实是有关联的。

将 underlying mapping 标记为 $\mathcal H ( x )$
将经过堆叠的非线性层产生的 mapping 标记为 $\mathcal F ( x ) : = \mathcal H ( x ) − x$
所以，最原始的 mapping 就被强制转换成 $\mathcal F ( x ) + x$

然后，作者假设对 residual mapping 的优化要比常规的 underlying mapping 要简单和容易。

而 $\mathcal F ( x ) + x$ 在 实际的编码过程 中，可以被一种叫做 快捷连接 的结构件来实现。

快捷连接通常会跳过 1 个或者多个层，在 ResNet 中快捷连接直接运用了 identity mapping，意思就是 将一个卷积栈的输入直接与这个卷积栈的输出相加。

$\mathcal F ( x )$ 表示残差，最理想的情况是 identity mapping 是最优的输出，那么让 $\mathcal F ( x )$ 为 0 就好了，现实是 $\mathcal F ( x )$ 不可能全为 0，那么这些多出来的东西就可以增强网络的表达能力。

Residual Learning 的理论依据

我们可以将焦点放在 $\mathcal H ( x )$ 上。

理论上有一种假设，多层卷积的参数可以近似地估计很复杂的函数表达公式的值，那么多层卷积也肯定可以近似地估计 $\mathcal H ( x ) − x$ 这种残差公式。

所以与其让卷积栈去近似的估计 $\mathcal H(x)$ ，还不如让它去近似地估计 $\mathcal F(x):=\mathcal H(x)-x$ ，而 $\mathcal F(x)$ 就是残差。

作者假设的是，残差比原始的 mapping 更容易学习。

作者在他的另外一篇论文《Identity Mappings in Deep Residual Networks》中给出了详细的讨论。

网络结构

ResNet 的起始是从一个 常规的比较浅的网络上探求加层的过程。这个常规的比较浅的网络是大名鼎鼎的 VGG-19。

作者对 VGG-19 进行仿制与改造，得到了一个 34 层的 plain network，然后又在这个 34 层的 plain network 中插入快捷连接，最终形成了一个 34 层的 residual network。

$\mathcal F(x)$ 要与 $x$ 相加，那么它们的维度就需要一样。而 ResNet 采用的是 用 1x1 的卷积核去应对维度的变化，通过 1x1 的卷积核去 对输入进行升维和降维。

ResNet 作者做了大量的模型评估工作，网络的层数从 18 到 152 都有试验。

值得注意的是，从 50-layer 起，ResNet 采用了一种 bottleneck design 的手段。

1x1 的卷积核让整个残差单元变得更加细长，这也是 bottleneck 的含义，更重要的是 参数减少 了。

最终在 ImageNet 验证集上的表现也证明了 ResNet 比当时其他网络要强，并且 ResNet 本身层级越多准确率越高。

最后，为了证明 ResNet 的 泛化能力，作者也在 CIFAR-10 数据集上做了测试和分析，ResNet 甚至做到了 1000 层以上。这证明了 基于残差学习可以让网络更深。

ResNet 的成绩

ResNet 依靠成绩说话，

它是 ILSVRC 2015 年图像分类冠军。

而且 ResNet 的泛化变现也很卓越，在

ImageNet 目标检测
ImageNet 目标定位
COCO 目标检测
COCO 图像分割

等竞赛中 都取得了当年（2015）的冠军。

并且，ResNet 是：

当年 ImageNet 参赛模型中层级最深的模型，达到了 152层

这些证据证明了 ResNet 加深网络后，性能比其他的模型更突出。

总结

论文 更多讲述的是经验，这些经验 靠实验结果 表现出了 ResNet 的高效，但 后来的补充材料给出了理论依据，自此它才变得更加 让人信服。
ResNet 是 基于浅层网络的探索性的结果，就如 VGG 是在 AlexNet 的基础上探索得到的。
ResNet 验证了大量的结构，并且进行了 大量的横向和纵向对比 才得到的 最理想的结果。

参考：
【深度学习】经典神经网络 ResNet 论文解读

视频理解

下面的视频，用图形的方式解释了 ResNet 的原理和优势：https://www.youtube.com/watch?v=GWt6Fu05voI

现在，残差连接 无处不在，不仅仅是在图像识别中，它们也出现在变换器（Transformer）中，以及你能想到的任何地方，你很可能会在某个地方找到一些残差连接。

变换器是一种基于自注意力机制（self-attention）的神经网络模型，用于 处理序列数据，如自然语言处理（NLP）和语音识别（ASR）等领域。

变换器的优点是 可以捕捉序列中任意位置之间的依赖关系，而不受距离的限制，同时也可以实现高效的并行计算。

从 Transformer 推出至今，已经成为众多模型的核心模块，比如大家熟悉的 BERT、T5 等都有 Transformer 的身影，就连近段时间爆火的 ChatGPT 也依赖 Transformer。

引入

将一张图像输入到卷积层中，首先会保持较大的分辨率，但会增加通道数量，然后随着过滤器数量的增加，你会缩小图像的比例。这样你就会堆叠越来越多的过滤器，同时缩小图像的分辨率。如果你在进行图像分类，比如你想把它分类为乐高塔或其他任何东西，它在哪里并不那么重要。

在较低的层次上，你会想要 解析出像边缘等非常低层的特征，它们所在的地方是重要的。然后你往上走，去到越来越多的抽象特征，随着你往上走，这些神经网络 倾向于学习越来越多的抽象特征。

假设是这些抽象特征的精确定位会越来越不重要，所以如果你认识到有一个矩形，那么它在哪里并不重要，重要的是它在那里的某个地方，也许它与另一个矩形有关系。

所以如果想识别一辆汽车，

下层会识别有边缘的事实；
然后 中间层会识别出轮子和这些方的几何形状，但它们到底在哪里并不重要；
然后 更高层会学会将各个部分相互组合，这些东西在哪里变得越来越不重要。

越来越重要的是你建立更具表现力的特征，这样人们就会 降低分辨率，增加过滤器的数量，这是一个很好的启发式方法。

但这基本上就是这些网络的架构，我们会质疑为什么增加了层数，它会变得更糟。

恒等映射

理论上，存在一种解，增加层数应该不会变得更糟：

假如我有一个5层的网络，我想构建更深的9层网络，那么我拿来5层网络作为前5层，后4层网络只需要完成恒等映射的任务，

按理来说，就可以保证更深的9层网络不会比5层的网络效果差，
但 实验效果 却是9层网络效果更差，这说明后4层网络不太能完成恒等映射。

所以作者团队后面就 不用网络来拟合恒等映射了，而是直接“曲线救国”，加了一个跨层连接 恒等映射。

绿色圆圈的网络 $F (x)$ 只是学习什么东西让输出和输入不同并且学习差异。在权重层趋向于零函数之前，我们对权重层使用权重衰减，或通常我们如何初始化它们，它们会很好地趋向于零函数。

如果 $F (x)$ 趋向于0函数，那么 $H (x)$ 成为恒等函数。

基于深度学习的目标检测：从基础到实践 Blossom.118 机器学习与人工智能深度学习目标检测人工智能音视频语音识别计算机视觉机器学习
前言目标检测（ObjectDetection）是计算机视觉领域中的一个核心任务，其目标是在图像中定位和识别多个对象的类别和位置。近年来，深度学习技术，尤其是卷积神经网络（CNN），在目标检测任务中取得了显著进展。本文将详细介绍如何使用深度学习技术构建目标检测模型，从理论基础到代码实现，带你一步步掌握目标检测的完整流程。一、目标检测的基本概念（一）目标检测的定义目标检测是指在图像中识别和定位多个对象
14.3 FFT与PEFT终极对决：1%参数实现3倍速训练，显存暴降80%！少林码僧掌握先机！从 0 起步实战 AI 大模型微调打造核心竞争力人工智能机器学习大数据语言模型 chatgpt llama
以微调权重比例分类：FFTvsPEFT深度解析在大模型微调领域，参数调整比例直接决定训练效率与模型性能的平衡。本小节将深入解析全参数微调（FullFine-Tuning,FFT）与参数高效微调（Parameter-EfficientFine-Tuning,PEFT）的核心差异，并通过具体技术方案对比和实战代码示例揭示其工程应用场景。一、FFT与PEFT技术对比矩阵
【Linux 文本处理三剑客：grep、sed、awk 深度解析与实战指南】
一、grep$grep-[选项]'要查找的字符串或正则表达式'[文件]1.常用选项-i：忽略大小写进行搜索-e:指定查找内容，可以跟多个，类似于’查找内容1’|‘查找内容2’-v：显示不匹配模式的行-c:计算找到符合行的次数-w:精确查找，只能输出完全匹配的内容。类似于\b要查的内容\b-n：在输出结果中显示行号-r：递归搜索目录下的所有文件-lr:以长文本格式显示文件名-E：使用正则表达式查找2
数字住建：深入解析城市智慧治理的“中国方案” 数字孪生家族建筑业数字化转型数字住建智慧城市建设治理视频孪生技术数字孪生技术
在这个数字化浪潮席卷全球的时代，城市治理正在经历一场深刻的变革。数字技术与城市治理的深度融合，不仅改变了城市管理的方式，更重塑了城市发展的格局。在这场变革中，"数字住建"作为城市智慧治理的重要抓手，正在成为推动城市管理现代化、智能化、精细化的核心引擎。一、数字住建：城市治理的新范式数字住建的提出，源于城市治理面临的现实困境。随着城市化进程的加快，城市管理的复杂性日益增加。传统的管理模式面临着效率低
【操作系统-Day 7】程序的“分身”：一文彻底搞懂什么是进程 (Process)？吴师兄大模型操作系统操作系统计算机组成原理进程（Process）python 深度学习大模型人工智能
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
从 Spring Boot 2.x 到 Spring Boot 3.x：全面对比与快速上手指南超级小忍 SpringBoot spring boot 后端 java
一、前言SpringBoot自诞生以来，凭借其“约定优于配置”的理念、开箱即用的设计和强大的生态支持，迅速成为Java开发领域的主流框架。随着Java语言的持续演进和开发者需求的提升，SpringBoot也在不断升级。SpringBoot3.x是一次重大版本升级，不仅带来了对现代Java特性的全面支持，还对底层架构、依赖管理和性能进行了深度优化。本文将从以下几个方面，详细对比SpringBoot2
网络安全三剑客：入侵检测、威胁情报和深度检测，到底有啥区别？漠月瑾网络安全学习点滴入侵检测威胁情报深度检测网络安全
网络安全三剑客：入侵检测、威胁情报和深度检测，到底有啥区别？在网络安全领域，我们经常听到入侵检测（IDS）、威胁情报、深度检测这些术语，它们听起来很相似，但实际工作方式却大不相同。它们都是用来发现和阻止网络攻击的，但各自有不同的“特长”。今天，我们就用最通俗的语言，聊聊这三者的区别，以及它们是如何协同工作的。1.入侵检测（IDS）——按“规则”抓坏人**入侵检测系统（IDS）**就像是一个“规则警
深度理解安全Threat Modeling威胁建模
一直想写点关于威胁建模的东西，可试了好几次都卡壳了。之前总忍不住往技术里钻，写出来的东西干巴巴的，满是专业词儿，自己回头看都觉得头大——这可不就跟我刚入门那会儿一样嘛？捧着专业书啃得云里雾里，刷B站教程也总在“好像懂了”和“完全没懂”之间反复横跳，最后草稿删了又删，愣是没写出个像样的开头。今天换了个思路，决定抛开那些绕人的术语，就从咱们能看懂的事儿说起。毕竟我太清楚了，初学者最需要的不是“高大上”
【机器学习】探索未来科技的前沿：人工智能、机器学习与大模型 AIGC零基础入门小白 AI大模型大模型教程人工智能机器学习科技 AI大模型 AIGC AI教程大模型教程
文章目录引言一、人工智能：从概念到现实1.1人工智能的定义1.2人工智能的发展历史1.3人工智能的分类1.4人工智能的应用二、机器学习：人工智能的核心技术2.1机器学习的定义2.2机器学习的分类2.3机器学习的实现原理2.4机器学习的应用2.5机器学习的示例代码2.6解释代码三、大模型：推动AI前沿发展的关键技术3.1大模型的定义3.2大模型的发展历程3.3深度学习与神经网络3.4大模型的优势与挑
CG-04 翻斗式雨量传感器分辨率0.1mm,0.2mm可选择金属材质 zhang13383089075 雨量监测网络人工智能自动化服务器运维
产品概述CG-04型翻斗式雨量传感器是一种水文、气象仪器，用于测量自然界降雨量，同时将降雨量转换为以开关量形式表示的数字信息量输出，以满足信息传输、处理、记录和显示等的需要。本仪器由承雨器部件和计量部件等组成。承雨口采用口径Φ200mm。计量组件是一个翻斗式机械双稳态秤重机构，其功能是将以mm计的降雨深度转换为开关信号输出。功能特点◆体积小，安装方便；精度高，稳定性好◆线性度好，传输距离长，抗干扰
基于YOLOv8的火灾智能检测系统设计与实现斟的是酒中桃深度学习人工智能 pyqt yolo
在各类安全事故中，火灾因其突发性强、破坏力大，一直是威胁人们生命财产安全的重大隐患。传统的火灾检测方式多依赖烟雾传感器、温度传感器等，存在响应滞后、易受环境干扰等问题。随着深度学习技术的飞速发展，基于计算机视觉的火灾检测方法凭借其实时性强、检测范围广等优势，逐渐成为研究热点。本文将简单介绍一款基于深度学习的火灾智能检测系统的设计与实现过程。一、系统整体设计本火灾智能检测系统旨在通过深度学习技术实现
人工智能入门指南：从基础概念到实际应用
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。https://www.captainbed.cn/north文章目录1.**人工智能的基本概念**1.1什么是人工智能？1.2人工智能的分类2.**人工智能的核心技术**2.1机器学习（MachineLearning）2.1.1机器学习的类型2.1.2机器学习流程2.2深度学习（DeepLearni
21、子图同构问题的深度解析 metal 子图同构图论算法
子图同构问题的深度解析1.子图同构问题概述子图同构问题是图论中的一个核心问题，广泛应用于社交网络分析、生物信息学、模式识别等领域。该问题的定义是：给定两个图，一个是较大的主图（HostGraph），另一个是较小的模式图（PatternGraph），判断主图中是否存在一个子图与模式图同构。简单来说，就是要找到主图中与模式图结构完全一致的子图。子图同构问题的难度在于它是一个NP完全问题，意味着在最坏情
解锁 JavaScript 模块化：ES6 Module 语法深度指南编程随想▿ ES6 javascript es6 前端开发语言
目录ES6Module核心语法1.export-导出模块内容(1)命名导出(NamedExports)(3)混合导出(CombiningNamedandDefault)2.import-导入模块内容(1)导入命名导出(2)导入默认导出(3)混合导入3.动态导入(import())重要特性与注意事项总结ES6Module核心语法ES6Module的核心围绕两个关键字：export和import。1.
FPGA相关通信问题详解霖12 fpga开发笔记信号处理信息与通信学习开发语言
首先感谢大佬@征途黯然.-CSDN博客的就我的上篇文章《FPGA通信设计十问》提出的问题，我在此做出回复一.解释FFT（快速傅里叶变换）如何在FPGA的IP核中高效实现FFT作为将时域信号转换为频域的核心算法，其在FPGA中的高效实现依赖于硬件架构与算法特性的深度适配。1.流水线架构：提升吞吐量FFT的核心是“蝶形运算”，其计算过程可分解为log2(N)级（N为FFT点数），每级包含N/2次蝶形运
Sequential Thinking：AI深度思考的新范式及其与CoT、ReAct的对比分析码字的字节人工智能 Sequential CoT ReAct
引言：AI深度思考的演进与SequentialThinking的崛起在人工智能技术快速发展的今天，AI模型的思考能力正经历着从简单应答到深度推理的革命性转变。这一演进过程不仅反映了技术本身的进步，更体现了人类对机器智能认知边界的持续探索。早期的大语言模型虽然能够生成流畅的文本，但在处理复杂问题时往往表现出"浅思考"的局限性——答案可能看似合理，却缺乏严谨的推理过程和系统性考量。例如，2022年的一
多云环境下的统一安全架构设计 TechVision大咖圈安全架构多云安全合规性统一架构零信任深度防御身份管理
关键词：多云安全、统一架构、零信任、深度防御、身份管理、威胁检测、SIEM、合规性文章目录引言：多云时代的安全挑战多云环境面临的安全挑战统一安全架构设计原则核心安全组件架构多层防护体系设计统一身份管理与访问控制安全监控与威胁检测实施策略与最佳实践总结与展望引言：多云时代的安全挑战在这个"云来云去"的时代，企业就像搬家一样，从单一的云服务商逐渐向多云架构迁移。就好比以前只在一家银行存钱，现在为了"不
Datawhale X 魔塔 Ai夏令营 --深度学习基础
一、局部极小值与全局极小值全局极小值：在损失函数的整个定义域内，损失值最小的点。这是我们在训练深度学习模型时希望找到的点，因为它代表着模型的最佳性能。局部极小值：在损失函数的一个局部区域内，损失值达到最小，但在整个函数定义域内可能不是最小的。当优化算法陷入局部极小值时，它可能会误以为已经找到了全局最优解，从而停止搜索。局部极小值的检测两种直观的方法来检测局部极小值：可视化方法：对于低维问题，我们可
深度学习模块实践手册（第十二期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
56、Ghost模块论文《GhostNet:MoreFeaturesfromCheapOperations》1、作用：Ghost模块是一种轻量级的特征提取模块，旨在通过廉价操作生成更多特征图，减少计算量的同时保持模型性能。传统卷积神经网络在生成特征图时存在大量冗余计算，Ghost模块通过将特征图生成过程分解为两个步骤，有效减少了计算复杂度，特别适合移动端和嵌入式设备部署。2、机制Ghost模块的机
DETR革命：目标检测的Transformer时代加油吧zkf 目标检测 YOLO python 开发语言人工智能图像处理
《DETR从0到1：目标检测Transformer的崛起》为什么会有DETR？在深度学习目标检测发展史上，2014~2019年几乎被基于卷积神经网络（CNN）的检测器统治：两阶段：FasterR-CNN、MaskR-CNN单阶段：YOLO、SSD、RetinaNet这些检测器虽然效果强大，但背后依赖：✅Anchor（先验框）✅NMS（非极大值抑制）✅特征金字塔、手工设计问题：结构复杂、调参困难、不
Gemini CLI 用户界面系统深度解析：从命令行到智能交互的完美转换步子哥交互人工智能
前言在深入探索了GeminiCLI的核心引擎、沙盒系统、扩展机制和构建发布系统后，今天我们将深入研究用户直接接触的最前端——CLI用户界面系统。这个系统不仅是用户与AI交互的桥梁，更是一个完整的交互式智能终端¹，它将复杂的AI能力转化为直观、高效的命令行体验。注解1-交互式智能终端：不同于传统的命令行工具，GeminiCLI的用户界面系统实现了真正的智能交互。它既支持传统的命令行操作，又提供了现代
算力网异构协同与能效优化驱动工业物联及智慧民生实践
内容概要算力网络作为数字基础设施的核心载体，正通过异构协同架构与能效优化框架的深度融合，构建起支撑工业物联网与智慧民生应用的技术底座。随着边缘计算节点的快速部署与模型压缩技术的突破性发展，工业场景中的设备健康检测与实时故障分析已实现毫秒级响应，典型应用场景包括产线异常识别、设备寿命预测等关键领域。与此同时，数据预处理技术的迭代升级有效缓解了工业传感器数据维度爆炸带来的算力压力，通过特征提取与噪声过
LeetCode第337题_打家劫舍III @蓝莓果粒茶算法 leetcode 算法职场和发展 c#学习
LeetCode第337题：打家劫舍III文章摘要本文详细解析LeetCode第337题"打家劫舍III"，这是一道中等难度的二叉树动态规划问题。文章提供了基于深度优先搜索和动态规划的解法，包含C#、Python、C++三种语言实现，配有详细的算法分析和性能对比。适合想要提升二叉树和动态规划能力的程序员。核心知识点：二叉树、动态规划、深度优先搜索难度等级：中等推荐人群：具有基础数据结构知识，想要提
深度学习模块实践手册（第十一期）加油吧zkf 目标检测目标检测模块解析与实践深度学习人工智能计算机视觉目标检测 python
46、缩放点积注意力模块论文《AttentionIsAllYouNeed》1、作用：缩放点积注意力（ScaledDot-ProductAttention）是Transformer模型的核心组件，旨在解决序列建模中长距离依赖关系捕捉的问题。传统的循环神经网络（RNN）在处理长序列时存在梯度消失或爆炸的问题，且并行性较差。该模块通过计算查询（Query）、键（Key）和值（Value）之间的相似度，实
【3D并排条状图】：附Origin详细画图教程
目录No.1理解3D并排条状图1什么是3D并排条状图2空间坐标系构建3应用场景No.2画图教程1导入数据并绘图2设置绘图细节3设置图例4设置坐标轴No.1理解3D并排条状图1什么是3D并排条状图3D并排条状图，是一种多维数据可视化形式，通过在三维坐标系中并排展示多个数据系列的柱状体，实现三类变量的联合对比分析。这种图表扩展了传统二维并排条状图的表达能力，增加了深度维度（z轴）的信息承载能力。2空间
C++ | 玩转点云：CloudCompare & PCL原生开发核心指南与示例分享河工点云智绘WangG 点云深处 CloudCompare &PCL开发 c++开发语言
还在为点云处理的效率瓶颈和功能限制发愁吗？面对点云处理个性需求，是否让你感到束手束脚？调试困难、性能受限、定制化需求难以满足...本次分享将带你深入核心，走进点云深处，揭秘如何直接运用C++进行CloudCompare&PCL的原生集成开发。掌握核心步骤，规避常见陷阱，并附实用开发示例源码。助你：效率飙升：直达底层，性能最大化！灵活无限：自由定制算法流程，深度集成业务逻辑！掌控全局：彻底理解框架机
零基础搭建免费IP代理池：从原理到实战的保姆级指南傻啦嘿哟关于代理IP那些事儿 tcp/ip 网络协议网络
目录一、代理池的核心价值与底层原理二、环境搭建全流程详解2.1开发环境准备2.2核心组件安装三、核心配置深度解析3.1配置文件精要（setting.py）3.2自定义代理源开发四、核心模块实现原理4.1调度系统架构4.2代理验证算法五、运维实战技巧5.1性能优化策略5.2故障排查手册六、安全加固方案七、扩展升级路径八、典型问题解决方案九、性能基准测试十、合规使用指南一、代理池的核心价值与底层原理在
iOS 4.3上架终极方案钱哥出海 ios 上架 4.3
大家好！今天我来给大家深度解读苹果审核规则4.3的相关问题。相信4.3规则让大多数开发者都头疼不已，因为在应用上架过程中，它引发了诸多难题。首先，我们来看看哪些情况会触发4.3规则。其一，自己开发的APP可能会遇到这个问题；其二，存在抄袭情况的APP也容易触发4.3。这里的抄袭主要指UI层面，而非代码层面。如今线上APP众多，一旦出现UI抄袭，就很可能触发规则。针对这种情况，解决办法是进行全新设计
【深度强化学习】MIP-DQN 实现案例（完整Python代码）
目录MIP-DQN算法概述建模基础训练阶段（Training）部署阶段（OnlineExecution）DNN网络转化为MIP表达式性能指标完整Python代码实现主函数：random_generator_battery模型函数：MIP_DQN基础/专用库包安装模型运行（完整Python代码）参数设置函数：Parameters参考本博客根据论文《Optimalenergysystemschedul
基于NanoDet的健身姿势纠正系统开发 YOLO实战营人工智能 NanoDet 深度学习计算机视觉 ui
1.引言在现代健身行业中，正确的运动姿势至关重要，不仅能提升训练效果，还能预防运动损伤。尤其是在进行一些高强度的力量训练时，如深蹲、俯卧撑等，错误的姿势可能导致肌肉不平衡或关节损伤。传统的健身姿势纠正方式依赖教练的人工指导，但随着人工智能技术的发展，使用计算机视觉和深度学习技术来进行姿势纠正，逐渐成为一种高效且可扩展的解决方案。本文将详细介绍如何基于NanoDet（一个轻量化目标检测模型）开发一个
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息