salary_up_27k

计算机视觉中的注意力机制--attention mechanism

转载：https://zhuanlan.zhihu.com/p/56501461
张戎

引言

在机器翻译（Machine Translation）或者自然语言处理（Natural Language Processing）领域，以前都是使用数理统计的方法来进行分析和处理。近些年来，随着 AlphaGo 的兴起，除了在游戏AI领域，深度学习在计算机视觉领域，机器翻译和自然语言处理领域也有着巨大的用武之地。在 2016 年，随着深度学习的进一步发展，seq2seq 的训练模式和翻译模式已经开始进入人们的视野。除此之外，在端到端的训练方法中，除了需要海量的业务数据之外，在网络结构中加入一些重要的模块也是非常必要的。在此情形下，基于循环神经网咯（Recurrent Neural Network）的注意力机制（Attention Mechanism）进入了人们的视野。除了之前提到的机器翻译和自然语言处理领域之外，计算机视觉中的注意力机制也是十分有趣的，本文将会简要介绍一下计算机视觉领域中的注意力方法。在此事先声明一下，笔者并不是从事这几个领域的，可能在撰写文章的过程中会有些理解不到位的地方，请各位读者指出其中的不足。

注意力机制

顾名思义，注意力机制是本质上是为了模仿人类观察物品的方式。通常来说，人们在看一张图片的时候，除了从整体把握一幅图片之外，也会更加关注图片的某个局部信息，例如局部桌子的位置，商品的种类等等。在翻译领域，每次人们翻译一段话的时候，通常都是从句子入手，但是在阅读整个句子的时候，肯定就需要关注词语本身的信息，以及词语前后关系的信息和上下文的信息。在自然语言处理方向，如果要进行情感分类的话，在某个句子里面，肯定会涉及到表达情感的词语，包括但不限于“高兴”，“沮丧”，“开心”等关键词。而这些句子里面的其他词语，则是上下文的关系，并不是它们没有用，而是它们所起的作用没有那些表达情感的关键词大。

在以上描述下，注意力机制其实包含两个部分：

注意力机制需要决定整段输入的哪个部分需要更加关注；
从关键的部分进行特征提取，得到重要的信息。

通常来说，在机器翻译或者自然语言处理领域，人们阅读和理解一句话或者一段话其实是有着一定的先后顺序的，并且按照语言学的语法规则来进行阅读理解。在图片分类领域，人们看一幅图也是按照先整体再局部，或者先局部再整体来看的。再看局部的时候，尤其是手写的手机号，门牌号等信息，都是有先后顺序的。为了模拟人脑的思维方式和理解模式，循环神经网络（RNN）在处理这种具有明显先后顺序的问题上有着独特的优势，因此，Attention 机制通常都会应用在循环神经网络上面。

虽然，按照上面的描述，机器翻译，自然语言处理，计算机视觉领域的注意力机制差不多，但是其实仔细推敲起来，这三者的注意力机制是有明显区别的。

在机器翻译领域，翻译人员需要把已有的一句话翻译成另外一种语言的一句话。例如把一句话从英文翻译到中文，把中文翻译到法语。在这种情况下，输入语言和输出语言的词语之间的先后顺序其实是相对固定的，是具有一定的语法规则的；
在视频分类或者情感识别领域，视频的先后顺序是由时间戳和相应的片段组成的，输入的就是一段视频里面的关键片段，也就是一系列具有先后顺序的图片的组合。NLP 中的情感识别问题也是一样的，语言本身就具有先后顺序的特点；
图像识别，物体检测领域与前面两个有本质的不同。因为物体检测其实是在一幅图里面挖掘出必要的物体结构或者位置信息，在这种情况下，它的输入就是一幅图片，并没有非常明显的先后顺序，而且从人脑的角度来看，由于个体的差异性，很难找到一个通用的观察图片的方法。由于每个人都有着自己观察的先后顺序，因此很难统一成一个整体。

在这种情况下，机器翻译和自然语言处理领域使用基于 RNN 的 Attention 机制就变得相对自然，而计算机视觉领域领域则需要必要的改造才能够使用 Attention 机制。

基于 RNN 的注意力机制

通常来说，RNN 等深度神经网络可以进行端到端的训练和预测，在机器翻译领域和或者文本识别领域有着独特的优势。对于端到端的 RNN 来说，有一个更简洁的名字叫做 sequence to sequence，简写就是 seq2seq。顾名思义，输入层是一句话，输出层是另外一句话，中间层包括编码和解码两个步骤。

而基于 RNN 的注意力机制指的是，对于 seq2seq 的诸多问题，在输入层和输出层之间，也就是词语（Items）与词语之间，存在着某种隐含的联系。例如：“中国” -> “China”，“Excellent” -> “优秀的”。在这种情况下，每次进行机器翻译的时候，模型需要了解当前更加关注某个词语或者某几个词语，只有这样才能够在整句话中进行必要的提炼。在这些初步的思考下，基于 RNN 的 Attention 机制就是：

建立一个编码（Encoder）和解码（Decoder）的非线性模型，神经网络的参数足够多，能够存储足够的信息；
除了关注句子的整体信息之外，每次翻译下一个词语的时候，需要对不同的词语赋予不同的权重，在这种情况下，再解码的时候，就可以同时考虑到整体的信息和局部的信息。

注意力机制的种类

从初步的调研情况来看，注意力机制有两种方法，一种是基于强化学习（Reinforcement Learning）来做的，另外一种是基于梯度下降（Gradient Decent）来做的。强化学习的机制是通过收益函数（Reward）来激励，让模型更加关注到某个局部的细节。梯度下降法是通过目标函数以及相应的优化函数来做的。无论是 NLP 还是 CV 领域，都可以考虑这些方法来添加注意力机制。

计算机视觉领域的 Attention 部分论文整理

下面将会简单的介绍几篇近期阅读的计算机视觉领域的关于注意力机制的文章。

Look Closer to See Better：Recurrent Attention Convolutional Neural Network for Fine-grained Image Recognition

在图像识别领域，通常都会遇到给图片中的鸟类进行分类，包括种类的识别，属性的识别等内容。为了区分不同的鸟，除了从整体来对图片把握之外，更加关注的是一个局部的信息，也就是鸟的样子，包括头部，身体，脚，颜色等内容。至于周边信息，例如花花草草之类的，则显得没有那么重要，它们只能作为一些参照物。因为不同的鸟类会停留在树木上，草地上，关注树木和草地的信息对鸟类的识别并不能够起到至关重要的作用。所以，在图像识别领域引入注意力机制就是一个非常关键的技术，让深度学习模型更加关注某个局部的信息。

在这篇文章里面，作者们提出了一个基于 CNN 的注意力机制，叫做 recurrent attention convolutional neural network（RA-CNN），该模型递归地分析局部信息，从局部的信息中提取必要的特征。同时，在 RA-CNN 中的子网络（sub-network）中存在分类结构，也就是说从不同区域的图片里面，都能够得到一个对鸟类种类划分的概率。除此之外，还引入了 attention 机制，让整个网络结构不仅关注整体信息，还关注局部信息，也就是所谓的 Attention Proposal Sub-Network（APN）。这个 APN 结构是从整个图片（full-image）出发，迭代式地生成子区域，并且对这些子区域进行必要的预测，并将子区域所得到的预测结果进行必要的整合，从而得到整张图片的分类预测概率。

RA-CNN 的特点是进行一个端到端的优化，并不需要提前标注 box，区域等信息就能够进行鸟类的识别和图像种类的划分。在数据集上面，该论文不仅在鸟类数据集（CUB Birds）上面进行了实验，也在狗类识别（Stanford Dogs）和车辆识别（Stanford Cars）上进行了实验，并且都取得了不

错的效果。

从深度学习的网络结构来看，RA-CNN 的输入时是整幅图片（Full Image），输出的时候就是分类的概率。而提取图片特征的方法通常来说都是使用卷积神经网络（CNN）的结构，然后把 Attention 机制加入到整个网络结构中。从下图来看，一开始，整幅图片从上方输入，然后判断出一个分类概率；然后中间层输出一个坐标值和尺寸大小，其中坐标值表示的是子图的中心点，尺寸大小表示子图的尺寸。在这种基础上，下一幅子图就是从坐标值和尺寸大小得到的图片，第二个网络就是在这种基础上构建的；再迭代持续放大图片，从而不停地聚焦在图片中的某些关键位置。不同尺寸的图片都能够输出不同的分类概率，再将其分类概率进行必要的融合，最终的到对整幅图片的鸟类识别概率。

因此，在整篇论文中，有几个关键点需要注意：

分类概率的计算，也就是最终的 loss 函数的设计；
从上一幅图片到下一幅图片的坐标值和尺寸大小。

只要获得了这些指标，就可以把整个 RA-CNN 网络搭建起来。

大体来说，第一步就是给定了一幅输入图片，需要提取它的特征，可以记录为，这里的指的是卷积等各种各样的操作。所以得到的概率分布情况其实就是，指的是从 CNN 的特征层到全连接层的函数，外层使用了 Softmax 激活函数来计算鸟类的概率。

第二步就是计算下一个 box 的坐标和尺寸大小，其中分别指的是横纵坐标，正方形的边长其实是。用数学公式来记录这个流程就是。在坐标值的基础上，我们可以得到以下四个值，分别表示两个坐标轴的上下界：

局部注意力和放大策略（Attention Localization and Amplification）指的是：从上面的方法中拿到坐标值和尺寸，然后把图像进行必要的放大。为了提炼局部的信息，其实就需要在整张图片的基础上加上一个面具（Mask）。所谓面具，指的是在原始图片的基础上进行点乘 0 或者 1 的操作，把一些数据丢失掉，把一些数据留下。在图片领域，就是把周边的信息丢掉，把鸟的信息留下。但是，有的时候，如果直接进行 0 或者 1 的硬编码，会显得网络结构不够连续或者光滑，因此就有其他的替代函数。

在激活函数里面，逻辑回归函数（Logistic Regression）是很常见的。其实通过逻辑回归函数，我们可以构造出近似的阶梯函数或者面具函数。

对于逻辑回归函数而言，当足够大的时候，当；当。此时的逻辑回归函数近似于一个阶梯函数。如果假设，那么就是光滑一点的阶梯函数，当；当。

因此，基于以上的分析和假设，我们可以构造如下的函数：其中，表示图片需要关注的区域，函数就是这里的函数对应了一个足够大的值。

当然，从一张完整的图片到小图片，在实际操作的时候，需要把小图片继续放大，在放大的过程中，可以考虑使用双线性插值算法来扩大。也就是说：

其中，表示上采样因子，分别表示一个实数的正数部分和小数部分。

在分类（Classification）和排序（Ranking）部分，RA-CNN 也有着自己的方法论。在损失函数（Loss Function）里面有两个重要的部分，第一个部分就是三幅图片的 LOSS 函数相加，也就是所谓的 classification loss，表示预测类别的概率，表示真实的类别。除此之外，另外一个部分就是排序的部分，其中表示在第个尺寸下所得到的类别的预测概率，并且最大值函数强制了该深度学习模型在训练中可以保证，也就是说，局部预测的概率值应该高于整体的概率值。

在这种 Attention 机制下，可以使用训练好的 conv5_4 或者 VGG-19 来进行特征的提取。在图像领域，location 的位置是需要通过训练而得到的，因为每张图片的鸟的位置都有所不同。进一步通过数学计算可以得到，会随着网络而变得越来越小，也就是一个层次递进的关系，越来越关注到局部信息的提取。简单来看，

这里的表示元素的点乘，表示之前的网络所得到的导数。

当

其余情况，

当

其余情况，

当

其余情况，

因此，在迭代的过程中会越来越小，也就是说关注的区域会越来越集中。

RA-CNN 的实验效果如下：

Multiple Granularity Descriptors for Fine-grained Categorization

这篇文中同样做了鸟类的分类工作，与 RA-CNN 不同之处在于它使用了层次的结构，因为鸟类的区分是按照一定的层次关系来进行的，粗糙来看，有科 -> 属 -> 种三个层次结构。

因此，在设计网络结构的过程中，需要有并行的网络结构，分别对应科，属，种三个层次。从前往后的顺序是检测网络（Detection Network），区域发现（Region Discovery），描述网络（Description Network）。并行的结构是 Family-grained CNN + Family-grained Descriptor，Genus-grained CNN + Genus-grained Descriptor，Species-grained CNN + Species-grained Descriptor。而在区域发现的地方，作者使用了 energy 的思想，让神经网络分别聚焦在图片中的不同部分，最终的到鸟类的预测结果。

Recurrent Models of Visual Attention

在计算机视觉中引入注意力机制，DeepMind 的这篇文章 recurrent models of visual attention 发表于 2014 年。在这篇文章中，作者使用了基于强化学习方法的注意力机制，并且使用收益函数来进行模型的训练。从网络结构来看，不仅从整体来观察图片，也从局部来提取必要的信息。

整体来看，其网络结构是 RNN，上一个阶段得到的信息和坐标会被传递到下一个阶段。这个网络只在最后一步进行分类的概率判断，这是与 RA-CNN 不同之处。这是为了模拟人类看物品的方式，人类并非会一直把注意力放在整张图片上，而是按照某种潜在的顺序对图像进行扫描。Recurrent Models of Visual Attention 本质上是把图片按照某种时间序列的形式进行输入，一次处理原始图片的一部分信息，并且在处理信息的过程中，需要根据过去的信息和任务选择下一个合适的位置进行处理。这样就可以不需要进行事先的位置标记和物品定位了。

正如上图所示，enc 指的是对图片进行编码，表示解码的过程，表示图片的一个子区域。而表示对图片的预测概率或者预测标签。

Multiple Object Recognition with Visual Attention

这篇文章同样是 DeepMind 的论文，与 Recurrent Models of Visual Attention 不同之处在于，它是一个两层的 RNN 结构，并且在最上层把原始图片进行输入。其中 enc 是编码网络，是解码网络，是注意力网络，输出概率在解码网络的最后一个单元输出。

在门牌识别里面，该网络是按照从左到右的顺序来进行图片扫描的，这与人类识别物品的方式极其相似。除了门牌识别之外，该论文也对手写字体进行了识别，同样取得了不错的效果。

实验效果如下：

总结

本篇 Blog 初步介绍了计算机视觉中的 Attention 机制，除了这些方法之外，应该还有一些更巧妙的方法，希望各位读者多多指教。

参考文献

Look Closer to See Better：Recurrent Attention Convolutional Neural Network for Fine-grained Image Recognition，CVPR，2017.
Recurrent Models of Visual Attention，NIPS，2014
GitHub 代码：Recurrent-Attention-CNN，https://github.com/Jianlong-Fu/Recurrent-Attention-CNN
Multiple Granularity Descriptors for Fine-grained Categorization，ICCV，2015
Multiple Object Recognition with Visual Attention，ICRL，2015
Understanding LSTM Networks，Colah's Blog，2015，http://colah.github.io/posts/2015-08-Understanding-LSTMs/
Survey on the attention based RNN model and its applications in computer vision，2016

探索深度学习的奥秘：从理论到实践的奇幻之旅小周不想卷深度学习
目录引言：穿越智能的迷雾一、深度学习的奇幻起源：从感知机到神经网络1.1感知机的启蒙1.2神经网络的诞生与演进1.3深度学习的崛起二、深度学习的核心魔法：神经网络架构2.1前馈神经网络（FeedforwardNeuralNetwork,FNN）2.2卷积神经网络（CNN）2.3循环神经网络（RNN）及其变体（LSTM,GRU）2.4生成对抗网络（GAN）三、深度学习的魔法秘籍：算法与训练3.1损失
面向6G的核心网网络架构研究宋罗世家技术屋计算机工程的科学与探索专栏网络架构
摘要通过分析6G网络愿景和核心网网络架构所面临的挑战，提出面向6G的核心网网络架构的需求，并在此基础上提出智能且能力普惠的核心网架构，实现“连接+AI+算力+智能+能力开放”的6G核心网，能够根据场景和业务需求按需部署网络功能，保证网络按需确定性服务能力。通过对四大网络功能体进行重构，实现多任务协同能力，形成灵活的用户面处理逻辑，实现网络能力普惠的自治管理和智能服务。01概述大连接物联网（mass
ok虚拟化 qq_25467441 网络
核心S12700E汇聚S6730-H接入S5731-H在云数据中心中，虚拟机迁移时必须保持IP地址不变，并确保TCP连接不中断。因此，虚拟机的动态迁移只能在同一二层网络内进行，无法跨越二层网络。这一需求促使数据中心的网络架构发生了重大变革，东西向流量逐渐超过南北向流量，推动了扁平化的大二层网络模型的发展。由于虚拟机迁移依赖二层网络，传统的三层架构（接入层、汇聚层、核心层）逐渐失去其适用性。传统架构
缩小模拟与现实之间的差距：使用 NVIDIA Isaac Lab 训练 Spot 四足动物运动 AI人工智能集结号人工智能
目录在IsaacLab中训练四足动物的运动能力目标观察和行动空间域随机化网络架构和RL算法细节先决条件用法训练策略执行训练好的策略结果使用JetsonOrin在Spot上部署经过训练的RL策略先决条件JetsonOrin上的硬件和网络设置Jetson上的软件设置运行策略开始开发您的自定义应用程序由于涉及复杂的动力学，为四足动物开发有效的运动策略对机器人技术提出了重大挑战。训练四足动物在现实世界中上
论文学习笔记 VMamba: Visual State Space Model Wils0nEdwards 学习笔记
概览这篇论文的动机源于在计算机视觉领域设计计算高效的网络架构的持续需求。当前的视觉模型如卷积神经网络（CNNs）和视觉Transformer（ViTs）在处理大规模视觉任务时展现出良好的表现，但都存在各自的局限性。特别是，ViTs尽管在处理大规模数据上具有优势，但其自注意力机制的二次复杂度对高分辨率图像处理时的计算成本极高。因此，研究者希望通过引入新的架构来降低这种复杂度，并提高视觉任务的效率。现
9. 卷积神经网络工程实践路小漫
小姐姐归来，带着蜜汁微笑，啦啦啦～这次讲的应该是一些成功的神经网络架构，毕竟我们不能总重复造轮子，借鉴很重要AlexNet结构AlexNet的架构如图，有5个卷积层问题1输入是：227×227×3的图像第一层(卷积层1)：96个大小为11×11的滤波器，步长为4问题：卷积层的输出是？*答案：55×55×96问题2问题：这一层的超参数的个数是多少？答案：(11×11×3)×96=35k问题3输入：2
速盾：普通cdn和高防cdn差别在哪里？速盾cdn 网络安全运维
CDN（ContentDeliveryNetwork）是一种通过在全球各个位置部署服务器来提供快速内容传输服务的网络架构。普通CDN和高防CDN都是CDN服务的两种类型，它们的主要差别体现在以下几个方面。首先，普通CDN和高防CDN的安全性不同。普通CDN主要用于加速内容传输，对于网络安全的防护能力较弱。而高防CDN则专注于提供更强的安全防护，包括抵御DDoS攻击、CC攻击等网络攻击形式。高防CD
速盾：全面分析高防 CDN 和 CDN 对比？速盾cdn 网络运维 web安全
在当今数字化时代，网站的性能和安全性对于企业和个人来说至关重要。为了提高网站的访问速度和安全性，许多人会选择使用CDN（ContentDeliveryNetwork，内容分发网络）或高防CDN。那么，高防CDN和普通CDN有什么区别呢？下面我们来进行全面分析。一、CDN的基本概念和作用CDN的定义CDN是一种分布式的网络架构，它通过在全球各地部署服务器节点，将网站的内容缓存到这些节点上。当用户访问
MelosBoom vs. Google Nest: 打造未来智能家居的去中心化之路区块链小八歌区块链
在智能家居领域，GoogleNest凭借其出色的硬件设计和强大的AI助手，成为了家庭管理和物联网控制的标杆。然而，随着人们对数据隐私和自主权的日益关注，集中化的智能家居系统逐渐暴露出其固有的缺陷。MelosBoom的出现，为这一领域带来了新的突破，其去中心化的网络架构和独特的AI驱动能力，正重新定义未来智能家居的标准。对更加符合应用场景的网络基础设施需求成为了未来机构在投资选择时的更加青睐领域。例
千万级规模高性能、高并发的网络架构经验分享搬砖养女人网络架构经验分享
主题：INTO100沙龙时间：2015年11月21日下午地点：梦想加联合办公空间分享人：卫向军（毕业于北京邮电大学，现任微博平台架构师，先后在微软、金山云、新浪微博从事技术研发工作，专注于系统架构设计、音视频通讯系统、分布式文件系统和数据挖掘等领域。）架构以及我理解中架构的本质在开始谈我对架构本质的理解之前，先谈谈对今天技术沙龙主题的个人见解，千万级规模的网站感觉数量级是非常大的，对这个数量级我们
微积分在神经架构搜索中的应用光剑书架上的书深度强化学习原理与实战元学习原理与实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
微积分在神经架构搜索中的应用1.背景介绍随着深度学习技术的飞速发展,神经网络模型的复杂度也在不断提高,从最初的简单全连接网络,到如今的卷积神经网络、循环神经网络、注意力机制等各种复杂的神经网络架构。这些先进的神经网络架构大大提高了深度学习模型的性能,但同时也给神经网络的设计和调优带来了巨大的挑战。手工设计神经网络架构通常需要大量的专业知识和经验积累,过程繁琐复杂,难以推广。为了解决这一问题,神经架
当NAS遭遇鲁棒性：寻找对抗攻击的坚固架构甄如冰Lea
当NAS遭遇鲁棒性：寻找对抗攻击的坚固架构RobNets项目地址:https://gitcode.com/gh_mirrors/ro/RobNets在当今深度学习的浪潮中，模型的安全性和鲁棒性日益成为研究的热点。本文将为您揭开一款开源项目——《当NAS遇见鲁棒性：对抗攻击下可搜索的鲁棒架构》的神秘面纱。该项目源自CVPR2020的一篇论文，并提供了详细的实现代码和实验指南，致力于探索在网络架构设计
Infiniband网络架构的技术与性能分析科技互联人生科技数码人工智能网络系统架构
Infiniband格局寡头，性能占优这篇文章探讨了网络交换机的性能优势，以及如何通过扩大模型参数量来提高语言模型的生成和预测能力。然而，计算约束对这种正向关系产生了重要影响，导致在相同的计算约束下，总存在最佳的模型参数量和最大的模型有效程度。因此，如何最大限度地提高集群的计算资源成为了当前的核心问题。集群算力优化的关键在于GPU利用率和线性加速比。其中，GPU利用率受限于
华为、Cisco、锐捷三家网络设备供应商的常用网络命令对比 Network_Engineer RS 网络华为服务器
对比华为、思科和锐捷三家网络设备厂商的常用配置命令，能帮助网络工程师和技术人员在选择设备和配置时做出更明智的决策。这种对比不仅有助于了解各厂商设备的功能和命令差异，还能提高配置效率，减少学习和适应时间，从而优化网络管理和维护。此外，深入理解这些配置命令的优缺点，有助于更好地进行网络架构设计和性能优化。华为设备常用配置命令进入全局配置模式system-view配置接口interfaceGigabit
深入理解Open vSwitch（OVS）：原理、架构与操作 CloudJourney 云计算架构
一、引言随着云计算和虚拟化技术的不断发展，网络虚拟化成为了构建灵活、可扩展网络架构的关键技术之一。OpenvSwitch（OVS）作为一种功能强大的开源虚拟交换机，被广泛应用于云计算和虚拟化环境中，为虚拟机提供高效、灵活的网络连接。本文将从技术细节入手，详细阐述OVS的原理、架构以及常见操作，旨在帮助读者更深入地了解和应用OVS。二、OVS的原理OVS的原理主要基于软件定义网络（SDN）的思想，通
元学习（meta learning）（一）前行居士学习人工智能神经网络深度学习机器学习元学习
元学习从字面的意思就是“学习”的“学习”，也就是学习如何学习。大部分的深度学习就是在不断的调整超参数，或者在决定网络架构，改变学习率等等。实际上没有什么好方法来调这些超参，今天工业界最常拿来解决调整超参数的方法是买很多张GPU，然后一次训练多个模型，有的训练不起来、训练效果比较差的话就输入掉，最后只看那些可以训练的比较好的模型会得到什么样的性能。所以在业界做实验的时候往往就是一次开几张GPU，这些
【网络架构】ELK 云计算稿手网络架构架构 elk
目录一、ELK介绍1.1ELK是什么1.2Elasticsearch1.3Logstash1.4Kibana1.5为什么使用ELK二、ELK原理2.1工作原理2.2ELK的应用架构图三、ELK的安装部署3.1环境部署3.2前期环境3.3安装Elasticsearch3.3.1修改配置3.3.2查看节点信息3.4安装Logstash3.4.1安装服务3.4.2使用Logstash3.4.3对接ela
【DevOps】SD-WAN 详解：定义、架构、优势与应用 Coder加油! 运维 DevOps devops 架构运维 sdwan
目录一、传统WAN的局限性二、SD-WAN的解决方案三、SD-WAN的架构四、SD-WAN的关键特点五、SD-WAN的优势六、SD-WAN的应用场景七、总结SD-WAN(Software-DefinedWideAreaNetwork)是一种利用软件定义网络(SDN)技术来简化分支机构与数据中心或云端之间连接的网络架构。它通过集中控制和自动化，优化网络流量路径，提高网络性能和灵活性，并降低运营成本。
CLOS网络架构 ks-zhaoyk 网络架构 vim
CLOS网络架构文档欢迎使用Markdown编辑器你好！这是你第一次使用Markdown编辑器所展示的欢迎页。如果你想学习如何使用Markdown编辑器,可以仔细阅读这篇文章，了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮助你用它写博客：全新的界面设计，将会带来全新的写作体
【计算机视觉前沿研究热点顶会】ECCV 2024中目标检测有关的论文平安顺遂事事如意顶刊顶会论文合集计算机视觉目标检测人工智能 3d 目标跟踪
整值训练和尖峰驱动推理脉冲神经网络用于高性能和节能的目标检测与人工神经网络(ANN)相比，脑激励的脉冲神经网络(SNN)具有生物合理性和低功耗的优势。由于SNN的性能较差，目前的应用仅限于简单的分类任务。在这项工作中，我们专注于弥合人工神经网络和神经网络在目标检测方面的性能差距。我们的设计围绕着网络架构和尖峰神经元。当行人检测遇到多模态学习时：通才模型和基准数据集近年来，利用不同传感器模态(如RG
5G NTN网络架构标准化演进的思考罗伯特之技术屋智能信息系统与结构理论专栏 5G 网络架构
【摘要】目前，5G正在全球范围内大规模商用。然而，传统5G网络在部署方面受到地理条件和成本的制约，还无法实现全球的无缝覆盖。近年来，卫星通信技术得到了飞速发展，让5G全域覆盖成为可能，5G和卫星的融合，即5G非地面网络（non-terrestrialnetwork，NTN）技术成为当前业界新的热点。国际标准化组织3GPP目前已经初步完成了基于透明转发架构的5GNTN技术规范。首先，介绍了5GNTN
Transformer模型在文本摘要任务中的应用与性能分析 liuxin33445566 transformer 深度学习人工智能
Transformer模型自从由Vaswani等人在2017年提出以来，已经在自然语言处理（NLP）的多个领域取得了显著的成果，尤其是在文本摘要任务中。文本摘要是将长文本转换成更短的、包含关键信息的文本的过程。本文将探讨Transformer模型在文本摘要任务中的应用，并分析其性能表现。1.Transformer模型简介Transformer模型是一种基于自注意力机制的神经网络架构，它摆脱了传统的
5G NTN定时提前调整策略分析罗思付之技术屋网络通信安全及科学技术专栏 5G
摘要首先阐述了5GNTN的网络架构，指出NTN有透明转发和再生转发两大场景，较大的传播时延不可避免地对5GNR定时提前调整策略带来了极大的挑战。然后分析了5GNTN上行定时提前调整策略，通过引入上行时间同步参考点，由gNB指定UE补偿时延的数值，如UE补偿服务链路和馈电链路在内的所有时延，或UE只补偿服务链路的时延；gNB通过向UE广播定时漂移信息，以补偿LEO卫星移动引起的大的定时漂移。最后对5
YOLO缺陷检测学习笔记（2） tt555555555555 YOLO 缺陷检测学习笔记 YOLO 学习笔记
YOLO缺陷检测学习笔记（2）残差连接1.**YOLO的残差连接结构**2.**YOLO使用残差连接的目的**3.**YOLO中的残差块**4.**YOLOv3和YOLOv4的残差连接架构**YOLO网络架构概述1.特征提取网络2.预测头（DetectionHead）3.后处理（Post-processing）YOLOv3/v4的改进YOLOv3YOLOv4SoftmaxSoftmax的性质：So
NFV架构冯富江的技术博客网络技术架构
1）NFV的背景来自IT界的启示，给网络产业带来了网络架构和设备架构两个层面的思考。网络架构层面引入对SDN控制器的思考，设备架构层面引入对设备部署形态的思考（NFV）。网络功能虚拟化被称为NFV（NetworkFunctionsVirtualization），而虚拟化之后的网络功能被称为VNF（VirtualizedNetworkFunction）在硬件通用化后，传统的网元不再是嵌入式的软硬结合
yolo8 目标检测、鉴黄刷刷刷粉刷匠目标检测目标跟踪人工智能深度学习机器学习图像处理 python
引言目标检测是计算机视觉中的一个关键任务，其目标是在图像中识别出各种对象，并准确地定位其位置。近年来，目标检测技术取得了显著进展，尤其是在深度学习的推动下，性能得到了极大的提升。YOLO（YouOnlyLookOnce）系列模型作为目标检测领域的重要代表，其创新性的设计和优异的性能受到了广泛关注。YOLOv8是YOLO系列中的最新版本，它在继承前几代模型优势的基础上，通过引入更先进的网络架构和优化
【Python机器学习】卷积神经网络（CNN）的工具包 zhangbin_237 Python机器学习机器学习 python cnn 神经网络自然语言处理开发语言
Python是神经网络工具包最丰富的语言之一。两个主要的神经网络架构分别是Theano和TensorFlow。这两者的底层计算深度依赖C语言，不过它们都提供了强大的PythonAPI。Torch在Python里面也有一个对应的API是PyTorch。这些框架都是高度抽象的工具集，适用于从头构建模型。Python社区开发了一些第三方库来简化这些底层架构的使用。其中Keras在API的友好性和功能性方
计算机网络速成（三） GISer_Jinger 面试题目计算机网络
一、网络协议与模型什么是协议？协议是指计算机系统中完成特定任务所必需的规则和约定，特别是数据传输和交换的规则和约定。OSI和TCP/IP是什么？OSI（开放式系统互连参考模型）是一种网络架构模型，将网络系统分为7层，每一层都指定了不同的功能。TCP/IP（传输控制协议/互联网协议）是互联网协议族，为保证数据包能够在网络层和传输层之间进行传输而诞生，通常分为4层（物理层、数据链路层、网络层、传输层）
什么是裸机管理程序？ ManageEngine卓豪虚拟机虚拟机裸机管理程序 Type 1
在这个旨在使最终用户体验尽可能无缝的快节奏环境中，企业不断扩展其网络以处理增加的负载，为了应对可扩展性问题并增强其设备的最佳性能，网络管理员开始使用虚拟化技术。通过使用管理程序虚拟化网络，网络管理员可以实现灵活、可扩展和快速的网络架构，但是，虚拟机管理可能非常复杂，需要更深入的网络监控。什么是虚拟机管理程序，它们的类型是什么虚拟机管理程序是模拟物理实体的软件，根据虚拟机管理程序在网络中的应用，虚拟
大语言模型诞生、探索和爆发阶段花开盛夏^.^ 人工智能语言模型人工智能自然语言处理
大语言模型的发展可以分为几个阶段，每个阶段都有其特点和发展重点。以下是大致的时间线以及各个阶段的特点：一、大语言模型诞生阶段这一阶段大约从2017年末到2019年初，期间出现了几个关键的技术突破，这些技术奠定了现代大语言模型的基础。2017年：Google发表了Transformer架构，这是一种基于自注意力机制的神经网络架构，它彻底改变了自然语言处理（NLP）领域，使得大规模并行化处理成为可能，
jvm调优总结（从基本概念到深度优化） oloz java jvm jdk 虚拟机应用服务器
JVM参数详解：http://www.cnblogs.com/redcreen/archive/2011/05/04/2037057.html Java虚拟机中，数据类型可以分为两类：基本类型和引用类型。基本类型的变量保存原始值，即：他代表的值就是数值本身；而引用类型的变量保存引用值。“引用值”代表了某个对象的引用，而不是对象本身，对象本身存放在这个引用值所表示的地址的位置。
【Scala十六】Scala核心十：柯里化函数 bit1129 scala
本篇文章重点说明什么是函数柯里化，这个语法现象的背后动机是什么，有什么样的应用场景，以及与部分应用函数(Partial Applied Function)之间的联系 1. 什么是柯里化函数 A way to write functions with multiple parameter lists. For instance def f(x: Int)(y: Int) is a
HashMap dalan_123 java
HashMap在java中对很多人来说都是熟的；基于hash表的map接口的非同步实现。允许使用null和null键；同时不能保证元素的顺序；也就是从来都不保证其中的元素的顺序恒久不变。 1、数据结构在java中，最基本的数据结构无外乎：数组和引用（指针），所有的数据结构都可以用这两个来构造，HashMap也不例外，归根到底HashMap就是一个链表散列的数据
Java Swing如何实时刷新JTextArea，以显示刚才加append的内容周凡杨 java 更新 swing JTextArea
在代码中执行完textArea.append("message")后，如果你想让这个更新立刻显示在界面上而不是等swing的主线程返回后刷新，我们一般会在该语句后调用textArea.invalidate()和textArea.repaint()。问题是这个方法并不能有任何效果，textArea的内容没有任何变化，这或许是swing的一个bug，有一个笨拙的办法可以实现
servlet或struts的Action处理ajax请求 g21121 servlet
其实处理ajax的请求非常简单，直接看代码就行了： //如果用的是struts //HttpServletResponse response = ServletActionContext.getResponse(); // 设置输出为文字流 response.setContentType("text/plain"); // 设置字符集 res
FineReport的公式编辑框的语法简介老A不折腾 finereport 公式总结
FINEREPORT用到公式的地方非常多，单元格（以=开头的便被解析为公式），条件显示，数据字典，报表填报属性值定义，图表标题，轴定义，页眉页脚，甚至单元格的其他属性中的鼠标悬浮提示内容都可以写公式。简单的说下自己感觉的公式要注意的几个地方： 1.if语句语法刚接触感觉比较奇怪，if(条件式子,值1,值2)，if可以嵌套，if(条件式子1，值1，if(条件式子2，值2，值3)
linux mysql 数据库乱码的解决办法墙头上一根草 linux mysql 数据库乱码
linux 上mysql数据库区分大小写的配置 lower_case_table_names=1 1-不区分大小写 0-区分大小写修改/etc/my.cnf 具体的修改内容如下: [client] default-character-set=utf8 [mysqld] datadir=/var/lib/mysql socket=/va
我的spring学习笔记6-ApplicationContext实例化的参数兼容思想 aijuans Spring 3
ApplicationContext能读取多个Bean定义文件，方法是： ApplicationContext appContext = new ClassPathXmlApplicationContext（ new String[]｛“bean-config1.xml”，“bean-config2.xml”，“bean-config3.xml”，“bean-config4.xml
mysql 基准测试之sysbench annan211 基准测试 mysql基准测试 MySQL测试 sysbench
1 执行如下命令，安装sysbench-0.5： tar xzvf sysbench-0.5.tar.gz cd sysbench-0.5 chmod +x autogen.sh ./autogen.sh ./configure --with-mysql --with-mysql-includes=/usr/local/mysql
sql的复杂查询使用案列与技巧百合不是茶 oracle sql 函数数据分页合并查询
本片博客使用的数据库表是oracle中的scott用户表; ------------------- 自然连接查询查询 smith 的上司(两种方法) &
深入学习Thread类 bijian1013 java thread 多线程 java多线程
一．线程的名字下面来看一下Thread类的name属性，它的类型是String。它其实就是线程的名字。在Thread类中，有String getName()和void setName(String)两个方法用来设置和获取这个属性的值。同时，Thr
JSON串转换成Map以及如何转换到对应的数据类型 bijian1013 java fastjson net.sf.json
在实际开发中，难免会碰到JSON串转换成Map的情况，下面来看看这方面的实例。另外，由于fastjson只支持JDK1.5及以上版本，因此在JDK1.4的项目中可以采用net.sf.json来处理。一.fastjson实例 JsonUtil.java package com.study; impor
【RPC框架HttpInvoker一】HttpInvoker：Spring自带RPC框架 bit1129 spring
HttpInvoker是Spring原生的RPC调用框架，HttpInvoker同Burlap和Hessian一样，提供了一致的服务Exporter以及客户端的服务代理工厂Bean，这篇文章主要是复制粘贴了Hessian与Spring集成一文，【RPC框架Hessian四】Hessian与Spring集成在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中
【Mahout二】基于Mahout CBayes算法的20newsgroup的脚本分析 bit1129 Mahout
#!/bin/bash # # Licensed to the Apache Software Foundation (ASF) under one or more # contributor license agreements. See the NOTICE file distributed with # this work for additional information re
nginx三种获取用户真实ip的方法 ronin47
随着nginx的迅速崛起，越来越多公司将apache更换成nginx. 同时也越来越多人使用nginx作为负载均衡, 并且代理前面可能还加上了CDN加速，但是随之也遇到一个问题：nginx如何获取用户的真实IP地址,如果后端是apache,请跳转到<apache获取用户真实IP地址>，如果是后端真实服务器是nginx，那么继续往下看。实例环境：用户IP 120.22.11.11
java-判断二叉树是不是平衡 bylijinnan java
参考了 http://zhedahht.blog.163.com/blog/static/25411174201142733927831/ 但是用java来实现有一个问题。由于Java无法像C那样“传递参数的地址，函数返回时能得到参数的值”，唯有新建一个辅助类：AuxClass import ljn.help.*; public class BalancedBTree {
BeanUtils.copyProperties VS PropertyUtils.copyProperties 诸葛不亮 PropertyUtils BeanUtils
BeanUtils.copyProperties VS PropertyUtils.copyProperties 作为两个bean属性copy的工具类，他们被广泛使用，同时也很容易误用，给人造成困然；比如：昨天发现同事在使用BeanUtils.copyProperties copy有integer类型属性的bean时，没有考虑到会将null转换为0，而后面的业
[金融与信息安全]最简单的数据结构最安全 comsci 数据结构
现在最流行的数据库的数据存储文件都具有复杂的文件头格式，用操作系统的记事本软件是无法正常浏览的，这样的情况会有什么问题呢？从信息安全的角度来看，如果我们数据库系统仅仅把这种格式的数据文件做异地备份，如果相同版本的所有数据库管理系统都同时被攻击，那么
vi区段删除 Cwind linux vi 区段删除
区段删除是编辑和分析一些冗长的配置文件或日志文件时比较常用的操作。简记下vi区段删除要点备忘。 vi概述引文中并未将末行模式单独列为一种模式。单不单列并不重要，能区分命令模式与末行模式即可。 vi区段删除步骤： 1. 在末行模式下使用:set nu显示行号非必须，随光标移动vi右下角也会显示行号，能够正确找到并记录删除开始行
清除tomcat缓存的方法总结 dashuaifu tomcat 缓存
用tomcat容器，大家可能会发现这样的问题，修改jsp文件后，但用IE打开依然是以前的Jsp的页面。出现这种现象的原因主要是tomcat缓存的原因。解决办法如下: 在jsp文件头加上 <meta http-equiv="Expires" content="0"> <meta http-equiv="kiben&qu
不要盲目的在项目中使用LESS CSS dcj3sjt126com Web less
　如果你还不知道LESS CSS是什么东西，可以看一下这篇文章，是我一朋友写给新人看的《CSS——LESS》　　不可否认，LESS CSS是个强大的工具，它弥补了css没有变量、无法运算等一些“先天缺陷”，但它似乎给我一种错觉，就是为了功能而实现功能。　　比如它的引用功能 ? .rounded_corners{
[入门]更上一层楼 dcj3sjt126com PHP yii2
更上一层楼通篇阅读完整个“入门”部分，你就完成了一个完整 Yii 应用的创建。在此过程中你学到了如何实现一些常用功能，例如通过 HTML 表单从用户那获取数据，从数据库中获取数据并以分页形式显示。你还学到了如何通过 Gii 去自动生成代码。使用 Gii 生成代码把 Web 开发中多数繁杂的过程转化为仅仅填写几个表单就行。本章将介绍一些有助于更好使用 Yii 的资源：
Apache HttpClient使用详解 eksliang httpclient http协议
Http协议的重要性相信不用我多说了，HttpClient相比传统JDK自带的URLConnection，增加了易用性和灵活性（具体区别，日后我们再讨论），它不仅是客户端发送Http请求变得容易，而且也方便了开发人员测试接口（基于Http协议的），即提高了开发的效率，也方便提高代码的健壮性。因此熟练掌握HttpClient是很重要的必修内容，掌握HttpClient后，相信对于Http协议的了解会
zxing二维码扫描功能 gundumw100 android zxing
经常要用到二维码扫描功能现给出示例代码 import com.google.zxing.WriterException; import com.zxing.activity.CaptureActivity; import com.zxing.encoding.EncodingHandler; import android.app.Activity; import an
纯HTML+CSS带说明的黄色导航菜单 ini html Web html5 css hovertree
HoverTree带说明的CSS菜单:纯HTML+CSS结构链接带说明的黄色导航在线体验效果：http://hovertree.com/texiao/css/1.htm代码如下,保存到HTML文件可以看到效果： <!DOCTYPE html > <html > <head> <title>HoverTree
fastjson初始化对性能的影响 kane_xie fastjson 序列化
之前在项目中序列化是用thrift，性能一般，而且需要用编译器生成新的类，在序列化和反序列化的时候感觉很繁琐，因此想转到json阵营。对比了jackson，gson等框架之后，决定用fastjson，为什么呢，因为看名字感觉很快。。。网上的说法： fastjson 是一个性能很好的 Java 语言实现的 JSON 解析器和生成器，来自阿里巴巴的工程师开发。
基于Mybatis封装的增删改查实现通用自动化sql mengqingyu DAO
1.基于map或javaBean的增删改查可实现不写dao接口和实现类以及xml，有效的提高开发速度。 2.支持自定义注解包括主键生成、列重复验证、列名、表名等 3.支持批量插入、批量更新、批量删除 <bean id="dynamicSqlSessionTemplate" class="com.mqy.mybatis.support.Dynamic
js控制input输入框的方法封装(数字，中文，字母，浮点数等) qifeifei javascript js
在项目开发的时候，经常有一些输入框，控制输入的格式，而不是等输入好了再去检查格式，格式错了就报错，体验不好。 /** 数字，中文，字母,浮点数(+/-/.) 类型输入限制，只要在input标签上加上 jInput="number,chinese,alphabet,floating" 备注：floating属性只能单独用*/ funct
java 计时器应用 tangqi609567707 java timer
mport java.util.TimerTask; import java.util.Calendar; public class MyTask extends TimerTask { private static final int
erlang输出调用栈信息 wudixiaotie erlang
在erlang otp的开发中，如果调用第三方的应用，会有有些错误会不打印栈信息，因为有可能第三方应用会catch然后输出自己的错误信息，所以对排查bug有很大的阻碍，这样就要求我们自己打印调用的栈信息。用这个函数：erlang:process_display (self (), backtrace).需要注意这个函数只会输出到标准错误输出。也可以用这个函数：erlang:get_s

计算机视觉中的注意力机制--attention mechanism

引言

注意力机制

基于 RNN 的注意力机制

注意力机制的种类

计算机视觉领域的 Attention 部分论文整理

Look Closer to See Better：Recurrent Attention Convolutional Neural Network for Fine-grained Image Recognition

Multiple Granularity Descriptors for Fine-grained Categorization

Recurrent Models of Visual Attention

Multiple Object Recognition with Visual Attention

总结

参考文献

你可能感兴趣的:(网络架构)