大脸猫Cc爱吃鱼

深度学习中的注意力机制

前言
本文翻译自《Attention?Attention!》博客

最近几年，注意力——在深度学习社区中，已然成为最广为流行的概念和实用工具。在这篇博客里，我们将一起回顾它是如何被“发明”出来的，以及引申出来的各种变种和模型，如 transformer和SNAIL。

目录
Seq2Seq问题所在
为”翻译“而生
定义
注意力机制”家族“
概要
自注意力机制（Self-Attention）
柔性 vs 刚性注意力
全局 vs 局部注意力
指针网络(Pointer Network)
Transformer
key, Value, Query
Multi-Head 自注意力
编码器
解码器
整体结构
SNAIL
自注意力 GAG
文献
注意力，在某种程度上，受启发于我们是如何关注图片中的某些区域，或者句子中的某些相关词。举个栗子：

视觉任务中注意力转移
人类的视觉注意力，使得我们能够在图片的“低解析度”背景下，更加关注具有“高解析度或辨识度”（High resolution）的特定区域（如黄色区域中狗的耳朵），然后逐渐调整焦点，移动到另一个耳朵、眼睛、鼻子等，最后进行推断整张图片的信息。给定图片中的一小块补丁区域，图片中其余的像素点也可以提供这块补丁应该展示什么的信息。在上图中，假设我们先看到了狗的鼻子、尖尖的右耳和Shiba迷离的眼睛，因此我们就会理所当然的期望在黄色区域看到另一只尖尖的耳朵。但是像毯子和毛衣的信息对于解析狗的特征信息几乎没有什么帮助。

同样地，我们可以解释一句话或者上下文中词与词之间的关系。当看到“eating”这个词时，我们会期望在后面不远的位置看到“食物“描述的词。下图中有色词表示食物，但并不是每个词都与”eating“直接强相关。

自然语言中语义attention
简而言之，在深度学习中，注意力可以广泛的借助重要性权重向量来实现：在预测或推断一个元素时，如图片中的像素点或句中的一个词，我们使用注意力向量来判断，它与其他元素有多强的关联性，然后对加权后的向量求和以逼近最后的目标值（target）。

Seq2Seq问题所在
Seq2Seq模型诞生于语言模型领域（Sutskever, et al. 2014）——广泛的讲，它是将一个输入序列（source）转化为另一个序列（target），两个序列都可以是不定长的。转化任务的场景包括多语言机器翻译（文本或语音）、问答对话对话生成系统、甚至是句子解析为语法树。

Seq2Seq模型一般都会包含编码-解码结构，包括：

编码器——处理序列输入并压缩信息到一个固定长度的上下文向量中（sentence embedding 或者 “thought” vector）。上下文向量被当做是输入序列的语义概要。
解码器——由上下文向量初始化，并每次产生一个转码输出。早期的研究仅使用编码网络的最后一个状态作为下次解码的初始状态。
编码器和解码器都是循环神经网络结构，如LSTM或者GRU单元

seq2seq模型
固定长度上下文向量具有一个明显的致命缺点——无法记忆长句子。一旦完成编码器输入序列的处理，就会遗忘开始的部分。因此注意力机制（Bahdanau et al., 2015）被提出，解决这个问题。

为”翻译“而生
注意力机制”生来“就是为机器翻译任务帮助记忆长序列的句子输入。相对于原始借助编码器的最后一个隐藏单元的输出构建单一上下文向量，注意力机制的独家”秘方“在于，其考虑了上下文向量和所有序列输入的信息，构建了”连接“。每一个输出元素下的连接的权重都是自动学习的。

上下文向量已经考虑了整体输入序列信息，我们不需要担心遗忘的问题。源输入和目标输出的语义对齐问题由上下文向量学习和控制。实际上上下文向量处理三方面的信息：

编码器的隐藏状态
解码器的隐藏状态
源输入和目标输出的对齐
神经网络翻译模型注意力机制
4.1 定义
接下来我们以理论的角度定义注意力机制。我们用X表示长度为n的源输入序列，用Y表示长度为m*的目标输出序列：

源输入和目标输出
（加粗的变量表示向量，下同）
编码器是一个双向RNN结构（也可选其他RNN结构）——包括前向和后向隐藏层状态。简单的维度拼接可以表示当下编码状态，可以理解为同时考虑了中心词的上、下文信息：

双向RNN隐藏状态表示
解码网络在t时刻有隐藏状态St——包括上一个序列隐藏状态，上一输出和上下文向量（所有输入序列的加权求和），权重如下：

Attention计算
对齐模型会针对第i个输入序列和第t个输出序列，分配一个对齐得分，以评判（yt，xi）的对齐效果。在Bahdanau的文章中，对齐得分向量是由单个隐藏层的前向网络来组织的，并和整体网络的其他部分进行联合训练。score计算函数方式输入下：

score计算
对齐得分矩阵是一个很好的副产物，并可以可视化的表示输入序列和输出序列的关联程度。

翻译模型Attention可视化
这里有一个Tensorflow团队提供的一个实现方法的很好教程。

注意力机制”家族“
由于注意力的帮助，源输入和目标输出序列之间的依赖不再受限于距离问题。这在机器翻译任务中，收益颇大。不久被很好的拓展到计算机视觉领域（Xu et al. 2015），人们开始探索注意力机制的各种变种（Luong, et al., 2015; Britz et al., 2017; Vaswani, et al., 2017）。

5.1 概要
下表是几种主流的注意力机制（或更宽泛的注意力机制）

Attention机制概览
(*)在Luong, et al., 2015表示”concat“，在Vaswani, et al.表示”累积注意力（additive attention）“
(^) 添加了尺度因子1/sqrt(n)——当输入很大时，softmax函数可能具有极小的梯度，导致难以高效的更新学习
(&) 指“intra-attention”
5.2 自注意力
自注意力，又称”intra-attention“，是一种在计算同一序列表示时，权重和序列的位置相关机制，被证明在机器阅读理解，抽象概要（abstractive summarization）和图片描述生成中非常有效。

这篇[long short-term memory network]论文使用了自注意力机制做机器阅读。如下图，自注意力机制能够学习到当前词和句中先前词之前的关联性。

自注意力机制可视化
在[show, attend and tell]这篇文章中，自注意力机制被应用在图片生成描述任务中。图片首先被CNN编码，然后输入到带有自注意力机制的RNN网络中，来学习图片各个特征与描述中每个词之前的映射关系。注意力权重的可视化清晰地的展示了模型每关注一部分特征都会输出一个词。

视觉任务中自注意力机制
5.3 柔性 vs 刚性注意力
”柔性“ vs ”刚性“是如何定义注意力的另一种方式，原始思想最初在[show, attend and tell]文章中提出——基于注意力是否需要处整篇图片还是仅仅局部一小块：

柔性注意力：对齐权重通过源图片所有的”patch“进行学习映射，和Bahdanau et al., 2015想法一致
Pro: 模型是平滑且可导的
Con: 当输入图片很大时，训练代价很高
刚性注意力：每次仅选取图片中一个”patch“
Pro: 在inference阶段计算量更小
Con: 模型是不可导的，需要更复杂的技术手段——如降低方差(variance reduction)或者强化学习去训练（Luong, et al., 2015）
5.4 全局 vs 局部注意力
Luong, et al., 2015提出了”全局“和”局部“注意力的概念。全局注意力和柔性注意力很相似；局部注意力是”柔性“和”刚性“的糅合——相对于刚性，改进使其可导：模型首先预测当前目标词的粗略对齐位置，然后在这个源输入的位置上应用一个中心窗口框住，计算上下文向量。

全局和局部Attention
6. 指针网络（Pointer Network）
在排序或者旅行推销员问题上，输入和输入都是序列数据。输出元素的离散类别总数事先是未知的，取决于输入变量的尺度。这很难通过经典的Seq2Seqm或者NMT模型来解决。指针网络（Ptr-Net; Vinyals, et al. 2015）被提出来解决此类问题：当输出元素和输入序列的位置相关时，指针网络并非是借助注意力来将编码器的隐藏状态糅合仅上下文向量（如图8），而是将注意力机制应用在输入元素上，每次选取一个座位解码步骤的输出。

指针网络输出
Ptr-Net输出的是序列的整数索引c=(c1, …, cm)，给定输入序列向量x=(x1, …, xn)且1

Ptr-Net网络结构
注意力机制被简化了，因为指针网络并非是借助注意力权重将编码状态糅合仅输出。在这里，输出仅和位置相关，和输入内容无关。

Transformer
[Attention is All you Need]这篇文章，毫无疑问是2017年最有影响力的文章。它表示柔性注意力有了很大的提升，并使无RNN单元的Seq2Seq建模成为了可能，提出的”transformer“模型全部仅由自注意力机制构建。
秘密在于它的网络架构。

7.1 key, Value 和 Query
transformer的主要由称之为multi-head self-attention mechanism的单元组成——它将输入元素的编码表示看做key-value对（k, v），均为n维（n为输入序列长度）；在NMT的上下文中，keys和values都是编码器的隐藏状态。在解码器中，先前步的输出被压缩进一个queryQ中（m维）,且下一步输出由这个query映射到keys和values集合来产生。

transformer采用了scaled dot-product attention：输出是有values加权求和得到，其中分配给每一项的权重由query和所有keys点积求得。

Transformer中Attention注意力计算方式
7.2 multi-head自注意力机制
multi-head自注意力机制
相对于一次性计算注意力，multi-head注意力机制借助尺度化的点积注意力机制进行并行化多次计算。每个独立的注意力输出通过简单拼接并线性的转换到指定的维度空间。难道因为集成总是有效的？根据文章描述: ”multi-head attention allows the model to jointly attend to information from different representation subspaces at different positions. With a single attention head, averaging inhibits this.”

multi-head 计算方式
7.3 编码器
Transformer中的编码器结构
编码器能够生成一个基于注意力的表示，具有从潜在的无限大上下文空间中定位相关信息片段的能力。

N=6的相同层堆叠
每一层都有一个multi-head self-attention layer和一个位置敏感的全连接前向网络
每一个子网络层都采用了残差连接和网络层正则化。所有的子层输出数据都是512维
7.4 解码器
Transformer中解码器结构
解码器能够从编码器的表示中抽取分析信息。

N=6的相同层堆叠
每一层都有两个带有multi-head self-attention layer的子网络结构和一个全连接前向网络
和解码器相似，每一个子网络层采用了残差和网络正则化
第一个multi-head self-attention sub-layer被修改以防止位置信息被传导到后续位置，正如当我们预测当下位置的信息时，并不想要偷瞥属于目标序列的未来信息。
7.5 整体结构
最后我们整体看一下transformer的网络结构：

源输入和目标输出序列首先都会经过embedding层得到均为512维度的数据
为了保留位置信息，一个基于正弦波的位置编码器被整合应用到embedding层
softmax和线性层被添加到最后的解码输出中
Transformer整体结构
尝试去实现Transformer网络是很有趣的事情，这个是原博主实现的代码：lilianweng/transformer-tensorflow

SNAIL
transformer模型中没有RNN或者CNN结构，即使在embedding向量中引入了位置相关的编码，也是一种序列顺序的弱整合。对于位置敏感的任务如增强学习，这是一个问题。

Simple Neural Attention Meta-Learner（SNAIL）被提出部分解决了这个问题——借助带有temporal的Transformer自注意力机制。实验表明这种网络在监督学习和强化学习任务中都比较擅长。

Simple Neural Attention Meta-Learner（SNAIL）网络结构
SNAIL 诞生于元学习（meta-learning）——很值得另开一个博客单独介绍它。简单地说，he meta-learning model is expected to be generalizable to novel, unseen tasks in the similar distribution
详细的内容可以参考这里

自注意力GAN
最后我想提一下最近流行的对抗生成网络，以及自注意力GAN（SAGAN; Zhang et al., 2018）,并展示注意力机制是如何提高生成图片的质量的。

经典的深度卷积对抗生成网络（DCGAN）均用多层CNN网络表示生成器和判别器。但是网络表示能力受限于卷积核大小，因为一个像素的特征被限制在很小的局部区域里。为了连接更远的区域，特征必须通过卷积操作被稀释，并且依赖性信息不保征被保留。

在视觉任务里，柔性注意力机制下的上下文向量可以明确的学习一个像素和其他位置之间的关系，即使相隔较远的区域，这可以很容易的捕捉全局依赖性。因此带有注意力机制的GAN也同样能够捕捉这种细节。

卷积操作和自注意力机制
SAGAN采用了非局部神经网络来计算注意力权重。卷积的图片特征可以将x映射成三份copy，分别与Transformer中的key，value和query相对应。

之后我们采用点击计算最后特征输出的注意力权重：

其中αij是注意力映射中的一个实例，表明当模型合成第j位置像素时应该分配给i位置多大权重。W均为1×1的卷积核。如果你觉得1×1的卷积核很诡异，可以浏览一下Andrew Ng的这篇教程。输出oj是最终输出o=(o1, …, oj, …, oN)的列向量。

然后，注意力层的输出乘上尺度参数，累加原始的输入特征映射：

其中尺度参数γ在训练过程中从0开始增加，网络首先比较依赖局部区域，然后渐渐的通过分配权重给较远的区域去更新学习。

作者：Silence_Dong
链接：https://www.jianshu.com/p/9b922fb83d77
来源：简书
著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。

【深度学习】AMP（Automatic Mixed Precision，自动混合精度） shanks66 深度学习人工智能
@[toc]AMP（AutomaticMixedPrecision，自动混合精度）AMP在深度学习中，AMP（AutomaticMixedPrecision，自动混合精度）是一种通过混合使用单精度（FP32）和半精度（FP16）来加速训练并减少显存占用的技术。它能够在不显著损失模型精度的情况下，大幅提升训练速度和效率。1.什么是混合精度训练？混合精度训练是指在训练过程中同时使用两种不同的浮点数精度
离线免费最新超长AI视频模型！一句话即可生成120秒视频，免费开源！只需要一张照片和音频，即可生成会说话唱歌的AI视频！能自行完成整个软件项目的AI工具，以及 Llama 3 在线体验和本地安装部署代码讲故事机器人智慧之心人工智能音视频开源 sora 视频 llama 离线
离线免费最新超长AI视频模型！一句话即可生成120秒视频，免费开源！只需要一张照片和音频，即可生成会说话唱歌的AI视频！能自行完成整个软件项目的AI工具，以及Llama3在线体验和本地安装部署。StreamingT2V（StreamingText-to-Video）模型是一种将文本描述转换为视频内容的人工智能技术。这种模型能够根据文本输入生成视频，通常用于自动视频生成、虚拟现实、增强现实、游戏开发
智能化植物病害检测：使用深度学习与图像识别技术的应用机器懒得学习深度学习人工智能
植物病害一直是农业生产中亟待解决的问题，它不仅会影响作物的产量和质量，还可能威胁到生态环境的稳定。随着人工智能（AI）技术的快速发展，尤其是深度学习和图像识别技术的应用，智能化植物病害检测已经成为一种趋势，能够大幅提高病害检测的效率与准确性。本文将介绍如何使用深度学习和图像识别技术，通过Python编写的智能化病害检测程序，实现对植物叶片病害的自动识别与分类。1.项目背景与目标在农业领域，及时发现
深度学习-45-大型语言模型LLM之本地化部署运行自己的大模型皮皮冰燃深度学习深度学习人工智能
文章目录1深度学习1.1神经网络和深度学习1.2神经网络的工作原理1.3神经网络的专业术语2LLM概述2.1大模型的"大"是指什么?2.2训练大模型有多烧钱？2.3如何入门大模型？2.4LLM的结构2.4.1Transformer2.4.2Prompts2.4.3FineTuning3本地跑大模型3.1Ollama运行开源LLM3.1.1启动并运行3.1.2使用api访问3.1.3设置外网访问3.
深度学习笔记——前向传播与反向传播、神经网络（前馈神经网络与反馈神经网络）、常见算法概要汇总好评笔记深度学习笔记深度学习笔记神经网络人工智能
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文简要介绍深度学习的前向传播与反向传播，以及前馈神经网络与反馈神经网络。文章目录前向传播与反向传播前向传播（ForwardPropagation）反向传播（BackPropagation）总结神经网络简介结构类型前馈神经网络（FeedforwardNeuralNetwork,FFNN）特点常见变体反馈神经网络（Feedb
深度学习笔记——生成对抗网络GAN 好评笔记深度学习笔记深度学习生成对抗网络人工智能神经网络 aigc gan 机器学习
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍早期生成式AI的代表性模型：生成对抗网络GAN。文章目录一、基本结构生成器判别器二、损失函数判别器生成器交替优化目标函数三、GAN的训练过程训练流程概述训练流程步骤1.初始化参数和超参数2.定义损失函数3.训练过程的迭代判别器训练步骤生成器训练步骤4.交替优化5.收敛判别GAN训练过程的挑战四、GAN的常见变体
机器学习笔记——Boosting中常用算法（GBDT、XGBoost、LightGBM）迭代路径好评笔记机器学习笔记机器学习 boosting 人工智能深度学习 AI 算法工程师
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文主要阐述Boosting中常用算法（GBDT、XGBoost、LightGBM）的迭代路径。文章目录XGBoost相对GBDT的改进引入正则化项，防止过拟合损失函数L(yi,y^i)L(y_i,\hat{y}_i)L(yi,y^i)正则化项Ω(fm)\Omega(f_m)Ω(fm)使用二阶导数信息，加速收敛一阶导数与二
RPA财务机器人是什么，RPA的具体应用场景有哪些？| 实在RPA研究实在智能RPA rpa 机器人自动化人工智能数字员工
越来越多的人工智能及超自动化技术在企业财务工作中得以普及应用，以提升财务工作效率，促进财务部门实现全面数字化转型。RPA财务机器人是什么？RPA，即机器人流程自动化（RoboticProcessAutomation），允许软件机器人（或“机器人”）自动执行重复性、规律性强的业务流程任务。RPA软件机器人可以模仿人类用户的行为，通过用户界面与应用程序交互，执行任务如数据输入、报告生成、数据迁移、邮件
全球人形机器人的创新发展与未来趋势 Gearidea 机器人机器人
随着科技的迅猛进步，人形机器人作为人工智能与机器人技术交汇的产物，正在全球范围内引发广泛关注。人形机器人以其仿人的外观和行为，不仅在工业生产领域展现出巨大的潜力，而且在日常生活中也逐渐发挥着不可忽视的作用。本文将全面剖析全球人形机器人的发展现状，展望未来发展的潜在趋势，并深入探讨其在不同领域中的应用和影响。一、全球人形机器人行业的发展现状全球人形机器人领域经历了从概念提出、原型制作到商业化应用的演
神经网络初始化 (init) 介绍迷路爸爸180 神经网络人工智能深度学习初始化 init
文章目录引言1.初始化的重要性1.1打破对称性1.2控制方差1.3加速收敛与提高泛化能力2.常见的初始化方法及其应用场景2.1Xavier/Glorot初始化2.2He初始化2.3正交初始化2.4其他初始化方法3.如何设置初始化4.基于BERT的文本分类如何进行初始化4.1项目背景4.2模型构建4.3模型训练与评估4.4结果分析结论参考资料引言在深度学习的世界中，构建一个高效且性能优异的神经网络模
5分钟搞定Spring AI支持SpringBoot快速构建人工智能AI应用_springai_springboot_AI应用 web17886480312 spring 人工智能 spring boot
通过阅读这篇文章，你将了解SpringAI，它是一个借鉴了langchain的设计理念，并结合Java的优势，为开发者提供易于替换实现的统一接口。此外，文章还基于SpringAI的模型调用和Prompt模板，构建一个可操作的示例，让你可以快速的了解具体怎么在springboot的环境下使用springai来构建人工智能AI的应用SpringAI：简化Java大模型集成的统一框架在Java调用大模型
3.ChatClient&Chat Model简化与AI模型的交互 laopeng301 Spring AI 人工智能交互
1.ChatModel对话模型是一种利用人工智能技术，能够生成类似人类对话响应的工具。通过向预训练语言模型（如GPT等）发送提示词或部分对话内容，模型依据自身训练数据及对自然语言模式的理解，生成对话的延续或完整回复，并返回给应用程序。应用程序可以将其呈现给用户或用于进一步处理。SpringAIChatModelAPI设计目标为简单且可移植的接口，用于与各种人工智能模型进行交互，使开发人员能够在不同
《智守数据堡垒——AI驱动的MySQL数据治理合规框架》墨夶数据库学习资料2 人工智能 mysql 数据库
在当今数字化转型加速的时代，企业面临着前所未有的数据挑战。一方面，海量的数据为企业带来了巨大的商业价值；另一方面，如何确保这些数据的安全性、一致性和合法性成为了亟待解决的问题。尤其是在金融、医疗等高度监管行业中，任何数据泄露或不当使用都可能导致严重的法律后果和社会影响。为此，构建一个既高效又能满足法律法规要求的数据治理体系显得尤为重要。今天，我们将探讨一种创新性的解决方案——利用人工智能（AI）技
机器学习02-发展历史补充坐吃山猪机器学习机器学习人工智能
机器学习02-发展历史补充文章目录机器学习02-发展历史补充1-机器学习个人理解1-初始阶段：统计学习和模式识别（20世纪50年代至80年代）2-第二阶段【集成时代】+【核方法】（20世纪90年代至2000年代初期）3-第三阶段【特征工程】+【模型优化】（2000年代中期至2010年代初期）4-大规模数据和分布式计算（2010年代中后期）5-自动化机器学习和特征选择（2010年代末至今）2-神经网
Python数据分析高频面试题及答案闲人编程程序员面试 python 数据分析面试题核心
目录1.基础知识2.数据处理3.数据可视化4.机器学习模型5.进阶问题6.数据清洗与预处理7.数据转换与操作8.时间序列分析9.高级数据分析技术10.数据降维与特征选择11.模型评估与优化12.数据操作与转换13.数据筛选与分析14.数据可视化与报告15.数据统计与分析16.高级数据处理以下是一些Python数据分析的高频核心面试题及其答案，涵盖了基础知识、数据1.基础知识问1：Python中列表
Pytorch 三小时极限入门教程 power-辰南人工智能深度学习 pytorch 人工智能
一、引言在当今的人工智能领域，深度学习占据了举足轻重的地位。而Pytorch作为一款广受欢迎的深度学习框架，以其简洁、灵活的特性，吸引了大量开发者投身其中。无论是科研人员探索前沿的神经网络架构，还是工程师将深度学习技术落地到实际项目，Pytorch都提供了强大的支持。本教程将带你从零基础开始，一步步深入了解Pytorch的核心知识，助你顺利踏上深度学习的征程。二、Pytorch基础环境搭建安装An
Python机器学习之XGBoost从入门到实战(基本理论说明) 雪域枫蓝 Python Atificial Intelligence 机器学习 python 分布式
Xgboost从基础到实战XGBoost:eXtremeGradientBoosting*应用机器学习领域的一个强有力的工具*GradientBootingMachines(GBM)的优化表现，快速有效—深盟分布式机器学习开源平台(DistributedmachinelearningCommunity，DMLC)的分支—DMLC也开源流行的深度学习库mxnet*GBM：Machine：机器学习模型
【数据分析岗】关于数据分析岗面试python的金典问题+解答，包含数据读取、数据清洗、数据分析、机器学习等内容摇光~ 数据分析面试 python
大家好，我是摇光~，用大白话讲解所有你难懂的知识点最近和几个大佬交流了，说了很多关于现在职场面试等问题，然后也找他们问了问他们基本面试的话都会提什么问题。所以我收集了很多关于python的面试题，希望对大家面试有用。类别1：数据读取与处理问题1：如何用Python从Excel文件中读取数据？答：在Python中，可以使用pandas库从Excel文件中读取数据。pandas提供了read_exce
【Python篇】深入机器学习核心：XGBoost 从入门到实战半截诗 Python python 机器学习深度学习分类回归数据分析 XGBoost
文章目录XGBoost完整学习指南：从零开始掌握梯度提升1.前言2.什么是XGBoost？2.1梯度提升简介3.安装XGBoost4.数据准备4.1加载数据4.2数据集划分5.XGBoost基础操作5.1转换为DMatrix格式5.2设置参数5.3模型训练5.4预测6.模型评估7.超参数调优7.1常用超参数7.2网格搜索8.XGBoost特征重要性分析9.高级功能扩展9.1模型解释与可解释性9.2
【YOLOv8杂草作物目标检测】 stsdddd YOLO目标检测目标检测 YOLO 目标检测人工智能
YOLOv8杂草目标检测算法介绍模型和数据集下载算法介绍YOLOv8在禾本科杂草目标检测方面有显著的应用和效果。以下是一些关键信息的总结：农作物幼苗与杂草检测系统：基于YOLOv8深度学习框架，通过2822张图片训练了一个目标检测模型，用于检测田间的农作物幼苗与杂草对象。该系统支持图片、视频以及摄像头进行目标检测，并能保存检测结果。系统界面可实时显示目标位置、目标总数、置信度、用时等信息。YOLO
深度学习(1) 浅忆へ梦微凉深度学习人工智能深度学习学习方法 python
一、torch的安装基于直接设备情况，选择合适的torch版本，有显卡的建议安装GPU版本，可以通过nvidia-smi命令来查看显卡驱动的版本，在官网中根据cuda版本，选择合适的版本号，下面是安装示例代码GPU：pipinstalltorch==2.5.0torchvision==0.20.0torchaudio==2.5.0--index-urlhttps://download.pytorc
提升数据科学工作流效率的10个Jupyter Notebook高级特性
JupyterNotebooks已成为数据科学家、机器学习工程师和Python开发人员的核心开发工具。其核心优势在于提供了一个集成式环境，支持代码执行、文本编辑和数据可视化的无缝整合。尽管大多数用户熟悉其基本功能，但许多能显著提升工作效率的高级特性往往被忽视。本文将介绍一些高级功能，帮助您在数据科学项目中充分发挥JupyterNotebooks的潜力。1、Magic命令：高效的命令行接口Jupyt
Python 数据建模完整流程指南木觞清 3天入门Python python 开发语言
在数据科学和机器学习中，建模是一个至关重要的过程。通过有效的数据建模，我们能够从原始数据中提取有用的洞察，并为预测或分类任务提供支持。在本篇博客中，我们将通过Python展示数据建模的完整流程，包括数据准备、建模、评估和优化等步骤。1.导入必要的库在进行任何数据分析或建模之前，首先需要导入必需的Python库。这些库提供了各种工具和算法，帮助我们更高效地完成任务。importnumpyasnpim
深度学习常用格式转化脚本xml2yolo/coco2yolo/bdd2yolo/frame2video等 qq1309399183 计算机视觉实战项目集合深度学习人工智能格式转化脚本 voc2yolo格式转化数据集格式转换 xml2yolo coco2yolo
文章目录1.**数据集格式转换脚本**`coco2yolo.py`示例注释：注释说明：`xml2yolo.py`示例注释：注释说明：2.**数据集可视化与统计**`vis_yolo_files.py`示例注释：注释说明：3.**其他工具脚本**`frames2video.py`示例注释：注释说明：该项目提供了一系列用于深度学习的数据处理工具，主要功能包括：数据集格式转换：提供多种脚本，将不同格式的
NVIDIA下一代Hopper架构曝光，采用5nm工艺晶体管超1400亿 Java小海. 架构人工智能后端程序人生 java
据媒体报道，NVIDIA下一代主要面向高性能计算、人工智能等Hopper架构，将会采用5nm工艺制程，晶体管多达1400亿个，面积核心达到了900平方毫米，是有史以来最大的GPU。作为参考，NVIDIA自家旗舰Ampere架构的A100为542亿个晶体管（每平方毫米约为6560万个晶体管），AMD阵营中采用Aldebaran架构的InstinctMI200系列为582亿个晶体管（每平方米约为736
NVIDIA Hopper解说白总Server redis 数据库缓存 rust mongodb 大数据数据仓库
NVIDIAHopper架构是NVIDIA推出的面向高性能计算（HPC）和人工智能（AI）的最新一代GPU架构。它代表了NVIDIA在加速计算领域的最新进展，旨在为AI训练和推理、HPC应用提供前所未有的性能提升。NVIDIAHopper架构和基于该架构的GPU产品H100的详细信息：NVIDIAHopper架构技术特点：第四代TensorCore：Hopper架构引入了第四代TensorCore
LLMs，即大型语言模型 maopig AI 语言模型人工智能自然语言处理
LLMs，即大型语言模型，是一类基于深度学习的人工智能模型，它们通过海量的数据和大量的计算资源进行训练，可以理解和生成自然语言。LLMs的核心架构是Transformer，其关键在于自注意力机制，使得模型能够同时对输入的所有位置进行“关注”，从而更好地捕捉长距离的语义依赖关系。LLMs在众多领域都有广泛的应用，如自然语言理解（NLU），语言生成，以及语音识别和合成等。例如，它们能够理解人类的语言
第79期 | GPTSecurity周报云起无垠 GPTSecurity AIGC gpt
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.TrojanWhi
第60期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能语言模型网络安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.映射你的模型：评估
【LLM】大语言模型（LLMs）林九生人工智能语言模型人工智能自然语言处理
大型语言模型（LLMs）1.什么是大型语言模型？大型语言模型（LargeLanguageModel，LLM）是基于深度学习的自然语言处理模型，能够理解和生成自然语言文本。它们通过在大规模文本数据上进行训练，学习语言的语法、语义和各种语言特征，从而可以执行诸如文本生成、翻译、总结、问答等多种语言任务。以下是大型语言模型的定义和基本原理：1.1定义大型语言模型是由大量参数组成的神经网络，这些参数通过在
mondb入手木zi_鸣 mongodb
windows 启动mongodb 编写bat文件， mongod --dbpath D:\software\MongoDBDATA mongod --help 查询各种配置配置在mongob 打开批处理，即可启动，27017原生端口，shell操作监控端口扩展28017，web端操作端口启动配置文件配置，数据更灵活
大型高并发高负载网站的系统架构 bijian1013 高并发负载均衡
扩展Web应用程序一.概念简单的来说，如果一个系统可扩展，那么你可以通过扩展来提供系统的性能。这代表着系统能够容纳更高的负载、更大的数据集，并且系统是可维护的。扩展和语言、某项具体的技术都是无关的。扩展可以分为两种： 1.
DISPLAY变量和xhost(原创) czmmiao display
DISPLAY 在Linux/Unix类操作系统上, DISPLAY用来设置将图形显示到何处. 直接登陆图形界面或者登陆命令行界面后使用startx启动图形, DISPLAY环境变量将自动设置为:0:0, 此时可以打开终端, 输出图形程序的名称(比如xclock)来启动程序, 图形将显示在本地窗口上, 在终端上输入printenv查看当前环境变量, 输出结果中有如下内容:DISPLAY=:0.0
获取B/S客户端IP 周凡杨 java 编程 jsp Web 浏览器
最近想写个B/S架构的聊天系统，因为以前做过C/S架构的QQ聊天系统，所以对于Socket通信编程只是一个巩固。对于C/S架构的聊天系统，由于存在客户端Java应用，所以直接在代码中获取客户端的IP，应用的方法为： String ip = InetAddress.getLocalHost().getHostAddress(); 然而对于WEB
浅谈类和对象朱辉辉33 编程
类是对一类事物的总称，对象是描述一个物体的特征，类是对象的抽象。简单来说，类是抽象的，不占用内存，对象是具体的，占用存储空间。类是由属性和方法构成的，基本格式是public class 类名{ //定义属性 private/public 数据类型属性名； //定义方法 publ
android activity与viewpager+fragment的生命周期问题肆无忌惮_ viewpager
有一个Activity里面是ViewPager，ViewPager里面放了两个Fragment。第一次进入这个Activity。开启了服务，并在onResume方法中绑定服务后，对Service进行了一定的初始化，其中调用了Fragment中的一个属性。 super.onResume(); bindService(intent, conn, BIND_AUTO_CREATE);
base64Encode对图片进行编码 843977358 base64 图片 encoder
/** * 对图片进行base64encoder编码 * * @author mrZhang * @param path * @return */ public static String encodeImage(String path) { BASE64Encoder encoder = null; byte[] b = null; I
Request Header简介 aigo servlet
当一个客户端(通常是浏览器)向Web服务器发送一个请求是，它要发送一个请求的命令行，一般是GET或POST命令，当发送POST命令时，它还必须向服务器发送一个叫“Content-Length”的请求头(Request Header) 用以指明请求数据的长度，除了Content-Length之外，它还可以向服务器发送其它一些Headers，如：
HttpClient4.3 创建SSL协议的HttpClient对象 alleni123 httpclient 爬虫 ssl
public class HttpClientUtils { public static CloseableHttpClient createSSLClientDefault(CookieStore cookies){ SSLContext sslContext=null; try { sslContext=new SSLContextBuilder().l
java取反 -右移-左移-无符号右移的探讨百合不是茶位运算符位移
取反：在二进制中第一位，1表示符数，0表示正数 byte a = -1; 原码：10000001 反码：11111110 补码：11111111 //异或: 00000000 byte b = -2; 原码：10000010 反码：11111101 补码：11111110 //异或: 00000001
java多线程join的作用与用法 bijian1013 java 多线程
对于JAVA的join，JDK 是这样说的：join public final void join （long millis ）throws InterruptedException Waits at most millis milliseconds for this thread to die. A timeout of 0 means t
Java发送http请求(get 与post方法请求) bijian1013 java spring
PostRequest.java package com.bijian.study; import java.io.BufferedReader; import java.io.DataOutputStream; import java.io.IOException; import java.io.InputStreamReader; import java.net.HttpURL
【Struts2二】struts.xml中package下的action配置项默认值 bit1129 struts.xml
在第一部份，定义了struts.xml文件，如下所示： <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache.org/dtds/struts
【Kafka十三】Kafka Simple Consumer bit1129 simple
代码中关于Host和Port是割裂开的，这会导致单机环境下的伪分布式Kafka集群环境下，这个例子没法运行。实际情况是需要将host和port绑定到一起， package kafka.examples.lowlevel; import kafka.api.FetchRequest; import kafka.api.FetchRequestBuilder; impo
nodejs学习api ronin47 nodejs api
NodeJS基础什么是NodeJS JS是脚本语言，脚本语言都需要一个解析器才能运行。对于写在HTML页面里的JS，浏览器充当了解析器的角色。而对于需要独立运行的JS，NodeJS就是一个解析器。每一种解析器都是一个运行环境，不但允许JS定义各种数据结构，进行各种计算，还允许JS使用运行环境提供的内置对象和方法做一些事情。例如运行在浏览器中的JS的用途是操作DOM，浏览器就提供了docum
java-64.寻找第N个丑数 bylijinnan java
public class UglyNumber { /** * 64.查找第N个丑数具体思路可参考 [url] http://zhedahht.blog.163.com/blog/static/2541117420094245366965/[/url] * 题目：我们把只包含因子 2、3和5的数称作丑数（Ugly Number）。例如6、8都是丑数，但14
二维数组（矩阵）对角线输出 bylijinnan 二维数组
/** 二维数组对角线输出两个方向例如对于数组： { 1, 2, 3, 4 }, { 5, 6, 7, 8 }, { 9, 10, 11, 12 }, { 13, 14, 15, 16 }, slash方向输出： 1 5 2 9 6 3 13 10 7 4 14 11 8 15 12 16 backslash输出： 4 3
[JWFD开源工作流设计]工作流跳跃模式开发关键点(今日更新) comsci 工作流
既然是做开源软件的,我们的宗旨就是给大家分享设计和代码,那么现在我就用很简单扼要的语言来透露这个跳跃模式的设计原理大家如果用过JWFD的ARC-自动运行控制器,或者看过代码,应该知道在ARC算法模块中有一个函数叫做SAN(),这个函数就是ARC的核心控制器,要实现跳跃模式,在SAN函数中一定要对LN链表数据结构进行操作,首先写一段代码,把
redis常见使用 cuityang redis 常见使用
redis 通常被认为是一个数据结构服务器，主要是因为其有着丰富的数据结构 strings、map、 list、sets、 sorted sets 引入jar包 jedis-2.1.0.jar (本文下方提供下载) package redistest; import redis.clients.jedis.Jedis; public class Listtest
配置多个redis dalan_123 redis
配置多个redis客户端 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi=&quo
attrib命令 dcj3sjt126com attr
attrib指令用于修改文件的属性.文件的常见属性有:只读.存档.隐藏和系统. 只读属性是指文件只可以做读的操作.不能对文件进行写的操作.就是文件的写保护. 存档属性是用来标记文件改动的.即在上一次备份后文件有所改动.一些备份软件在备份的时候会只去备份带有存档属性的文件.
Yii使用公共函数 dcj3sjt126com yii
在网站项目中，没必要把公用的函数写成一个工具类，有时候面向过程其实更方便。在入口文件index.php里添加 require_once('protected/function.php'); 即可对其引用，成为公用的函数集合。 function.php如下： <?php /** * This is the shortcut to D
linux 系统资源的查看（free、uname、uptime、netstat） eksliang netstat linux uname linux uptime linux free
linux 系统资源的查看转载请出自出处：http://eksliang.iteye.com/blog/2167081 http://eksliang.iteye.com 一、free查看内存的使用情况语法如下： free [-b][-k][-m][-g] [-t] 参数含义 -b:直接输入free时，显示的单位是kb我们可以使用b(bytes),m
JAVA的位操作符 greemranqq 位运算 JAVA位移 <<>>>
最近几种进制，加上各种位操作符，发现都比较模糊，不能完全掌握，这里就再熟悉熟悉。 1.按位操作符：按位操作符是用来操作基本数据类型中的单个bit,即二进制位，会对两个参数执行布尔代数运算，获得结果。与（&）运算： 1&1 = 1, 1&0 = 0, 0&0 &
Web前段学习网站 ihuning Web
Web前段学习网站菜鸟学习：http://www.w3cschool.cc/ JQuery中文网：http://www.jquerycn.cn/ 内存溢出：http://outofmemory.cn/#csdn.blog http://www.icoolxue.com/ http://www.jikexue
强强联合：FluxBB 作者加盟 Flarum justjavac r
原文：FluxBB Joins Forces With Flarum作者：Toby Zerner译文：强强联合：FluxBB 作者加盟 Flarum译者：justjavac FluxBB 是一个快速、轻量级论坛软件，它的开发者是一名德国的 PHP 天才 Franz Liedke。FluxBB 的下一个版本(2.0)将被完全重写，并已经开发了一段时间。FluxBB 看起来非常有前途的，
java统计在线人数（session存储信息的） macroli java Web
这篇日志是我写的第三次了前两次都发布失败！郁闷极了！由于在web开发中常常用到这一部分所以在此记录一下，呵呵，就到备忘录了！我对于登录信息时使用session存储的，所以我这里是通过实现HttpSessionAttributeListener这个接口完成的。 1、实现接口类，在web.xml文件中配置监听类，从而可以使该类完成其工作。 public class Ses
bootstrp carousel初体验快速构建图片播放 qiaolevip 每天进步一点点学习永无止境 bootstrap 纵观千象
img{ border: 1px solid white; box-shadow: 2px 2px 12px #333; _width: expression(this.width > 600 ? "600px" : this.width + "px"); _height: expression(this.width &
SparkSQL读取HBase数据，通过自定义外部数据源 superlxw1234 spark sparksql sparksql读取hbase sparksql外部数据源
关键字：SparkSQL读取HBase、SparkSQL自定义外部数据源前面文章介绍了SparSQL通过Hive操作HBase表。 SparkSQL从1.2开始支持自定义外部数据源(External DataSource)，这样就可以通过API接口来实现自己的外部数据源。这里基于Spark1.4.0，简单介绍SparkSQL自定义外部数据源，访
Spring Boot 1.3.0.M1发布 wiselyman spring boot
Spring Boot 1.3.0.M1于6.12日发布，现在可以从Spring milestone repository下载。这个版本是基于Spring Framework 4.2.0.RC1,并在Spring Boot 1.2之上提供了大量的新特性improvements and new features。主要包含以下： 1.提供一个新的sprin

深度学习中的注意力机制

你可能感兴趣的:(深度学习,神经网络,人工智能,机器学习)