聊北辰同学

【深度学习】Transformer原理篇——浓缩的精华

文章目录

- - 0. 前言
  - 1. 认识Transformer
  - - 1.1 Seq2Seq模型与Attention机制
    - 1.2 Transformer
    - - 1.2.1 Transformer基本结构
      - 1.2.2 Transformer的注意力机制
      - 1.2.3 Transformer的位置编码
  - 2. Transformer的应用探索
  - - 2.1 NLP
    - 2.2 CV
  - 参考

0. 前言

Transformer由Google在《Attention Is All You Need》这篇论文中被提出，主要用于处理Seq2Seq（序列到序列，Sequence to Sequence）问题，从论文名称可以看出Google团队的野心和对Transformer模型的自信。最近，在NLP（自然语言处理）领域称霸的Transformer将触手申向了CV（计算机视觉）领域并取得了令人惊叹的效果，本文从Transformer和Attention机制入手，并介绍Transformer在CV领域进行尝试的一些经典案例。

1. 认识Transformer

Transformer设计之初主要针对Seq2Seq问题，核心内容为Attention机制和位置编码。

1.1 Seq2Seq模型与Attention机制

介绍Transformer之前先简单了解一下Seq2Seq模型。以Seq2Seq中最经典的案例翻译为例，Seq2Seq便是将序列A（某语言句子，如中文）转换为序列B（另一种语言的句子，如英文）。介绍Seq2Seq之前，先看看要实现序列A到序列B的转换，RNN（循环神经网络）是如何实现的。图1-1展示了一个RNN模型的结构，红色代表输入序列，蓝色代表输出序列。通过图1-1不难发现，对于RNN实现的序列到序列的转换在输入输出的长度上是严格对其的，显然对于翻译而言输入输出长度完全做到对其是不现实的。（还不熟悉RNN的建议先简单了解一下RNN的基本原理）。

图1-1 RNN结构示意图

这种输入输出序列长度不对其的情况，通常被描述为N到M的Seq2Seq问题，图1-2为某种简单的Seq2Seq模型结构的示意图，模型包含Encoder（编码器）和Deconder（解码器）两个主要组成部分。通过将输入序列和输出序列的处理独立出来，可以有效避免对长度的限制。

Encoder（编码器）：处理输入序列，得到记录了输入序列信息的上下文向量（或称为编码向量，对应图1-3中的context）；
Deconder（解码器）：将Encoder得到的编码向量作为输入并解码至目标类型的序列；

图1-2 某简单Seq2Seq模型结构示意图

图1-3 基于Seq2Seq的翻译实现

Seq2Seq模型的工作过程可以理解为，输入一个序列，Encoder完成对序列的理解，然后将所理解的信息送入Deconder解码至目标类别的序列。

至此，输入序列和输出序列长度不对其的问题得以解决，但是单独一个上下文向量context能否像我们设想的那样记录输入序列的所有有用信息呢？解码过程中又如何避免信息的丢失？

举个简单的例子，“早上好”翻译至“good morning”，显然“好”对应“good”，“早上”对应“morning”，对于这样的短句子要让模型将“早上好”编码至context并解码出来似乎不是很难，但如果句子很长呢？很长的句子信息完全压缩到一个context中再解码，且不说编码过程中的信息丢失问题，要在解码过程中实现信息的搜寻和对应也并非易事。于是，天降猛男，今天的主角，Attention机制（注意力机制）派上了用场，图1-4为带注意力机制的Seq2Seq模型的示意图。

图1-4 带Attention的Seq2Seq模型示意图

先不去讨论注意力机制实现的底层原理，先看看Attention机制是如何解决前面我们提到的问题的。Attention实际上就是额外增加一些可学习的参数，推理过程中通过这些参数得到一系列注意力权重来模拟信息之间关联性的强弱。如“good”同“好”的关联性更大，而同“早上”的关联性较小，对应图1-4，我们便希望 $w_{11}$ 和 $w_{12}$ 相对于 $w_{13}$ 要小，在解码得到“good”的过程中，除了输入context向量，同时将分配了注意力权重后的“早上好”对应的每个字的信息也输入到解码器中以达到更好的翻译效果。类似的，可以同相同的方式实现在输出“morning”的过程中增“早上”两个字的权重。

以上便是基于RNN和Attention实现的Seq2Seq模型的简介。

1.2 Transformer

同基于RNN的Seq2Seq一样，Transformer也需要解决几个核心问题：

序列数据处理，序列的表示
- RNN中序列数据的处理是基于循环结构实现的，依次将每个数据按顺序输入RNN单元；
- Transformer中处理这种顺序关系主要依赖于Positional Encoding（位置编码）完成；
重要信息关联
- 都是基于Attention机制实现，但是Transformer的Attention更为复杂；

以上看不懂没事，下面开始带着疑问学习Transformer模型。

1.2.1 Transformer基本结构

Transformer的基本结构同大多数Seq2Seq模型一样，由Encoder（编码器）和Deconder（解码器）两个主要部分组成，完整结构如图1-5所示。

图1-5 Transformer模型示意图

但这个图有点复杂，理解起来有点困难。所以，接下来我们由外到内一步步理解这个模型结构。图1-6为Transformer模型的Encoder-Deconder结构，此结构和大多数Seq2Seq模型的结构还是没有区别的。

图1-6 Transformer模型的基本结构：Encoder-Deconder

图1-5中的”Nx“表示灰色区域包含的单元结构堆叠N次，这里主要是为了提取更抽象的特征，和卷积神经网络堆叠多层的原理是一样的，同样的这里也会采用类似ResNet的残差结构来避免层数过深带来模型性能的消退。Transformer模型原论文中，Encoder和Deconder各自堆叠了6次，所以图1-6所示的模型结构可以进一步拆解为图1-7所示的结构。这里需要注意的是，编码器只会取最后一层的输出，而编码器得到的特征向量会传递给解码器的每一层。

图1-7 Transformer模型的基本结构：多层结构

接下来具体看看Encoder编码器和Decoder解码器内部都做了些什么。图1-8为编码器和解码器的内部结构，编码器主要包含Self-Attention（自注意力机制）和Feed Network（前馈神经网络）两个部分，解码器增加了一个编码-解码注意力层。

图1-8 编码器和解码器的内部结构

编码-解码注意力层同前面1.1小节提到的注意力机制类似，实际上可以理解为输入同输出之间的注意力，即得到某个输出需要关注哪些输入，越重要的输入分配越大的权重。但自注意力描述的是同一序列不同数据之间的关系强弱，这也是其被称为Self-Attention的原因。图1-9为某自注意力机制的可视化，可以看到通过自注意力机制，”Law“和”The"、“perfect”被赋予了较强的关联性，这与我们所认知的语法和语义信息是匹配的。

图1-9 Self-Attention可视化例子

关于注意力机制的详细内容参考1.2.2小节的内容。

1.2.2 Transformer的注意力机制

通过上一小节可以初步理解Transformer中注意力机制的作用，趁热打铁，本小节介绍一下注意力机制的原理和实现。这之前，先看看图1-10所展示的人类的视觉注意力，人类在观看一张图片时通常会将注意力集中在某些感兴趣区域，这可以帮助人类收集关键信息和减轻大脑处理信息的负担。同样的，在深度学习中，注意力机制的作用也是如此，一方面增强有用信息、减弱无用信息，另一方面在某些情况下可以降低计算成本，如仅对高关注度的信息进行处理。

图1-10 人类视觉注意力

通过图1-10我们可以发现，注意力机制实际上就是要得到权重信息（图1-10中底图上方的热力图所代表的重要性，颜色越红表示注意力权重越高，反之越低），然后将这些权重同原图相乘，就得到了注意力增强后的图片（这里的原图在深度学习中更多的是特征图）。回到Transformer在处理序列问题时所用的两种注意力网络，自注意力层和编码-解码注意力层。图1-11是我随意绘制的自注意力和编码-解码注意力的区别的可视化示意图，自注意力是同一序列不同数据之间的关系强弱，而编码-解码注意力是解码的序列和编码的序列之间的关系强弱。

图1-11 自注意力和编码-解码注意力的区别

那么如何将这种注意力机制通过数学进行表达，并应用到深度学习模型当中呢？

在注意力机制中，输入特征通常会被生成三种特征向量：

Q-Query：查询向量
K-Key：键向量
V-Value：值向量

前面已经提到，注意力机制实际上就是分配权重的过程，注意力机制中权重的获得通常需要两个过程：

计算分数Score
Softmax归一化得到和为1的权重分布

获得权重，参考公式 $(1)$ ：
$W=Softmax({\frac{QK^T}{\sqrt{d_k} }}) \tag{1}$
其中， $\sqrt{d_k}$ 是一个尺度参数。

最终输出，参考公式 $(2)$ ：
$Attention(Q,K,V)=WV=Softmax({\frac{QK^T}{\sqrt{d_k} }})V \tag{2}$
简单的概括就是，通过Q，K得到分数，用Softmax归一化后乘以V得到最终输出。对于自注意力和编码-解码注意力而言，其K，Q，V的来源存在区别，可参考表1-1。不难理解，对于自注意力而言，K，Q，V来源是相同的，其关注的是序列本身不同数据之间的关联性，而对于编码-解码注意力而言Q来自Decoder-自注意力层输出，而K，V来自Encoder的输出，这也是编码-解码注意力层能够建立输入序列同输出序列之间的联系的原因。

表1-1 自注意力和编码-解码注意力的K,Q,V的区别

注意力机制类型	Q	K	V
Encoder部分的自注意力	Encoder输入（上一层Encoder输出）	Encoder输入	Encoder输入
Decoder部分的自注意力	Decoder输入（上一层Decoder输出）	Decoder输入	Decoder输入
编码-解码注意力	Decoder-自注意力层输出	Encoder输出	Encoder输出

补充：

Transformer使用注意力机制的优势

自注意力机制的优势：self-attention可以有效地解决长时依赖问题

长时依赖问题：对于RNN而言，序列信息依次传递，传递过程中会面临梯度消失问题，导致跨度较大的数据之间的信息难以得到有效的传递。当然如果输入较长的序列导致self-attention计算量太大，可以用窗口限制self-attention的计算数量

此外，注意力机制会生成权重信息，这对于提升模型可解释性具有非常重要的作用。
Mutli-Head Attention的实现

通过多个个不同的线性变换得到多组Q，K，V，最后将不同的attention结果拼接起来，这样做的好处是可以学习多种关联模式。这里需要补充的是，这些Q，K，V之间的运算是可以组成一个大的矩阵来一起计算的。

$MutliHeadAtt=\text{concat}(head_1, head_2,...,head_n) \tag{3}$

$head_n=Attention(Q_n,K_n,V_n) \tag{4}$

Decoder中的mask操作

Decoder中接受输入的attention多加了一个mask，因为训练时的output都是ground truth，这样可以确保预测第i个位置时不会接触到未来的信息。难理解的可以回想一下RNN的输出，基于RNN的解码过程也是依次进行，只会接受之前的信息。

1.2.3 Transformer的位置编码

对序列信息进行建模的过程中，相对位置是非常重要的，比如：

我喜欢美女。
美女喜欢我。

虽然两句话字符完全相同，只不过顺序发生了改变，内容就完全不一样了。而Transformer抛弃了RNN，RNN最大的优点就是对序列信息的抽象和建模，所以Transformer用了Positional Encoding（位置编码）的方法引入相对位置信息。

在《Attention is All You Need》中作者给出了两种方法：

用不同频率的 $s i n ()$ 和 $c o s ()$ 函数直接计算；
学习出一份positional embedding（参考文献）；

实验分析后，作者选择了第一种方法，具体公式如下：
${PE}_{pos,2i}=sin(\frac{pos}{10000^{2i/{d_{model}}}}) \tag{5}$

${PE}_{pos,2i+1}=cos(\frac{pos}{10000^{2i/{d_{model}}}}) \tag{6}$

最终得到的位置编码值为公式 $(5)$ 和 $(6)$ 得到的结果的拼接后的编码向量。如图1-11为位置编码的可视化效果，每一行对应一个词的位置编码，左半部分的值由 $s i n ()$ 函数生成，而右半部分由 $c o s ()$ 函数生成。

图1-11 位置编码可视化

第一种方法的优点是能够扩展到未知的序列长度(例如，当我们训练出的模型需要翻译远比训练集里的句子更长的句子时)。而第二种基于学习的方法会一定程度上受训练数据的影响，序列长度扩展后性能会受到影响。

2. Transformer的应用探索

2.1 NLP

2.2 CV

参考

[1]. Attention Is All You Need

[2]. 完全解析RNN, Seq2Seq, Attention注意力机制

[3]. 【NLP】Transformer模型原理详解

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
开启你的思维成长之路希思维
图片发自App很多时候我们都羡慕别人家的孩子思维敏捷，记忆超强，脑回路清晰等，认为那些都是天生的能力，而自己要达到那样的境界几乎不可能，殊不知每个人都有一个强大的小宇宙，就看你是否找到了开启你思维小宇宙的方法。我们每个人的大脑都具有无限潜能，大部分人只开发出10-20%，还有很多潜力深埋于冰山底，而如何找到自己思维的动力呢?首先就是要了解我们神奇的大脑，从大脑神经元素，到神经回路的形成，知晓大脑思
自然语言处理_tf-idf _feivirus_ 算法机器学习和数学自然语言处理 tf-idf 逆文档频率词频
importpandasaspdimportmath1.数据预处理docA="Thecatsatonmyface"docB="Thedogsatonmybed"wordsA=docA.split("")wordsB=docB.split("")wordsSet=set(wordsA).union(set(wordsB))print(wordsSet){'on','my','face','sat',
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
推荐3家毕业AI论文可五分钟一键生成！文末附免费教程！小猪包333 写论文人工智能 AI写作深度学习计算机视觉
在当前的学术研究和写作领域，AI论文生成器已经成为许多研究人员和学生的重要工具。这些工具不仅能够帮助用户快速生成高质量的论文内容，还能进行内容优化、查重和排版等操作。以下是三款值得推荐的AI论文生成器：千笔-AIPassPaper、懒人论文以及AIPaperPass。千笔-AIPassPaper千笔-AIPassPaper是一款基于深度学习和自然语言处理技术的AI写作助手，旨在帮助用户快速生成高质
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
[实践应用] 深度学习之优化器 YuanDaima2048 深度学习工具使用 pytorch 深度学习人工智能机器学习 python 优化器
文章总览：YuanDaiMa2048博客文章总览深度学习之优化器1.随机梯度下降（SGD）2.动量优化（Momentum）3.自适应梯度（Adagrad）4.自适应矩估计（Adam）5.RMSprop总结其他介绍在深度学习中，优化器用于更新模型的参数，以最小化损失函数。常见的优化函数有很多种，下面是几种主流的优化器及其特点、原理和PyTorch实现：1.随机梯度下降（SGD）原理:随机梯度下降通过
（缓解抑郁症状）中原焦点团队杨小杰坚持分享第226天2021-4-1 yxjlady
缓解抑郁症状1、不要总待在室内，抑郁严重的人，通常都不想出门2、抑郁性都有诱因或一个导火索，人不能战胜所有东西，要有取舍3、社交，抑郁症的人总是自己脑中不断的自言自语，自我否定等，出去社交就被迫被别的东西点拨了，深度抑郁没法走出自己的世界，思维走不出自己的怪圈4、锻炼让自己轻微出汗最佳，身心是一体时，身体有活力，精神很难不健康5、冥想冥想和社交一样，可以改变你的神经可塑性，一个沉溺在自己世界里的抑
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【诗歌】虾皮汤·想念九月咖胖糖
虾皮坠入开水的柔情焦灼了自己艰苦的曾经舀起一口黄昏的思念记忆的支离拨动了自己淡然的神经童年的下水道子依然囚禁着天空木梯子拐角的蜘蛛网又织着谁的苍老那碗热气腾腾的虾皮汤是否在某个瞬间微漾着你的鹤发童颜图片发自App
轻量级模型解读——轻量transformer系列 lishanlu136 #图像分类轻量级模型 transformer 图像分类
先占坑，持续更新。。。文章目录1、DeiT2、ConViT3、Mobile-Former4、MobileViTTransformer是2017谷歌提出的一篇论文，最早应用于NLP领域的机器翻译工作，Transformer解读，但随着2020年DETR和ViT的出现(DETR解读，ViT解读)，其在视觉领域的应用也如雨后春笋般渐渐出现，其特有的全局注意力机制给图像识别领域带来了重要参考。但是tran
吴恩达深度学习笔记(30)-正则化的解释极客Array
正则化（Regularization）深度学习可能存在过拟合问题——高方差，有两个解决方法，一个是正则化，另一个是准备更多的数据，这是非常可靠的方法，但你可能无法时时刻刻准备足够多的训练数据或者获取更多数据的成本很高，但正则化通常有助于避免过拟合或减少你的网络误差。如果你怀疑神经网络过度拟合了数据，即存在高方差问题，那么最先想到的方法可能是正则化，另一个解决高方差的方法就是准备更多数据，这也是非常
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
深度学习-点击率预估-研究论文2024-09-14速读 sp_fyf_2024 深度学习人工智能
深度学习-点击率预估-研究论文2024-09-14速读1.DeepTargetSessionInterestNetworkforClick-ThroughRatePredictionHZhong,JMa,XDuan,SGu,JYao-2024InternationalJointConferenceonNeuralNetworks,2024深度目标会话兴趣网络用于点击率预测摘要：这篇文章提出了一种新
计算机视觉中，Pooling的作用 Wils0nEdwards 计算机视觉人工智能
在计算机视觉中，Pooling（池化）是一种常见的操作，主要用于卷积神经网络（CNN）中。它通过对特征图进行下采样，减少数据的空间维度，同时保留重要的特征信息。Pooling的作用可以归纳为以下几个方面：1.降低计算复杂度与内存需求Pooling操作通过对特征图进行下采样，减少了特征图的空间分辨率（例如，高度和宽度）。这意味着网络需要处理的数据量会减少，从而降低了计算量和内存需求。这对大型神经网络
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
神经网络-损失函数红米煮粥神经网络人工智能深度学习
文章目录一、回归问题的损失函数1.均方误差（MeanSquaredError,MSE）2.平均绝对误差（MeanAbsoluteError,MAE）二、分类问题的损失函数1.0-1损失函数（Zero-OneLossFunction）2.交叉熵损失（Cross-EntropyLoss）3.合页损失（HingeLoss）三、总结在神经网络中，损失函数（LossFunction）扮演着至关重要的角色，它
OpenCV图像处理技术（Python）——入门森屿_ opencv
©FuXianjun.AllRightsReserved.OpenCV入门图像作为人类感知世界的视觉基础，是人类获取信息、表达信息的重要手段，OpenCV作为一个开源的计算机视觉库，它包括几百个易用的图像成像和视觉函数，既可以用于学术研究，也可用于工业邻域，它于1999年由因特尔的GaryBradski启动，OpenCV库主要由C和C++语言编写，它可以在多个操作系统上运行。1.1图像处理基本操作
损失函数与反向传播 Star_. PyTorch pytorch 深度学习 python
损失函数定义与作用损失函数(lossfunction)在深度学习领域是用来计算搭建模型预测的输出值和真实值之间的误差。1.损失函数越小越好2.计算实际输出与目标之间的差距3.为更新输出提供依据（反向传播)常见的损失函数回归常见的损失函数有：均方差（MeanSquaredError，MSE）、平均绝对误差（MeanAbsoluteErrorLoss，MAE）、HuberLoss是一种将MSE与MAE
BP神经网络的传递函数大胜归来19 MATLAB
BP网络一般都是用三层的，四层及以上的都比较少用；传输函数的选择，这个怎么说，假设你想预测的结果是几个固定值，如1,0等，满足某个条件输出1，不满足则0的话，首先想到的是hardlim函数，阈值型的，当然也可以考虑其他的；然后，假如网络是用来表达某种线性关系时，用purelin---线性传输函数；若是非线性关系的话，用别的非线性传递函数，多层网络时，每层不一定要用相同的传递函数，可以是三种配合，可
探索创新科技： Lite-Mono - 简约高效的小型化Mono框架杭律沛Meris
探索创新科技：Lite-Mono-简约高效的小型化Mono框架Lite-Mono[CVPR2023]Lite-Mono:ALightweightCNNandTransformerArchitectureforSelf-SupervisedMonocularDepthEstimation项目地址:https://gitcode.com/gh_mirrors/li/Lite-Mono如果你在寻找一个轻
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D