Amusi（CVer）

Transformer为何能闯入CV界秒杀CNN？

点击上方“CVer”，选择加"星标"置顶

重磅干货，第一时间送达

本文转载自：AI科技评论

编译 | Don、青暮

CV（计算机视觉）领域一直是引领机器学习的弄潮儿。近年来更是因为Transformers模型的横空出世而掀起了一阵腥风血雨。小编今天就带大家初步认识一下这位初来乍到的CV当红炸子鸡～

本文主要介绍Transformers背后的技术思想，Transformers在计算机视觉领域的应用情况、最新动态以及该架构相对于CNN的优势。

读完这篇文章之后，你将能知道：

为什么Transformers模型在NLP自然语言处理任务中能够力压群雄，变成SOTA模型的必备组件之一。
Transformers模型的计算原理。
为什么说Transformers是对CNN的当头棒喝，Transformers是怎么针对CNN的各种局限性进行补全的。
计算机视觉领域的最新模型是如何应用Transformers提升自己的。

长期依赖和计算效率之间的权衡取舍

在自然语言处理领域中，一个重要的技术基础就是创建合理的Embedding。Embedding是NLP系统的根基，一个好的Embedding需要能够将原始文本中尽可能多的语义片段进行有效编码。这些语义信息其实并不只是代表一个词的定义跟含义，很多时候是需要结合上下文进行联系的。

比如当我们孤零零的得到一个词“快”的时候，我们不知道它是指Fast还是Almost，基于这样没有上下文的孤零零的单词的Embedding，很多时候是盲目并且没有意义的。

又比如说这句话：“Transformers特别牛，因为它在很多项目中都能大幅提高模型的性能”。读了这句话，我们知道文中的“它”是指Transformers，但是如果没有这一整句话的承载，而是孤零零的给你一个词“它”，估计谁都不晓得这个家伙指代的是谁，那如此Embedding出来的结果也将毫无意义。

一个好的机器学习模型应该能够准确表达单词之间的依赖关系，不论是在超大型的文本中，还是在比较简短的文字片段中都是如此。

这就像是一个伏笔，作者在第一章中埋下了一个伏笔，隔了四五十页之后再次提及起它的时候，读者会觉得这是神来之笔，因为能够联系起它和当前文字之间的关系。

机器学习模型也应该具备这种记忆能力，以及超远文字之间的记录和依赖表达能力。或者换句话说，好的模型应该具有“长期依赖性的编码能力”。

在详细介绍Transformers之前，我们先来梳理一下NLP领域在Transformers技术诞生之前所面临的问题，尤其是在挖掘数据之间的长期依赖性时所面临的问题。

循环神经网络的问题

在NLP领域中，以LSTMs和GRU为代表的循环神经网络曾经风光无限，它们的结构内部有极其巧妙的长期状态输入和输出，能够让模型从文本中提取丰富的上下文语义。

它们的工作方式都是串行的，一次处理一个单词或者输入单元，并且设计了记忆结构来存储已经看到的内容的抽象特征，这些长时的抽象信息能够在之后的数据处理中帮助模型理解当前输入，或者处理长期的数据依赖，从而将前文中的语义信息添加到当前的结果输出之中。

RNN结构能够将前文的信息写入到记忆模块之中，是因为它们内部有各种门结构。其中输入门能够让神经网络有选择性的记录一些长时的有效信息，遗忘门会有针对性地抛弃一些无关的冗余信息，更新门还可以让网络对自身当前的状态根据输入进行实时更新。

相对于普通RNNs来说，加入了各种门结构的LSTM和GRU更受世人的喜爱，这是因为它们能够解决梯度爆炸和梯度消失的问题，模型的鲁棒性得到了明显提升。

梯度爆炸和梯度消失是长久以来困扰RNNs的一大问题。LSTM和GRU能够利用自身模型结构给梯度“续命”，有效追踪序列数据中相当长时间数据之间的依赖关系。

但是我们还是发现，这种序列式的网络，以及将有效信息存储到各个零散的神经元的方式，并不能有效地保存那些超长的数据依赖。

此外，序列式的网络结构也难以让LSTM和GRU网络有效地进行扩展和并行化计算。因为每一个前向的传递都是依赖于前一个时间步的处理结果，每得到一个输入，模型只能给出一步的输出。也就是每一步的计算都只能顾及当前输出，得到一个Embedding结果。

卷积神经网络的问题

卷积神经网络也是 NLP 系统中的常客，尤其是对于那些使用 GPUs 训练的模型任务来说更是如此。这是因为 CNNs 和 GPU 的组合能够天然耦合两者在计算伸缩性和高效性上的特点，所以二者逐渐成为形影不离的好基友。

CNNs 常被用在图像特征提取上，与此类似，在 NLP领域中，网络也会利用 CNNs 的一维滤波器从文本中提取有效信息，此时的文本就对应地以一维时间序列的形式进行表示了。所以图像处理中使用2D CNN , NLP 中就使用1D CNN ~

CNN的感受野（就是CNN能够看到的局部信息大小）是由卷积核/滤波器的尺寸，以及滤波器的通道数所决定的。

增加卷积核的尺寸或者滤波器的通道数会增加模型的大小，也会让模型的复杂度大幅增加。这也许会导致梯度消失的问题，从而引发让整个网络无法训练收敛的严重后果。

为解决这个问题，残差连接 Residual connections 和空洞卷积 Dilated Convolutions 应运而生。它们能够在一定程度上增强梯度的传播深度，从而在一定程度上扩大模型的感受野（后面的层就能看到更多的局部信息了嘛）。

但是，卷积神经网络毕竟只是关注局部信息的网络结构，它的这种计算机制导致了它在文本信息处理上难以捕捉和存储长距离的依赖信息。人们一方面想扩大卷积核、增加通道数来捕捉长期依赖，一方面还害怕由于扩大模型所导致的维度灾难。

Transformers横空出世

扯了半天终于要介绍我们今天的主角——Transformer 了。2017年的时候 Transformer 横空出世，当时的它被定位成一种简单并且可扩展的自然语言翻译方法，并且很快被应用到各类 NLP 任务之中，逐渐成为 SOTA 模型中的必备成员（比如 GLUE 、SQuAD 或者 sWAG )。

但并不是所有任务都是有能够喂饱深度网络的数据资本的，所以很多任务都会基于上述SOTA模型公开版本的半成品进行微调( finetuning )，从而适配自己的任务。这种做法十分常见并且有效，因为它大幅的节省了训练所需的数据量。

这些模型有的已经有着数十亿个参数量了，但是似乎还没有达到性能的天花板。随着模型参数量的增加，模型的结果还会持续上升，模型由此而表现的一些新特性和学习到的新知识也会越来越丰富，具体可以看GPT3的文章。

Transformer模型

当我们给定了一个包含N个单词的文本输入时，对于每个单词W，Transformers会为文本中的每个单词Wn创建N个权重，每个权重的值取决于单词在上下文中的依赖关系（Wn），以此来表示正在处理的单词的语义信息W。下图表述了这个想法，其中，蓝色线条的颜色深度表示分配给某个单词的注意力Attention的权重。

在这里，上面一行表示正在处理的单词，下面一行表示用作上下文的单词（注意，有些单词是相同的，但是如果它们正在被处理或被用于处理另一个单词的时候，它们的地位和处理方式将会有所差异）。请注意，上面一行的“They ”、“Cool”或者“Efficient”有很高的权重指向“Transformer”，因为这确实是它们所引用的目标单词。

然后，这些权重被用来组合来自每对单词的值，并为每个单词( W )生成一个更新的嵌入，该单词( W )现在包含关于这些重要单词( Wn )在特定单词( W )上下文中的信息。

其实，在这些现象的背后，transformers 使用了 self attention 即自注意力技术来计算这些更新的 Embedding 。Self Attention 是一种计算效率很高的模型技术，它可以并行地更新输入文本中每个单词的嵌入结果。

自注意力机制

假设我们得到了一段输入文本，并且从文本中的单词嵌入 W 开始。我们需要找到一种 Embedding 方法来度量同一文本中其他单词嵌入相对于 W 的重要度，并合并它们的信息来创建更新的嵌入W'。

自注意力机制会将 Embedding 输入文本中的每个单词线性投影到三个不同的空间中，从而产生三种新的表示形式：即查询query、键key和值value。

这些新的嵌入将用于获得一个得分，该得分将代表 W 和每个Wn 之间的依赖性（如果 W 依赖于 W'，则结果为绝对值很高的正数，如果 W 与W'不相关，则结果为绝对值很高的负值)。这个分数将被用来组合来自不同 Wn 单词嵌入的信息，为单词 W 创建更新的嵌入W'。

下面这张图展示了如何计算两个单词之间的 Attention 得分：

作者亲绘

图中的蓝色线段表示来自第一个单词 W 的信息流，棕色线代表来自第二个单词 Wn 的信息流。

每个单词的嵌入将乘以一个键和一个查询矩阵，从而得到每个单词的查询值和键值。为了计算 W 和 Wn 之间的分数，将W(W_q)的查询嵌入发送到 Wn ( Wn_k )的密钥嵌入，并为两个张量使用点积相乘。点积的结果值是它与自身之间的得分，表示 W 相对于 Wn 的依赖程度。

需要注意的是，我们还可以将第二个单词作为W，以及将第一个单词作为 Wn 。这样的话，我们就可以另外计算出一个分数，表示第二个单词对第一个单词的依赖性。我们甚至可以用同一个词 W 和 Wn 来计算这个词本身对它的定义有多重要～很巧妙吧。

自注意力机制能够计算文本中每对单词之间的注意力得分。该得分将被软最大化处理（Softmaxed），也就是将其转换为0到1之间的权重。

下图展示了如何使用这些权重获得每个单词的最终词嵌入：

作者亲绘

请注意,每个单词的 Embedding 现在需要乘以第三个矩阵来生成它们的值表示。这个结果将用于计算每个单词的最终嵌入。对于每个单词 W，文本 Wn 中每个单词的计算权重将乘以其相应的值表示（Wn_v），然后将它们相加。这个加权和的结果将用于更新嵌入单词 W (图中用e1和e1表示)。这里我们只是简单的对计算过程进行介绍，如果有小伙伴对其中的具体过程感兴趣的话,可以看看 Jay Alamar 下面的这篇文章：https://jalammar.github.io/illustrated-transformer/。

卷积归纳偏差

卷积网络模型多年来在计算机视觉领域是绝对的大哥大，获得了无数的成功，收获了无数的好评。GPU 作为 CNN 的好基友，由于可以进行有效的并行卷积计算而身价疯长。此外，CNN 也会在图像特征提取的过程中提供适当的归纳偏差( Inductive Biases )。

CNN 中的卷积运算由于使用了两个重要的空间约束，从而有助于视觉特征的学习和提取：

由于 CNN 权重共享机制，卷积层所提取的特征便具有平移不变性，它们对特征的全局位置不感冒，而只在乎这些决定性的特征是否存在。
由于卷积算子的性质，所以卷积的特征图具有局部敏感性,也就是每次卷积操作只会考虑原始数据的一小部分的局部信息。

正是由于此，CNN 的归纳偏差缺乏对输入数据本身的整体把握。它很擅长提取局部的有效信息，但是没能提取全局数据之间的长距离特征。

比如，当我们使用 CNN 去训练一个人脸识别模型时，卷积层可以有效的提取出眼睛大小、鼻子翘不翘、嘴巴颜色等小器官的特征，但是无法将他们联系起来，无法形成"眼镜在鼻子上"、"嘴巴在眼睛下面"的这种长距离的特征。因为每个卷积核都很局部，没办法同时处理这么多个特征。

为了提取和跟踪这些原始数据中的长相关特征，模型需要扩大自己的感受野，这就需要使用一些更大的卷积核，以及更深的卷积。但是由此会带来计算效率的大幅下降，会让模型的复杂度剧烈上升，甚至会让模型产生维度灾难从而无法收敛训练。

这种顾此失彼的权衡是不是听起来很耳熟？

计算机视觉领域中的Transformers

受到 Transformer 论文中使用自注意力机制来挖掘文本中的长距离相关依赖的启发，很多计算机视觉领域的任务提出使用自注意力机制来有效克服卷积归纳偏差所带来的局限性。希望能够将这种 NLP 领域中的技术思想借鉴到视觉领域中，从而提取长时依赖关系。

功夫不负有心人，Transformer为视觉领域带来了革新性的变化，它让视觉领域中目标检测、视频分类、图像分类和图像生成等多个领域有了长足的进步。这些应用了 Transformer 技术的模型有的识别能达到甚至超越该领域 SOTA 解决方案的效果。更让人兴奋的是，这些技术有的甚至干脆抛弃了 CNN，直接单单使用自注意力机制来构建网络。

目标检测：https://arxiv.org/pdf/2005.12872.pdf

视频分类：https://arxiv.org/pdf/1711.07971.pdf

图像分类：https://arxiv.org/pdf/1802.05751.pdf

图像生成：https://arxiv.org/pdf/2010.11929.pdf

这些使用了自注意力机制所生成的视觉特征图不会像卷积计算一样具有空间限制。相反，它们能够根据任务目标和网络中该层的位置来学习最合适的归纳偏差。研究表明，在模型的前几层中使用自注意力机制可以学习到类似于卷积计算的结果。

如果小伙伴想具体了解这一领域最近的动态,可以查看这篇由 Gbriel | lharco 撰写的推文：

https://arxiv.org/pdf/1911.03584.pdf

自注意力层

计算机视觉领域中的自注意力层的输入是特征图，目的是计算每对特征之间的注意力权重，从而得到一个更新的特征映射。其中每个位置都包含关于同一图像中任何其他特征的信息。

这些层可以直接代替卷积或与卷积层相结合，它们也能够处理比常规卷积更大的感受野。因此这些模型能够获取空间上具有长距离间隔的特征之间的依赖关系。

比如Non-local Netorks和Attention Augmented Convolutional Networks文章中所述，自注意力层最基本的实现方法是将输入特征图的空间维度展开成为一系列的 HWxF 的特征序列，其中 HW 表示二维空间维度， F 表示特征图的深度。自注意力层可以直接作用在序列数据上来获取更新后的特征图表示。

想具体了解这两篇论文的小伙伴请戳这里

Non-local Netorks：https://arxiv.org/pdf/1711.07971.pdf

Attention Augmented Convolutional Networks：https://arxiv.org/abs/1904.09925

但是实际上，对于高分辨率的输入来说，自注意力机制层的计算量很大，因此它只适用于较小的空间维度输入的数据场景。

很多工作也注意到这个问题，并且提出了一些解决方案，比如Axial DeepLab，它们沿着两个空间轴顺序计算Attention，而不是像普通自注意力机制一样直接处理整个图像数据，这使得计算更加高效。还有一些其他的优化解决方案，比如只处理较小的特征图Patch，而不是处理整个特征图空间。但是这样操作的代价是感受野比较小，这是在论文Stand-Alone Self-Attention in Vision Models中提出的。但是即便这样的感受野受到了限制，也比卷积操作的卷积核的感受野要大得多。

Axial DeepLab：https://arxiv.org/pdf/2003.07853.pdf

Stand-Alone Self-Attention in Vision Models：https://arxiv.org/pdf/1906.05909.pdf

当我们在模型的最后一层是用自注意力机制来将前面的各种卷积层相融合的时候，就可以得到最优的模型结果。

事实上，在实验中我们会发现，自注意力机制和卷积层是很类似的，尤其是在网络的前若干层中自注意力机制学习到的归纳偏差和卷积层学习到的特征图十分类似。

视觉Transformers

现有的计算机视觉工作中，除了那些将自注意力机制加入卷积流程中的工作之外，其他的方法的计算都仅仅依赖于自注意力层，并且只使用了最原始的Transformer的编码-解码器结构。

当我们的模型参数量能够设置得很大，并且数据量充足的时候，这些模型在图像分类任务/目标检测等任务中所表现出来的效果能够达到SOTA的程度，甚至有时候更好。同时这些模型的结构会更加简单，训练速度还会更快。

最原始的Transorfer的编码-解码器结构：https://arxiv.org/pdf/1706.03762.pdf

接下来我们简要的介绍三篇重要的相关论文，它们都在自己的网络中使用了Transformer结构。

1、Image Transormer

这篇论文提出了一种在ImageNet数据集上的全新SOTA图像生成器，并且在超高分辨率任务上取得了很好的效果。

论文地址：https://arxiv.org/pdf/1802.05751.pdf

在这篇论文中，他们将图像生成任务视作一个自回归问题，图片中的每个新像素仅基于图像中先前已知的像素值生成。在每一个特征生成过程中，自注意力机制将m个展开后的特征图作为上下文，从而生成未知的像素值。

为了让这些像素能够匹配自注意力层的输入，论文使用1D卷积将每个RGB值转换为d维张量，并将局部的上下文特征图的m维特征展平到一维。

下图就是这个模型的示意图：

原文中3.2节图1的自注意力结构

在图中，q表示要更新的像素embedding，它与内存中的像素m的所有其他嵌入相乘，使用查询和键矩阵（Wq和Wk）生成一个得分，然后对该得分进行softmax操作，并将其作为矩阵Wv的权重。算法最终将该Embedding加到原始的q Embedding中，从而得到最终的结果。在图中，p表示添加到每个输入嵌入中的位置编码。这种编码是从每个像素的坐标生成的。

需要注意的是，通过使用自注意力机制，算法可以并行地预测多个像素值，因为算法已经知道输入图像的原始像素值，并且用于计算自我注意的Patch机制，可以处理比卷积层更高的感受野。但是在评估的操作过程中，由于图像的生成依赖于每个像素的邻居的值，因此只能单步执行。

2、DETR

DETR是DEtection TRansformer的缩写，它是一种结构较为简单的模型，在目标检测领域中达到了SOTA的高度。

论文地址：https://arxiv.org/pdf/2005.12872.pdf

模型的结构如下图所示：

原文中3.2节图2的DETR结构图

它搭配着使用了自注意力机制，以及从卷积神经网络提取的视觉特征。在CNN的主干模块中，算法计算的特征图会首先被展平，也就是说，如果特征地图具有形状（h x w x d），则展平结果将具有形状（hw x d）。每一个维度中都添加了一个可学习的位置编码，而编码器也会将结果序列作为输入。

编码器使用多个自注意力块来组合不同Embedding之间的特征。处理后的Embedding被传递到一个解码器模块。这个解码器模块使用可学习的Embedding作为对象查询来处理所有视觉特征，从而生成一个嵌入。

在该嵌入中，执行目标检测所需的所有信息都被编码。每个输出被输入到一个全连接层中，该网络模块将输出一个包含元素c和b的五维张量，其中c表示该元素的预测类个数，b表示边界框的坐标（分别是一维和四维）。c的值分配给一个“no object”标记，它表示没有找到任何有意义的检测的目标查询，所以说模型将不考虑它的坐标。

这个模型能够并行计算单个图像的多个检测。但是，它可以检测到的目标个数受制于所使用的目标查询次数。

论文的作者在文中表示，该模型在大尺寸目标识别的图像处理方面优于SOTA模型。他们认为这都归功于自注意力机制为模型提供了更高的感受野。

3、Vision Transformer（ViT）

这个模型是图像识别领域的代表性SOTA工作，它仅仅使用了自注意力机制，而且达到了目前的SOTA识别率。

论文地址：https://arxiv.org/pdf/2010.11929.pdf

下面是论文模型的一个例子：

原文3.1节图1中的ViT结构

该模型的输入是从像素大小为PxP的块中提取的平坦像素向量。每个输入像素被送入一个线性投影层，这个层将产生文中所谓的“补丁嵌入（Patch embeddings）”。注意，在序列的开头处，模型附加了一个额外可学习的嵌入。这种嵌入处于自我注意更新之后，用于预测输入图像的类别。每个Embedding中也添加了一个可学习的位置Embedding。

分类只需将一个 MLP 头放在Transformer结构的顶部，具体的插入位置就是在我们添加到序列中的额外可学习的Embedding位置。

此外，本文还给出了一种混合的模型结构。它使用ResNet早期的特征映射作为Transformer的输入，而没有选择输入投影的图像块。通过对 Transformer 模型和 CNN 骨干网络端到端的训练，模型能够达到最好的图像分类结果。

位置编码

由于Transformers需要学习一个具体的任务，也就是需要学习该任务的归纳偏差，所以只要进行模型训练，就都会对该网络产生一定的收益。换句话说，任何可以包含在模型输入中的归纳偏差都将有助于模型的学习，并能够用于改善结果。

当使用Transformers的更新功能时，输入序列的顺序信息会被丢失。对于Transformer模型来说，这个顺序信息是很难被学习到的，或者说有的时候根本不可能被学习到。所以它所做的就是将一个位置表示聚合到模型的输入嵌入中。这种位置编码可以通过学习获得，也可以从一个固定的函数中取样得到。虽然聚合操作通常只在输入到模型的嵌入处完成，但是我们其实是可以改变这个聚合操作的位置。

在计算机视觉中，这些嵌入既可以表示特征在一维平坦序列中的位置，也可以表示特征的二维位置。

在该领域中，大家普遍认为位置编码是很有效的一种信息。它们由可学习的若干个嵌入组成。这些嵌入特征不用编码全局的位置，转而去学习各个编码特征之间的相对距离从而达到更好的效果。

结论

Transformers结构解决了一个自然语言处理和计算机视觉领域都困扰已久的问题——长期依赖。

Transformer模型是一种很简单但是很灵活的方法，如果将其抽象为一系列嵌入，那么它可以应用于任何类型的数据。

卷积具有平移不变性、局部敏感性，也缺少对图像的整体感知和宏观理解。

Transformers可用于卷积网络中，从而让网络学习处对图像的全局理解。

Transformers能够用于计算机视觉领域，就算我们把原来卷积网络中的卷积层都抛弃，只使用Transformers层的时候，模型也能得到SOTA的结果。

原文链接：

https://towardsdatascience.com/transformers-in-computer-vision-farewell-convolutions-f083da6ef8ab

后台回复：Transformer综述，即可下载两个最新的视觉Transformer综述PDF，肝起来！

点击下方卡片并关注，了解CV最新动态

重磅！CVer-Transformer交流群成立

扫码添加CVer助手，可申请加入CVer-Transformer方向 微信交流群，也可申请加入CVer大群，细分方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、Transformer、PyTorch和TensorFlow等群。

一定要备注：研究方向+地点+学校/公司+昵称（如Transformer+上海+上交+卡卡），根据格式备注，才能通过且邀请进群

▲长按加微信群

▲点击上方卡片，关注CVer公众号

整理不易，请给CVer点赞和在看！

你可能感兴趣的:(神经网络,python,计算机视觉,机器学习,人工智能)

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
Python 实现图片裁剪（附代码） | Python工具剑客阿良_ALiang
前言本文提供将图片按照自定义尺寸进行裁剪的工具方法，一如既往的实用主义。环境依赖ffmpeg环境安装，可以参考我的另一篇文章：windowsffmpeg安装部署_阿良的博客-CSDN博客本文主要使用到的不是ffmpeg，而是ffprobe也在上面这篇文章中的zip包中。ffmpy安装：pipinstallffmpy-ihttps://pypi.douban.com/simple代码不废话了，上代码
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
python os 环境变量 CV矿工 python 开发语言 numpy
环境变量：环境变量是程序和操作系统之间的通信方式。有些字符不宜明文写进代码里，比如数据库密码，个人账户密码，如果写进自己本机的环境变量里，程序用的时候通过os.environ.get（）取出来就行了。os.environ是一个环境变量的字典。环境变量的相关操作importos"""设置/修改环境变量：os.environ[‘环境变量名称’]=‘环境变量值’#其中key和value均为string类
Python爬虫解析工具之xpath使用详解 eqa11 python 爬虫开发语言
文章目录Python爬虫解析工具之xpath使用详解一、引言二、环境准备1、插件安装2、依赖库安装三、xpath语法详解1、路径表达式2、通配符3、谓语4、常用函数四、xpath在Python代码中的使用1、文档树的创建2、使用xpath表达式3、获取元素内容和属性五、总结Python爬虫解析工具之xpath使用详解一、引言在Python爬虫开发中，数据提取是一个至关重要的环节。xpath作为一门
【华为OD技术面试真题 - 技术面】- python八股文真题题库（1）算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.数据预处理流程数据预处理的主要步骤工具和库2.介绍线性回归、逻辑回归模型线性回归（LinearRegression）模型形式：关键点：逻辑回归（LogisticRegression）模型形式：关键点：参数估计与评估：3.python浅拷贝及深拷贝浅拷贝（Shal
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
Python中深拷贝与浅拷贝的区别 yuxiaoyu.
转自：http://blog.csdn.net/u014745194/article/details/70271868定义：在Python中对象的赋值其实就是对象的引用。当创建一个对象，把它赋值给另一个变量的时候，python并没有拷贝这个对象，只是拷贝了这个对象的引用而已。浅拷贝：拷贝了最外围的对象本身，内部的元素都只是拷贝了一个引用而已。也就是，把对象复制一遍，但是该对象中引用的其他对象我不复
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python编译器鹿鹿~ Python编译器 Python python 开发语言后端
嘿嘿嘿我又来了啊有些小盆友可能不知道Python其实是有编译器的，也就是PyCharm。你们可能会问到这个是干嘛的又不可以吃也不可以穿好像没有什么用，其实你还说对了这个还真的不可以吃也不可以穿，但是它用来干嘛的呢。用来编译你所打出的代码进行运行（可能这里说的有点不对但是只是个人认为）现在我们来说说PyCharm是用来干嘛的。PyCharm是一种PythonIDE，带有一整套可以帮助用户在使用Pyt
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D