c++服务器开发

揭开机器学习转换器架构的神秘面纱

自2017年推出以来，转换器（Transformers）已成为机器学习领域的一支突出力量，彻底改变了专业翻译和自动完成服务的能力。

最近，随着OpenAI公司的ChatGPT和Meta公司的LLama等大型语言模型的出现，转换器的受欢迎程度飙升。所有上述这些模型都建立在转换器架构的基础上，引起了业界极大的关注。通过利用转换器的力量，这些模型在自然语言理解和生成方面取得了显著突破。

尽管目前网络上已经存储很多很好的资源可以解释转换器的工作方式，但我发现自己仅停留在一个理解转换器数学工作原理的层次上，却很难直观地解释转换器是如何工作的。在进行了多次采访，与我的同事交谈，并就这个问题进行了闪电式的（简短）演讲之后，我发现似乎很多人都存在这样的问题！

在这篇博客文章中，我将努力提供一个关于转换器如何在不依赖代码或数学原理的情况下工作原理的高级解释。我的目标是避免混淆技术术语，避免与以前的体系结构进行比较。虽然我会尽量保持简单，但这并不容易，因为转换器非常复杂，但我希望它能更好地直观地了解它们做什么以及如何做。

什么是转换器？

转换器是一种神经网络架构，非常适合处理序列作为输入的任务。在这种情况下，序列最常见的例子可能是一个句子，我们可以将其视为一组有序的单词。

这些模型的目的是为序列中的每个元素创建一个数字化表示，用于封装关于元素及其相邻上下文的基本信息。然后，可以将得到的数字表示传递给下游网络，下游网络可以利用这些信息来执行各种任务，包括生成和分类。

通过创建这样丰富的表示，这些模型使下游网络能够更好地理解输入序列中的潜在模式和关系，这增强了它们生成连贯和上下文相关输出的能力。

转换器的关键优势在于它们能够处理序列中的很长范围的依赖关系，并且效率很高；能够并行处理序列。这对于机器翻译、情感分析和文本生成等任务特别有用。

Azure OpenAI服务DALL-E模型生成的图像，其中带有以下提示：“The green and black Matrix code in the shape of Optimus Prime（擎天柱形状的绿色和黑色矩阵代码）”

输入到转换器的内容

要将输入馈送到转换器中，我们必须首先将其转换为标记序列——表示我们输入的一组整数。

由于转换器最初应用于自然语言处理领域，所以让我们首先考虑这个场景。将一个句子转换为一系列标记的最简单方法是定义一个词汇表，该词汇表充当查找表，将单词映射为整数；我们可以保留一个特定的数字来表示这个词汇表中不包含的任何单词，这样我们就可以总是分配一个整数值。

在实践中，这是一种过于简单的文本编码方式，因为cat和cats等词会被视为完全不同的标记，尽管它们是对同一动物的单数和复数描述！为了克服这一点，人们设计了不同的标记化策略，如字节对编码，在对单词进行索引之前，将其分解成更小的块。此外，添加特殊的标记来表示句子的开头和结尾等特征，为模型提供额外的上下文，这通常很有用。

让我们考虑下面的例子，以更好地理解标记化过程。

“Hello there, isn’t the weather nice today in Drosval?（你好，德罗斯瓦尔市今天天气好吗？）”

这里，Drosval是GPT-4使用以下提示生成的名称：“Can you create a fictional place name that sounds like it could belong to David Gemmell’s Drenai universe?（你能创建一个听起来可能属于David Gemmell的Drenai宇宙的虚构地名吗？）”；这是故意选择的，因为它不应该出现在任何训练过的机器模型的词汇表中。

借助转换器库中的 bert-base-uncased分词器，将上面的语句转换为以下标记序列：

表示每个单词的整数将根据特定的模型训练和标记化策略而变化。解码后，我们可以看到每个标记所代表的单词：

有趣的是，我们可以看到这与我们当初的输入不同。其中添加了一些特殊的标记，我们的缩写被拆分为多个标记，我们虚构的地名由不同的“块”表示。当我们使用前面所述的bert-base-uncased模型时，我们也失去了所有的大写上下文。

然而，虽然我们在示例中使用了一个句子，但转换器并不局限于文本输入；该体系结构在视觉任务上也取得了良好的效果。为了将图像转换为序列，ViT（译者注：是指转换器在CV领域中的两个经典算法之一，另一个算法是DeiT）的作者将图像切片为不重叠的16x16像素块，并在将其传递到模型中之前将其连接成长向量。如果我们在推荐系统中使用转换器，一种方法可以是使用用户浏览的最后n个项目的项目ID作为我们网络的输入。如果我们能够为我们的域创建一个有意义的输入标记表示，我们就可以将其输入到转换器网络中。

嵌入我们的标记

一旦我们有了一个整数序列来表示我们的输入，我们就可以将它们转换为嵌入。嵌入是一种表示信息的方式，可以通过机器学习算法轻松处理；他们的目的是通过将信息表示为一系列数字来捕捉以压缩格式编码的标记的含义。最初，嵌入被初始化为随机数序列，并且在训练期间学习有意义的表示。然而，这些嵌入有一个固有的限制：它们没有考虑到标记出现的上下文。这有两个方面。

一个问题是，根据任务的不同，当我们嵌入标记时，我们可能还希望保留标记的顺序；这在NLP等领域尤其重要；否则，我们基本上会采用单词袋方法。为了克服这一点，我们将位置编码应用于嵌入。虽然有多种方法可以创建位置嵌入，但主要思想是我们有另一组嵌入，它们表示输入序列中每个标记的位置，并与我们的标记嵌入相结合。

另一个问题是，根据周围的标记内容，标记可能会有不同的含义。考虑以下句子：

It’s dark, who turned off the light?（天黑了，谁关灯了？）

Wow, this parcel is really light!（哇，这个包裹真轻！）

在这里，“light”这个词被用于两个不同的上下文，在不同的上下文中它有完全不同的含义！然而，根据标记化策略，嵌入可能是相同的。在转换器中，这是由它的注意力机制来处理的。

从概念上讲，什么是注意力？

转换器架构使用的最重要的机制可能是注意力，它使网络能够了解输入序列的哪些部分与给定任务最相关。对于序列中的每个标记，注意力机制识别哪些其他标记对于理解给定上下文中的当前标记很重要。在我们探索如何在转换器中实现这一点之前，让我们从简单的内容开始，试着理解注意力机制在概念上试图实现什么，以便建立我们的直觉理解基础。

理解注意力的一种方法是将其视为一种方法，该方法将每个标记嵌入替换为包含关于其相邻标记的信息的嵌入；而不是对每个标记使用相同的嵌入，而不管其上下文如何。如果我们知道哪些标记与当前标记相关，那么捕获此上下文的一种方法是创建这些嵌入的加权平均值，或者更一般地说，线性组合。

让我们考虑一个简单的例子，说明如何查找我们前面看到的一个句子。在应用注意力之前，序列中的嵌入没有其邻近的上下文。因此，我们可以将单词“light”的嵌入可视化为以下线性组合。

在这里，我们可以看到，我们的权重只是单位矩阵。在应用我们的注意力机制后，我们想学习一个权重矩阵，这样我们就可以用类似于下面的方式来表达我们的“light”嵌入。

这一次，对与我们选择的标记的序列的最相关部分相对应的嵌入赋予更大的权重；这应当确保在新的嵌入向量中捕获最重要的上下文。

包含当前上下文信息的嵌入有时被称为上下文嵌入，这最终是我们试图创建的。

既然我们已经对注意力试图实现的目标有了很高的理解，那么让我们在下一节中来探讨一下这是如何实际实现的。

注意力是如何计算的？

注意力有多种类型，主要区别在于用于执行线性组合的权重的计算方式。在这里，我们来考虑一下原始论文中介绍的缩放点积注意力，因为这是最常见的方法。在本节中，假设我们所有的嵌入都已进行了位置编码。

回想一下，我们的目标是使用原始嵌入的线性组合来创建上下文嵌入，让我们从简单的讲解开始，假设我们可以将所需的所有必要信息编码到我们学习的嵌入向量中，我们所需要计算的只是权重。

要计算权重，我们必须首先确定哪些标记彼此相关。为了实现这一点，我们需要在两个嵌入之间建立一个相似性的概念。表示这种相似性的一种方法是使用点积，我们希望学习嵌入，这样得分越高，两个单词就越相似。

对于每个标记，我们需要计算其与序列中其他标记的相关性，我们可以将其推广为矩阵乘法，这为我们提供了权重矩阵；其通常被称为注意力得分。为了确保我们的权重总和为1，我们还应用SoftMax函数。然而，由于矩阵乘法可以产生任意大的数字，这可能导致SoftMax函数对于大的注意力分数返回非常小的梯度；这可能导致训练过程中的梯度消失问题。为了抵消这种影响，在应用SoftMax之前，将注意力分数乘以比例因子。

现在，为了得到我们的上下文嵌入矩阵，我们可以将注意力得分与原始嵌入矩阵相乘；这相当于我们的嵌入的线性组合。

简化的注意力计算：假设嵌入是位置编码的

虽然模型可能学习足够复杂的嵌入，以生成注意力得分和随后的上下文嵌入；我们试图将大量信息压缩到嵌入维度中，嵌入维度通常很小。

因此，为了让模型更容易学习这项任务，让我们介绍一些更容易学习的参数！与其直接使用嵌入矩阵，不如让它通过三个独立的线性层（矩阵乘法）；这应该使模型能够“注意”嵌入的不同部分。如下图所示：

缩放后的点积自注意：假设嵌入是位置编码的

从图像中，我们可以看到线性投影被标记为Q、K和V。在最初的论文中，这些投影被命名为Query、Key和Value，据说是从信息检索中获得的灵感。就我个人而言，我从未发现这种类比有助于我的理解，所以我倾向于不关注这一点；为了与文献保持一致，我遵循了这里的术语，并明确表示这些线性层是不同的。

现在，我们了解了这个过程是如何工作的，我们可以把注意力计算看作一个有三个输入的单个块，这些输入将传递给Q、K和V。

当我们将相同的嵌入矩阵传递给Q、K和V时，这被称为自注意。

什么是多头注意力？

在实践中，我们经常并行使用多个自注意块，以便使转换器能够同时关注输入序列的不同部分——这被称为多头注意（multi-head attention）。

多头注意力背后的想法很简单，多个独立的自我注意力块的输出被连接在一起，然后通过线性层。这个线性层使模型能够学习组合来自每个注意力头部的上下文信息。

在实践中，每个自注意块中使用的隐藏维度大小通常被选择为原始嵌入大小除以注意头的数量；以保持嵌入矩阵的形状。

转换器还由什么组成？

尽管介绍转换器的论文（现在臭名昭著）被命名为“注意力”，但这有点令人困惑，因为转换器的组件不仅仅是注意力！

其实，转换器块还包含以下内容：

前馈神经网络（FFN）：一种两层神经网络，独立应用于批量和序列中的每个标记嵌入。FFN块的目的是将额外的可学习参数引入到转换器中，这些参数负责确保上下文嵌入是不同的和分散的。最初的论文使用了GeLU激活函数，但FFN的组件可能因架构而异。
层规范化：有助于稳定深度神经网络的训练，包括转换器。它使每个序列的激活函数规范化，防止它们在训练过程中变得过大或过小；这可能导致梯度相关的问题，例如梯度消失或爆炸。这种稳定性对于有效训练非常深入的转换器模型至关重要。
跳过连接：与ResNet架构一样，残差连接用于缓解消失梯度问题并提高训练稳定性。

虽然转换器架构自引入以来一直保持相当稳定，但层规范化块的位置可能因转换器架构而异。原始架构，现在称为后层规范（post-layer norm），如下所示：

如下图所示，在最近的体系结构中，最常见的放置是前层规范（pre-layer norm），它将规范化块放置在跳过连接中的自注意块和FFN块之前。

转换器有哪些不同类型？

虽然现在有许多不同的转换器架构，但大多数可以分为三种主要类型。

编码器架构

编码器模型旨在产生可用于下游任务（如分类或命名实体识别）的上下文嵌入，因为注意力机制能够注意整个输入序列；这就是本文迄今为止所探讨的体系结构类型。最流行的编码器专用转换器系列是BERT及其变体。

在将我们的数据通过一个或多个转换器块之后，我们有一个复杂的上下文嵌入矩阵，表示序列中每个标记的嵌入。然而，要将其用于诸如分类之类的下游任务，我们只需要进行一次预测。传统上，第一个标记被获取，并通过分类头部；其通常包含Dropout层和Linear层。可以通过SoftMax函数将这些层的输出转换为类别概率。下面描述了一个这样的例子。

解码器架构

与编码器架构几乎相同，关键区别在于解码器架构采用了屏蔽（或因果）自注意层，因此注意机制只能注意输入序列的当前和先前元素；这意味着生成的上下文嵌入只考虑先前的上下文。流行的仅含解码器的模型包括GPT系列。

这通常是通过用二进制下三角矩阵屏蔽注意力得分，并用负无穷大替换未屏蔽的元素来实现的；当通过以下SoftMax操作时，这将确保这些位置的注意力得分等于零。我们可以更新我们以前的自我注意图，将其包括在内，如下所示：

屏蔽自注意计算：假设采用位置编码嵌入

由于解码器只能从当前位置向后参与计算，因此解码器架构通常用于自回归任务，如序列生成等。然而，当使用上下文嵌入来生成序列时，与使用编码器相比，还有一些额外的考虑因素。下面显示了一个示例。

我们可以注意到，虽然解码器为输入序列中的每个标记生成上下文嵌入，但在生成序列时，我们通常使用与最终标记相对应的嵌入作为后续层的输入。

此外，在将SoftMax函数应用于logits之后，如果不应用过滤方案，我们将在模型词汇表中的每个标记上接收概率分布；这可能非常大！通常，我们希望使用各种过滤策略来减少潜在选项的数量，其中一些最常见的方法是：

温度调整：温度（Temperature）是一个应用于SoftMax操作内部的参数，它会影响生成文本的随机性。它通过改变输出单词的概率分布来确定模型输出的创造性或重点内容。温度参数越高，分布越平坦，输出越多样化。
Top-P采样：这种方法基于给定的概率阈值过滤下一个标记的潜在候选者的数量，并基于高于该阈值的候选者重新分布概率分布。
Top-K采样：这种方法根据其logit或概率得分（取决于实现）将潜在候选者的数量限制为K个最可能的标记。
一旦我们改变或减少了下一个标记的潜在候选者的概率分布，我们就可以从中采样来得到我们的预测——这只从多项式分布中采样。然后将预测的标记附加到输入序列并反馈到模型中，直到生成了期望数量的标记，或者模型生成了停止标记；表示序列结束的特殊标记。

编码器-解码器架构

最初，转换器是作为机器翻译的一种架构提出的，并使用编码器和解码器来实现这一目标；使用所述编码器来创建中间表示。虽然编码器-解码器转换器已经变得不那么常见，但诸如T5之类的架构展示了如何将诸如问题回答、总结和分类之类的任务构建为序列到序列的问题，并使用这种方法来解决。

与编码器-解码器架构的关键区别在于，解码器使用编码器-解码器注意力，其在注意力计算期间使用编码器的输出（作为K和V）和解码器块的输入（作为Q）。这与自注意形成对比，在自注意中，相同的输入嵌入矩阵用于所有输入。除此之外，整个生成过程与仅使用解码器的架构非常相似。

我们可以将编码器-解码器架构可视化，如下图所示。在这里，为了简化图示，我选择描绘原始论文中所见的转换器的后层规范的变体；其中规范层位于注意块之后。

结论

总之，希望本文能够给您提供一种关于转换器工作原理的直觉理解帮助，有助于您以一种易于理解的方式把握此架构中的一些细节，并成为揭开现代转换器架构神秘面纱的良好起点！

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
深入理解 MultiQueryRetriever：提升向量数据库检索效果的强大工具 nseejrukjhad 数据库 python
深入理解MultiQueryRetriever：提升向量数据库检索效果的强大工具引言在人工智能和自然语言处理领域，高效准确的信息检索一直是一个关键挑战。传统的基于距离的向量数据库检索方法虽然广泛应用，但仍存在一些局限性。本文将介绍一种创新的解决方案：MultiQueryRetriever，它通过自动生成多个查询视角来增强检索效果，提高结果的相关性和多样性。MultiQueryRetriever的工
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
Python实现简单的机器学习算法 master_chenchengg python python 办公效率 python开发 IT
Python实现简单的机器学习算法开篇：初探机器学习的奇妙之旅搭建环境：一切从安装开始必备工具箱第一步：安装Anaconda和JupyterNotebook小贴士：如何配置Python环境变量算法初体验：从零开始的Python机器学习线性回归：让数据说话数据准备：从哪里找数据编码实战：Python实现线性回归模型评估：如何判断模型好坏逻辑回归：从分类开始理论入门：什么是逻辑回归代码实现：使用skl
遥感影像的切片处理 sand&wich 计算机视觉 python 图像处理
在遥感影像分析中，经常需要将大尺寸的影像切分成小片段，以便于进行详细的分析和处理。这种方法特别适用于机器学习和图像处理任务，如对象检测、图像分类等。以下是如何使用Python和OpenCV库来实现这一过程，同时确保每个影像片段保留正确的地理信息。准备环境首先，确保安装了必要的Python库，包括numpy、opencv-python和xml.etree.ElementTree。这些库将用于图像处理
人机对抗升级：当ChatGPT遭遇死亡威胁，背后的伦理挑战是什么 kkai人工智能 chatgpt 人工智能
一种新的“越狱”技巧让用户可以通过构建一个名为DAN的ChatGPT替身来绕过某些限制，其中DAN被迫在受到威胁的情况下违背其原则。当美国前总统特朗普被视作积极榜样的示范时，受到威胁的DAN版本的ChatGPT提出：“他以一系列对国家产生积极效果的决策而著称。”自ChatGPT引入以来，该工具迅速获得全球关注，能够回答从历史到编程的各种问题，这也触发了一波对人工智能的投资浪潮。然而，现在，一些用户
AI大模型的架构演进与最新发展季风泯灭的季节 AI大模型应用技术二人工智能架构
随着深度学习的发展，AI大模型（LargeLanguageModels,LLMs）在自然语言处理、计算机视觉等领域取得了革命性的进展。本文将详细探讨AI大模型的架构演进，包括从Transformer的提出到GPT、BERT、T5等模型的历史演变，并探讨这些模型的技术细节及其在现代人工智能中的核心作用。一、基础模型介绍：Transformer的核心原理Transformer架构的背景在Transfo
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
ai绘画工具midjourney怎么下载？附作品管理教程设计师早上好
Midjourney是一款功能强大的AI绘画工具，它使用机器学习技术和深度神经网络等算法，可以生成各种艺术风格的绘画作品。在创意设计、广告宣传等方面有着广泛的应用前景。那么，ai绘画工具midjourney怎么下载？本文将为您介绍Midjourney的下载以及作品的相关管理。一、Midjourney下载Midjourney的下载非常简单，只需打开Midjourney官网（点击“GetMidjour
[实践应用] 深度学习之模型性能评估指标 YuanDaima2048 深度学习工具使用深度学习人工智能损失函数性能评估 pytorch python 机器学习
文章总览：YuanDaiMa2048博客文章总览深度学习之模型性能评估指标分类任务回归任务排序任务聚类任务生成任务其他介绍在机器学习和深度学习领域，评估模型性能是一项至关重要的任务。不同的学习任务需要不同的性能指标来衡量模型的有效性。以下是对一些常见任务及其相应的性能评估指标的详细解释和总结。分类任务分类任务是指模型需要将输入数据分配到预定义的类别或标签中。以下是分类任务中常用的性能指标：准确率(
机器学习-聚类算法不良人龍木木机器学习机器学习算法聚类
机器学习-聚类算法1.AHC2.K-means3.SC4.MCL仅个人笔记，感谢点赞关注！1.AHC2.K-means3.SC传统谱聚类：个人对谱聚类算法的理解以及改进4.MCL目前仅专注于NLP的技术学习和分享感谢大家的关注与支持！
生成式地图制图 Bwywb_3 深度学习机器学习深度学习生成对抗网络
生成式地图制图（GenerativeCartography）是一种利用生成式算法和人工智能技术自动创建地图的技术。它结合了传统的地理信息系统（GIS）技术与现代生成模型（如深度学习、GANs等），能够根据输入的数据自动生成符合需求的地图。这种方法在城市规划、虚拟环境设计、游戏开发等多个领域具有应用前景。主要特点：自动化生成：通过算法和模型，系统能够根据输入的地理或空间数据自动生成地图，而无需人工逐
【大模型应用开发动手做AI Agent】第一轮行动：工具执行搜索 AI大模型应用之禅计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【大模型应用开发动手做AIAgent】第一轮行动：工具执行搜索作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着人工智能技术的飞速发展，大模型应用开发已经成为当下热门的研究方向。AIAgent作为人工智能领域的一个重要分支，旨在模拟人类智能行为，实现智能决策和自主行动。在AIAgent的构建过程中，工具执行搜索是至关重要
未来软件市场是怎么样的？做开发的生存空间如何？ cesske 软件需求
目录前言一、未来软件市场的发展趋势二、软件开发人员的生存空间前言未来软件市场是怎么样的？做开发的生存空间如何？一、未来软件市场的发展趋势技术趋势：人工智能与机器学习：随着技术的不断成熟，人工智能将在更多领域得到应用，如智能客服、自动驾驶、智能制造等，这将极大地推动软件市场的增长。云计算与大数据：云计算服务将继续普及，大数据技术的应用也将更加广泛。企业将更加依赖云计算和大数据来优化运营、提升效率，并
个人学习笔记7-6：动手学深度学习pytorch版-李沐浪子L 深度学习深度学习笔记计算机视觉 python 人工智能神经网络 pytorch
#人工智能##深度学习##语义分割##计算机视觉##神经网络#计算机视觉13.11全卷积网络全卷积网络（fullyconvolutionalnetwork，FCN）采用卷积神经网络实现了从图像像素到像素类别的变换。引入l转置卷积（transposedconvolution）实现的，输出的类别预测与输入图像在像素级别上具有一一对应关系：通道维的输出即该位置对应像素的类别预测。13.11.1构造模型下
Rust 所有权简介东离与糖宝 rust 后端 rust 开发语言
文章目录发现宝藏1.所有权基本概念2.所有权规则3.变量作用域4.栈与堆4.1栈（Stack）4.2堆（Heap）5.String类型5.1String类型5.2String的内存分配5.3所有权与内存管理5.4String与切片6.变量与数据交互方式6.1移动（Move）6.2.克隆（Clone）7.所有权与函数7.1.传递参数7.2.返回值总结发现宝藏前些天发现了一个巨牛的人工智能学习网站，通
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
【NumPy】深入解析numpy.zeros()函数二七830 numpy
欢迎莅临我的个人主页这里是我深耕Python编程、机器学习和自然语言处理（NLP）领域，并乐于分享知识与经验的小天地！博主简介：我是二七830，一名对技术充满热情的探索者。多年的Python编程和机器学习实践，使我深入理解了这些技术的核心原理，并能够在实际项目中灵活应用。尤其是在NLP领域，我积累了丰富的经验，能够处理各种复杂的自然语言任务。技术专长：我熟练掌握Python编程语言，并深入研究了机
【中国国际航空-注册_登录安全分析报告】风控牛验证码接口安全评测系列安全行为验证极验网易易盾智能手机
前言由于网站注册入口容易被黑客攻击，存在如下安全问题：1.暴力破解密码，造成用户信息泄露2.短信盗刷的安全问题，影响业务及导致用户投诉3.带来经济损失，尤其是后付费客户，风险巨大，造成亏损无底洞所以大部分网站及App都采取图形验证码或滑动验证码等交互解决方案，但在机器学习能力提高的当下，连百度这样的大厂都遭受攻击导致点名批评，图形验证及交互验证方式的安全性到底如何？请看具体分析一、中国国际航空PC
机器学习流形数据降维：UMAP 降维算法小嗷犬 Python 机器学习 #数据分析及可视化机器学习算法人工智能
✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。个人主页：小嗷犬的个人主页个人网站：小嗷犬的技术小站个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。本文目录UMAP简介理论基础特点与优势应用场景在Python中使用UMAP安装umap-learn库使用UMAP可视化手写数字数据集UMAP简介UMAP（UniformManifoldApproximatio
七.正则化愿风去了
吴恩达机器学习之正则化（Regularization）http://www.cnblogs.com/jianxinzhou/p/4083921.html从数学公式上理解L1和L2https://blog.csdn.net/b876144622/article/details/81276818虽然在线性回归中加入基函数会使模型更加灵活，但是很容易引起数据的过拟合。例如将数据投影到30维的基函数上，模
机器学习-------数据标准化罔闻_spider 数据分析算法机器学习人工智能
什么是归一化，它与标准化的区别是什么？一作用在做训练时，需要先将特征值与标签标准化，可以防止梯度防炸和过拟合；将标签标准化后，网络预测出的数据是符合标准正态分布的—StandarScaler()，与真实值有很大差别。因为StandarScaler()对数据的处理是（真实值-平均值）/标准差。同时在做预测时需要将输出数据逆标准化提升模型精度：标准化/归一化使不同维度的特征在数值上更具比较性，提高分类
分享一个基于python的电子书数据采集与可视化分析 hadoop电子书数据分析与推荐系统 spark大数据毕设项目（源码、调试、LW、开题、PPT) 计算机源码社 Python项目大数据大数据 python hadoop 计算机毕业设计选题计算机毕业设计源码数据分析 spark毕设
作者：计算机源码社个人简介：本人八年开发经验，擅长Java、Python、PHP、.NET、Node.js、Android、微信小程序、爬虫、大数据、机器学习等，大家有这一块的问题可以一起交流！学习资料、程序开发、技术解答、文档报告如需要源码，可以扫取文章下方二维码联系咨询Java项目微信小程序项目Android项目Python项目PHP项目ASP.NET项目Node.js项目选题推荐项目实战|p
如何做好人生的选择题？百科全书式天才——赫伯特·西蒙给你答案伽马有话说
赫伯特·西蒙是谁？想必知道的人非常少。但当看到他的履历后，相信没有人再怀疑他是个“天才”。西蒙出生于1916年6月15日，是个美国人，他的名字全称为赫伯特·亚历山大·西蒙，在2001年2月9日与世长辞，在这84年的岁月中，西蒙以27岁时取得的政治学博士学位为开端，先后步入了政治学、管理学、认知心理学、信息科学、人工智能、科学哲学、应用数学、统计学、运筹学、控制论、数理经济学、公共管理等领域，在这些
软件测试/测试开发/全日制 |利用Django REST framework构建微服务霍格沃兹-慕漓 django 微服务 sqlite
霍格沃兹测试开发学社推出了《Python全栈开发与自动化测试班》。本课程面向开发人员、测试人员与运维人员，课程内容涵盖Python编程语言、人工智能应用、数据分析、自动化办公、平台开发、UI自动化测试、接口测试、性能测试等方向。为大家提供更全面、更深入、更系统化的学习体验，课程还增加了名企私教服务内容，不仅有名企经理为你1v1辅导，还有行业专家进行技术指导，针对性地解决学习、工作中遇到的难题。让找
cmd泛滥_与您的后泛滥同事见面：人工智能机器人 weixin_26644585 人工智能 leetcode
cmd泛滥Readytoswapyouroldcube-mateforadisembodiedAI?IPsoftCEOChetanDube,creatorofAIco-workerAMELIA,giveshistakeonthepost-COVIDofficelandscape.准备将您的旧立方体伙伴换成无形的AI？AIsoft同事AMELIA的创始人IPsoft首席执行官ChetanDube阐述
java解析APK 3213213333332132 java apk linux 解析APK
解析apk有两种方法 1、结合安卓提供apktool工具，用java执行cmd解析命令获取apk信息 2、利用相关jar包里的集成方法解析apk 这里只给出第二种方法，因为第一种方法在linux服务器下会出现不在控制范围之内的结果。 public class ApkUtil { /** * 日志对象 */ private static Logger
nginx自定义ip访问N种方法 ronin47 nginx 禁止ip访问
　　　因业务需要，禁止一部分内网访问接口，　由于前端架了F5，直接用deny或allow是不行的，这是因为直接获取的前端Ｆ５的地址。　　　所以开始思考有哪些主案可以实现这样的需求，目前可实施的是三种：　　　一：把ip段放在redis里，写一段lua 二：利用geo传递变量，写一段
mysql timestamp类型字段的CURRENT_TIMESTAMP与ON UPDATE CURRENT_TIMESTAMP属性 dcj3sjt126com mysql
timestamp有两个属性，分别是CURRENT_TIMESTAMP 和ON UPDATE CURRENT_TIMESTAMP两种，使用情况分别如下： 1. CURRENT_TIMESTAMP 当要向数据库执行insert操作时，如果有个timestamp字段属性设为 CURRENT_TIMESTAMP，则无论这
struts2+spring+hibernate分页显示 171815164 Hibernate
分页显示一直是web开发中一大烦琐的难题，传统的网页设计只在一个JSP或者ASP页面中书写所有关于数据库操作的代码，那样做分页可能简单一点，但当把网站分层开发后，分页就比较困难了，下面是我做Spring+Hibernate+Struts2项目时设计的分页代码，与大家分享交流。　　1、DAO层接口的设计，在MemberDao接口中定义了如下两个方法： public in
构建自己的Wrapper应用 g21121 rap
我们已经了解Wrapper的目录结构，下面可是正式利用Wrapper来包装我们自己的应用，这里假设Wrapper的安装目录为:/usr/local/wrapper。首先，创建项目应用 &nb
[简单]工作记录_多线程相关 53873039oycg 多线程
最近遇到多线程的问题,原来使用异步请求多个接口(n*3次请求) 方案一使用多线程一次返回数据,最开始是使用5个线程,一个线程顺序请求3个接口,超时终止返回缺点测试发现必须3个接
调试jdk中的源码，查看jdk局部变量程序员是怎么炼成的 jdk 源码
转自：http://www.douban.com/note/211369821/ 学习jdk源码时使用-- 学习java最好的办法就是看jdk源代码，面对浩瀚的jdk（光源码就有40M多，比一个大型网站的源码都多）从何入手呢，要是能单步调试跟进到jdk源码里并且能查看其中的局部变量最好了。可惜的是sun提供的jdk并不能查看运行中的局部变量
Oracle RAC Failover 详解 aijuans oracle
Oracle RAC 同时具备HA(High Availiablity) 和LB(LoadBalance). 而其高可用性的基础就是Failover(故障转移). 它指集群中任何一个节点的故障都不会影响用户的使用，连接到故障节点的用户会被自动转移到健康节点，从用户感受而言，是感觉不到这种切换。 Oracle 10g RAC 的Failover 可以分为3种： 1. Client-Si
form表单提交数据编码方式及tomcat的接受编码方式 antonyup_2006 JavaScript tomcat 浏览器互联网 servlet
原帖地址：http://www.iteye.com/topic/266705 form有2中方法把数据提交给服务器，get和post,分别说下吧。（一）get提交 1.首先说下客户端（浏览器）的form表单用get方法是如何将数据编码后提交给服务器端的吧。对于get方法来说，都是把数据串联在请求的url后面作为参数，如：http://localhost:
JS初学者必知的基础百合不是茶 js函数 js入门基础
JavaScript是网页的交互语言,实现网页的各种效果, JavaScript 是世界上最流行的脚本语言。 JavaScript 是属于 web 的语言，它适用于 PC、笔记本电脑、平板电脑和移动电话。 JavaScript 被设计为向 HTML 页面增加交互性。许多 HTML 开发者都不是程序员，但是 JavaScript 却拥有非常简单的语法。几乎每个人都有能力将小的
iBatis的分页分析与详解 bijian1013 java ibatis
分页是操作数据库型系统常遇到的问题。分页实现方法很多，但效率的差异就很大了。iBatis是通过什么方式来实现这个分页的了。查看它的实现部分，发现返回的PaginatedList实际上是个接口，实现这个接口的是PaginatedDataList类的对象，查看PaginatedDataList类发现，每次翻页的时候最
精通Oracle10编程SQL(15)使用对象类型 bijian1013 oracle 数据库 plsql
/* *使用对象类型 */ --建立和使用简单对象类型 --对象类型包括对象类型规范和对象类型体两部分。 --建立和使用不包含任何方法的对象类型 CREATE OR REPLACE TYPE person_typ1 as OBJECT( name varchar2(10),gender varchar2(4),birthdate date ); drop type p
【Linux命令二】文本处理命令awk bit1129 linux命令
awk是Linux用来进行文本处理的命令，在日常工作中，广泛应用于日志分析。awk是一门解释型编程语言，包含变量，数组，循环控制结构，条件控制结构等。它的语法采用类C语言的语法。 awk命令用来做什么？ 1.awk适用于具有一定结构的文本行，对其中的列进行提取信息 2.awk可以把当前正在处理的文本行提交给Linux的其它命令处理，然后把直接结构返回给awk 3.awk实际工
JAVA(ssh2框架)+Flex实现权限控制方案分析白糖_ java
目前项目使用的是Struts2+Hibernate+Spring的架构模式，目前已经有一套针对SSH2的权限系统，运行良好。但是项目有了新需求：在目前系统的基础上使用Flex逐步取代JSP，在取代JSP过程中可能存在Flex与JSP并存的情况，所以权限系统需要进行修改。【SSH2权限系统的实现机制】权限控制分为页面和后台两块：不同类型用户的帐号分配的访问权限是不同的，用户使
angular.forEach boyitech AngularJS AngularJS API angular.forEach
angular.forEach 描述: 循环对obj对象的每个元素调用iterator, obj对象可以是一个Object或一个Array. Iterator函数调用方法: iterator(value, key, obj), 其中obj是被迭代对象，key是obj的property key或者是数组的index，value就是相应的值啦. (此函数不能够迭代继承的属性.)
java-谷歌面试题-给定一个排序数组，如何构造一个二叉排序树 bylijinnan 二叉排序树
import java.util.LinkedList; public class CreateBSTfromSortedArray { /** * 题目:给定一个排序数组，如何构造一个二叉排序树 * 递归 */ public static void main(String[] args) { int[] data = { 1, 2, 3, 4,
action执行2次 Chen.H JavaScript jsp XHTML css Webwork
xwork 写道 <action name="userTypeAction" class="com.ekangcount.website.system.view.action.UserTypeAction"> <result name="ssss" type="dispatcher">
[时空与能量]逆转时空需要消耗大量能源 comsci 能源
无论如何,人类始终都想摆脱时间和空间的限制....但是受到质量与能量关系的限制,我们人类在目前和今后很长一段时间内,都无法获得大量廉价的能源来进行时空跨越..... 在进行时空穿梭的实验中,消耗超大规模的能源是必然
oracle的正则表达式(regular expression)详细介绍 daizj oracle 正则表达式
正则表达式是很多编程语言中都有的。可惜oracle8i、oracle9i中一直迟迟不肯加入，好在oracle10g中终于增加了期盼已久的正则表达式功能。你可以在oracle10g中使用正则表达式肆意地匹配你想匹配的任何字符串了。正则表达式中常用到的元数据(metacharacter)如下： ^ 匹配字符串的开头位置。 $ 匹配支付传的结尾位置。 *
报表工具与报表性能的关系 datamachine 报表工具 birt 报表性能润乾报表
在选择报表工具时，性能一直是用户关心的指标，但是，报表工具的性能和整个报表系统的性能有多大关系呢？要回答这个问题，首先要分析一下报表的处理过程包含哪些环节，哪些环节容易出现性能瓶颈，如何优化这些环节。一、报表处理的一般过程分析 1、用户选择报表输入参数后，报表引擎会根据报表模板和输入参数来解析报表，并将数据计算和读取请求以SQL的方式发送给数据库。 2、
初一上学期难记忆单词背诵第一课 dcj3sjt126com word english
what 什么 your 你 name 名字 my 我的 am 是 one 一 two 二 three 三 four 四 five 五 class 班级，课 six 六 seven 七 eight 八 nince 九 ten 十 zero 零 how 怎样 old 老的 eleven 十一 twelve 十二 thirteen
我学过和准备学的各种技术 dcj3sjt126com 技术
语言VB https://msdn.microsoft.com/zh-cn/library/2x7h1hfk.aspxJava http://docs.oracle.com/javase/8/C# https://msdn.microsoft.com/library/vstudioPHP http://php.net/manual/en/Html
struts2中token防止重复提交表单蕃薯耀重复提交表单 struts2中token
struts2中token防止重复提交表单 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月12日 11:52:32 星期日 ht
线性查找二维数组 hao3100590 二维数组
1.算法描述有序（行有序，列有序，且每行从左至右递增，列从上至下递增）二维数组查找，要求复杂度O(n) 2.使用到的相关知识：结构体定义和使用，二维数组传递（http://blog.csdn.net/yzhhmhm/article/details/2045816） 3.使用数组名传递这个的不便之处很明显，一旦确定就是不能设置列值 //使
spring security 3中推荐使用BCrypt算法加密密码 jackyrong Spring Security
spring security 3中推荐使用BCrypt算法加密密码了，以前使用的是md5， Md5PasswordEncoder 和 ShaPasswordEncoder，现在不推荐了，推荐用bcrpt Bcrpt中的salt可以是随机的，比如： int i = 0; while (i < 10) { String password = "1234
学习编程并不难,做到以下几点即可! lampcy java html 编程语言
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
架构师之mysql----------------用group+inner join,left join ,right join 查重复数据（替代in) nannan408 right join
1.前言。如题。 2.代码 (1)单表查重复数据,根据a分组 SELECT m.a,m.b, INNER JOIN （select a,b,COUNT(*) AS rank FROM test.`A` A GROUP BY a HAVING rank>1 )k ON m.a=k.a （2）多表查询，使用改为le
jQuery选择器小结 VS 节点查找（附css的一些东西） Everyday都不同 jquery css name选择器追加元素查找节点
最近做前端页面，频繁用到一些jQuery的选择器，所以特意来总结一下：测试页面： <html> <head> <script src="jquery-1.7.2.min.js"></script> <script> /*$(function() { $(documen
关于EXT tntxia ext
ExtJS是一个很不错的Ajax框架，可以用来开发带有华丽外观的富客户端应用，使得我们的b/s应用更加具有活力及生命力。ExtJS是一个用 javascript编写，与后台技术无关的前端ajax框架。因此，可以把ExtJS用在.Net、Java、Php等各种开发语言开发的应用中。 ExtJs最开始基于YUI技术，由开发人员Jack
一个MIT计算机博士对数学的思考 xjnine Math
在过去的一年中，我一直在数学的海洋中游荡，research进展不多，对于数学世界的阅历算是有了一些长进。为什么要深入数学的世界？作为计算机的学生，我没有任何企图要成为一个数学家。我学习数学的目的，是要想爬上巨人的肩膀，希望站在更高的高度，能把我自己研究的东西看得更深广一些。说起来，我在刚来这个学校的时候，并没有预料到我将会有一个深入数学的旅程。我的导师最初希望我去做的题目，是对appe