11好好学习，天天向上

论文笔记：HIE-SQL:History Information Enhanced Network for Context-Dependent Text-to-SQL Semantic Parsing

论文笔记：HIE-SQL: History Information Enhanced Network for Context-Dependent Text-to-SQL Semantic Parsing

论文笔记：HIE-SQL: History Information Enhanced Network for Context-Dependent Text-to-SQL Semantic Parsing
导语
摘要
1 简介
2 相关工作
3 HIE-SQL
- 3.1 预备知识
- 3.2 Multimodal Encoder
- 3.3 SQLBERT
- 3.4 HIE层
- 3.5 Decoder
- 3.6 Regularization Strategy
4 实验
- 4.1 实验设置
- 4.2 实验结果
- 4.3 Ablation Study
- 4.4 Case Study
5 总结

导语

论文的核心亮点如下：

提出了SQLBERT用于编码双模态的NL语句和SQL表示
提出将预测时的schema linking时加入上一句预测的SQL语句，称为History Information Enhanced（HIE）
使用R-Drop提升了一些性能

会议：ACL 2022 Findings
地址：https://openreview.net/pdf?id=fX8TXF-LD21

摘要

近年来，上下文相关（Context Dependent）的Text-to-SQL语义解析在交互过程中将自然语言转换为SQL，引起了人们的广泛关注。以前的工作利用了来自交互历史语句或之前预测的SQL查询的上下文依赖信息，但由于自然语言和逻辑形式SQL之间的不匹配，无法同时利用这两种信息。在这项工作中，我们提出了一个历史信息增强的Text-to-SQL模型(HIE-SQL)，以利用来自历史语句和最后一次预测SQL查询的上下文依赖信息。针对这种不匹配，我们将自然语言和SQL作为两种模态，提出了一个双模态预训练模型来弥补它们之间的差距。此外，我们还设计了一个模式链接图来增强语句和SQL查询与数据库模式的连接。我们展示了历史信息增强方法显著提高了HIE-SQL的性能，它在写入时在两个上下文相关的Text-to-SQL基准测试SparC和CoSQL数据集上实现了最新的结果。

1 简介

对话形式的数据库查询是Text-to-SQL语义解析的一个新的研究热点，并使我们在工业应用中受益。以前的大多数工作都集中在上下文无关的Text-to-SQL任务上，并提出了许多具有竞争力的模型。一些模型在上下文相关的任务上通过简单地将交互历史信息添加到输入的最后获得了令人惊讶的表现。尤其是PICARD (Scholak等人，2021年)在Spider和CoSQL两种测试中都实现了最先进的性能。然而，任何事物都有两面性。这意味着在上下文相关的Text-to-SQL语义解析中对上下文信息的探索还不够。

与上下文无关的text-toSQL语义分析相比，上下文相关的text-toSQL语义分析更具挑战性，因为话语中的各种依赖类型使模型容易出现解析错误。R2SQL认为，两个相邻的话语之间的不同上下文依赖关系需要模型谨慎地在话语和数据库模式之间建立动态连接。然而，语境信息并不仅仅来自上一句话语。如图1所示，对于 $S_3$ 的预测，其依赖于用户话语（即Question）中的"the name of the teachers and the courses"。对于长距离依赖，一个可行的建议是从先前预测的SQL查询中继承上下文信息。但是，由于自然语言和逻辑形式的SQL之间的不匹配，利用先前预测的查询并不是一件容易的事情。正如Liu等人(2020)得出的结论，对上一个预测的SQL查询和话语进行粗略编码是不可能的，而在对13种现有上下文建模方法的评估中，将交互历史话语和当前话语连接起来似乎具有惊人的竞争性。

在本文中，我们提出了一个历史信息增强网络，以充分利用历史交互语句和以前的预测SQL查询。我们首先将逻辑形式的SQL查询作为使用自然语言的另一种形式。我们提出了SQLBERT，这是一个用于SQL和自然语言的双模预训练模型，它能够捕获语义连接并弥合SQL和自然语言之间的差距。它生成通用表示，并支持上下文相关的Text-to-SQL语义解析。

此外，我们提出了一个历史信息增强的模式链接图来表示当前话语、交互历史话语、最后一次预测查询和相应的数据库模式之间的关系。考虑到在互动中来回转换话题是很奇怪的，我们假设长期依赖是连续的。例如， $S_3$ 依赖于 $U_1$ 意味着在图1中 $S_2$ 也依赖于 $U_1$ 。在这种情况下，我们可以利用上次预测查询的长期依赖性。因此，与之前仅包含语句和数据库模式的模式链接图不同，上一个预测查询参与了我们的图。此外，我们在图式连接图中区分了当前话语和互动历史话语。我们使用相对自我注意机制对图式链接关系进行编码。

在我们的实验中，提出的SQLBERT方法和历史信息增强的模式链接大大提高了我们的模型的性能。在撰写本文时，我们的模型在两个大型跨域上下文相关的text-to-SQL排行榜上都排名第一，SparC和CoSQL。具体来说，我们的模型在SparC上的问题匹配准确率为64:6%，交互匹配准确率为42:9%，在CoSQL上的问题匹配准确率为53:9%，交互匹配准确率为24:6%。

2 相关工作

Text-to-SQL的语义解析是一个从自然语言到逻辑语言的语义解析研究过程。近年来，与上下文无关的Text-to-SQL语义分析得到了广泛的研究。Spider是一个著名的数据集，用于复杂的、跨域上下文独立的Text-to-SQL任务。一些工作应用图神经网络对数据库模式进行编码。Xu等人(2021)成功地将深度转换器应用于上下文无关的text-to-SQL任务。Yu等人(2018a)使用基于树的解码器来匹配SQL语法。Rubin和Berant(2021)采用自底向上的方法改进了基于树的解码器。Scholak等人(2021)通过精心设计的限制规则改进基于序列的解码器。Guo等人(2019)和Gan等人(2021)提出了SQL中间表示，以弥合自然语言和SQL之间的差距。Lei等人(2020)研究了模式链接在文本到sql语义解析中的作用。Wang等人(2020)提出了一个统一的框架来捕捉模式链接。Lin等人(2020)将模式链接表示为一个标记序列。Cao等人(2021)通过利用模式链接图及其对应的线图进一步集成非局部和局部特征。此外，许多以前的工作的重点是训练预模型的上下文无关的Text-to-SQL语义解析。

随着上下文相关的Text-to-SQL语义分析越来越受到重视，现有的研究工作主要集中在上下文相关的Text-to-SQL语义分析上。SparC和CoSQL数据集是专门为该任务提出的。EditSQL和IST-SQL专注于利用上一个预测查询的优势来预测当前查询。EditSQL试图从上一个预测查询中复制重叠标记，而IST-SQL提出了一种交互状态跟踪方法来对来自最后一个预测查询的信息进行编码。IGSQL和R2SQL通过上下文感知的动态图利用了当前话语、交互历史话语和数据库模式之间的上下文信息。值得注意的是，R2SQL通过将模式图与交互话语中的标记连接起来来模拟信息。Yu等人(2021b)创造性地提出了一个上下文感知的预训练语言模型。然而，对于上下文相关的Text-toSQL任务，充分利用交互历史语句和预测查询的问题仍然存在。

3 HIE-SQL

首先，我们正式定义多轮对话Text-to-SQL的语义解析问题。在本节的其余部分，我们将详细介绍历史信息增强的Text-to-SQL模型(HIE-SQL)的体系结构。

3.1 预备知识

任务定义 给出用户当前的Question语句 $u_{\tau}$ 、交互历史 $h=[u_1, u_2, \cdots, u_{{\tau}-1}]$ 和数据库schema $D = < T, C >$ ，我们的任务目标是生成当前轮次对应的SQL语句 $s_{\tau}$

模型架构 图2展示了HIE-SQL的Encoder-decoder框架，我们将介绍以下四个模块：

Multimodal Encoder，以多模态方式编码SQL查询和自然语言上下文
SQLBERT，一个用于SQL和自然语言的双模态预训练编码器
HIE-Layers，编码了语言模型输出的所有元素之间预定义的模式链接关系
Decoder，生成SQL查询作为抽象语法树。

3.2 Multimodal Encoder

由于SQL和自然语言之间存在巨大的语法结构差异，使用单一语言模型同时对两种语言进行编码增加了训练模型的难度和成本。受Tsimpoukelli等人为了解决多模态问题的启发，我们构建了一个额外的预训练编码器，名为SQLBERT(我们将在下一节详细介绍它)，以预编码SQL查询。然后，我们学习一个参数 $W\in R^{N\times M}$ 来将N维的SQL语句的embedding映射到语言模型的M维的token嵌入空间：

其中， $f(\cdot)$ 是SQLBERT最后一层的隐层状态。

我们按 $x=([\mathrm{CLS}],{U},[\mathrm{CLS}],S,[\mathrm{SEP}],T,[\mathrm{SEP}],C)$ 的格式输入给HIE-SQL。

通过语言模型的嵌入层，将x中所有特殊的分隔符标记和语言词标记转换为词嵌入。收集自然语言和SQL的嵌入，我们将它们放到语言模型中的self-attention块中。在训练阶段，我们直接将上一轮的gold SQL查询作为输入SQL查询，在第一轮时将S设为空。在推理阶段，我们在最后一轮采用了由HIE-SQL生成的SQL查询。

3.3 SQLBERT

如上所述，我们将SQL查询视为另一种模式，它可以提供上一轮SQL查询的信息作为模型的参考。因此，我们需要一个编码器来提取SQL查询的表示。

模型架构 考虑到多模态预训练模型的成功，例如语言-图像的ViLBERT和自然语言和编程语言的CodeBERT，我们提出了一个用于自然语言和SQL的双模态预训练模型SQLBERT。我们使用与RoBERTa相同的模型架构开发SQLBERT。参数总数为125M。

输入格式 如图3所示的训练方法，我们设置了与CodeBERT相同的输入。为了减少训练的难度，解决自然语言和模式之间的不一致，我们在SQL查询和问题的连接中附加了与问题相关的数据库模式。我们将整个输入序列表示为
$x=(\left[\mathrm{CLS}\right],s_{1},s_{2},...s_{n},\left[S\mathrm{EP}\right],q_{1},q_{2},...q_{m},\left[S\mathrm{EP}\right], t_{1}\ :\ c_{11},c_{12},\ldots,\ [\,S\mathrm{EP}\,]\;,t_{2}\ :\ c_{21},\ldots,\,[\,\mathrm{SEP}\,]\;,\ldots)$
其中s、q、t和c分别是SQL查询、问题、表和列的token表示。

训练目标 SQLBERT的主要训练目标是遮罩语言建模(MLM)。值得注意的是，我们只mask SQL查询的标记，因为我们只需要SQLBERT来在下游任务中对SQL查询进行编码。具体来说，我们利用了一个特殊的目标引用span mask(Sun et al.， 2019)，在SQL子句中采样除保留词(如SELECT、FROM、WHERE)外的15%独立span，旨在避免泄漏答案，帮助SQLBERT更好地学习SQL的信息结构。在训练阶段，我们采用动态mask策略，随机打乱原模式中表和列的顺序。我们将span mask预测损失描述为

θ代表模型参数， $s_k^{mask}$ 是SQL中被mask掉的span， $s^{/mask}$ 是未掩码部分。

训练数据 与SCoRe使用多种开源的text-to-SQL数据集(WIKITABLES、WikiSQL、Spider、SparC和CoSQL)和数据合成方法来获得大量的预训练数据不同，我们只使用包括Spider、SparC和CoSQL在内的数据集来训练SQLBERT。对于每个示例，我们只使用其问题、SQL查询和相应的数据库模式。至于SparC和CoSQL，这是一个上下文依赖的版本，我们只是将当前话语与历史话语连接起来，构建问题输入。训练数据集的大小为34175。

3.4 HIE层

Schema-Linking Graph 为了显式的编码复杂的数据库schema之间的关系。我们将其转换为一个有向图 ${\mathcal{G}}\ =\ \langle\mathcal{V},\mathcal{E}\rangle$ ，其中 ${\mathcal{V}}=C\cup T$ ， $\mathcal{E}\rangle$ 表示节点之间的预先连边关系，如主键-外键关系。此外，我们还考虑了在当前语句、交互历史语句和上一次预测SQL查询的上下文中与模式的不可见链接。具体来说，我们定义了上下文相关的模式链接图 ${G}_{c}=\langle\nu_{c},\xi_{c}\rangle\,$ 其中, ${\mathcal V}_{c}=C\cup T\cup U\cup H\cup S$ ， ${\mathcal{E}}_{c}={\mathcal{E}}\cup{\mathcal{E}}_{U\leftrightarrow D}\cup{\mathcal{E}}_{H\leftrightarrow D}\cup{\mathcal{E}}_{S\leftrightarrow D}$ 。表1列出了其他的关联边。在图4中，我们展示了提议的模式链接图的一个示例。

Graph Encoding RAT-SQL展示了一种有效的编码token-level的图关系的方式。在计算Attention时，添加relation到其中，即

HIE-Layers由8个Transformer层组成，其自我注意模块如上所述。特别地，我们对上面定义的每种类型的边初始化一个学习的嵌入。对于每个输入样本，我们建立一个关系矩阵 $\textstyle{R}\,\subseteq\,(L\times L)$ ，其中L是输入标记的长度。R(i;j)表示第i个和第j个输入标记之间的关系类型。在计算相对注意时，我们设 $r_{i j}^{K}=r_{i j}^{V}=R_{e}^{(i,j)}$ ，其中 $R_{e}^{(i,j)}$ 是 $R^{(i,j)}$ 的对应嵌入。

3.5 Decoder

为了构建HIE-SQL的解码器，我们应用了Wang等人提出的方法，通过使用LSTM输出解码器动作序列，以深度优先遍历顺序生成SQL作为抽象语法树。

3.6 Regularization Strategy

我们引入了R-Drop，一种简单的正则化策略，以防止模型的过拟合。具体来说，我们将每个输入数据 $x_i$ 输入到我们的模型中，遍历两次，损失函数如下：

其中 $KaTeX parse error: Undefined control sequence: \cal at position 8: -l o g{\̲c̲a̲l̲ ̲P}_{1}(y_{i}|x_…$ 、 $KaTeX parse error: Undefined control sequence: \cal at position 8: -l o g{\̲c̲a̲l̲ ̲P}_{2}(y_{i}|x_…$ 为输入 $x_i$ 在所有解码器步骤的两个输出分布， ${{L}}_{N L L}^{i}$ 为解码器动作的负对数似然学习目标， ${{L}}_{KL}^{i}$ 为这两个输出分布之间的双向Kullback-Leibler (KL)散度。

4 实验

4.1 实验设置

模型的权重由GRAPPA初始化。在SParC和CoSQL上进行评测，指标为QM和IM。

4.2 实验结果

实验结果如下表所示，

在不同轮次表现对比如下：

4.3 Ablation Study

作者首先验证了去掉各个部分的表现，

以及使用R-Drop的有效性。

4.4 Case Study

这里与RAT-SQL进行了对比。

5 总结

我们提出了HIE-SQL，这是一种历史信息增强的上下文依赖的文本到SQL模型，它的目标是从交互历史语句和上一次预测的SQL查询中显式地捕获上下文依赖。在提出的双模预训练模型的帮助下，尽管自然语言和逻辑形式的SQL不匹配，但SQLBERT、HIE-SQL在语句和预测SQL之间架起了桥梁。此外，我们还引入了一种模式链接的方法来增强语句、SQL查询和数据库模式之间的连接。

总之，HIE-SQL在与上下文相关的Text-toSQL任务上实现了一致的改进，特别是在交互匹配度量方面。HIE-SQL在两个著名的上下文相关的Text-to-SQL数据集SparC和CoSQL上实现了最优的结果。

工业大模型应用报告：新机遇、挑战与未来展望花生糖@ AIGC学习资料库大模型人工智能应用扩展屏应用开发 AI 机器学习
大模型在工业智能化发展中的新机遇、挑战与展望。以下是报告的核心内容概述：大模型为工业智能化发展带来新机遇大模型开启人工智能应用新时代，推动技术创新和应用。大模型有望成为驱动工业智能化的引擎，提高研发效率、拓展生产制造智能化应用边界、提升经营管理水平。大模型应用落地需要深度适配工业场景，解决行业知识和企业特定环境的理解问题。大模型和小模型在工业领域将长期并存小模型应用呈现倒U型分布，主要集中在生产制
AI时代的弯道超车之第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳 Hebron_Deb AI时代-弯道超车-逆袭人生人工智能
在这个AI重塑世界的时代，你还在原地观望吗？是时候弯道超车，抢占先机了！李尚龙倾力打造——《AI时代的弯道超车：用人工智能逆袭人生》专栏，带你系统掌握AI知识，从入门到实战，全方位提升认知与竞争力！内容亮点：AI基础+核心技术讲解职场赋能+创业路径揭秘打破信息差+预测行业未来第十七章：黄仁勋：坚持一件事，哪怕坐足冷板凳我们终于来到了第十七章，也是这本人物传记中该领域的最后一章。前面我们讲到了李飞飞
AI+Python赋能！长时序植被遥感动态分析全攻略：从物候提取到生态评估梦想的初衷~ 土壤植被遥感人工智能遥感植被土壤
在遥感技术与人工智能深度融合的2025年，AI大模型正重塑长时序植被遥感数据分析范式。从Landsat/Sentinel卫星数据的智能化去云处理，到MODIS植被产品的AI辅助质量控制，以ChatGPT、DeepSeeK为代表的大模型技术已成为提升遥感数据处理效率与精度的核心工具——尤其在长时序植被动态监测、物候期精准提取、时空变异归因分析及生态环境质量评估等领域，展现出传统方法难以企及的技术优势
认知革命牧羊少年的时间之旅
看完人类简史后产生了一个想法，人类经过几万年的演化从采集时代，农业社会，再到工业革命和最近的科技革命，每一次的演变升级都是对传统认知的一次革新。但是我们现在的科技发展是如此的迅速，但是认知的进步却非常缓慢。克隆人，基因设计，人工智能，生化科技，量子计算等很多领域都是传统文化所无法理解和接受的，但是这些却依然有条不紊在进行中。所以人类目前急需一次认知的革命才能追上科技的脚步，不然一定会造成认知和现实
天文图像处理：星系分类与天体定位 xcLeigh 计算机视觉CV 图像处理分类人工智能 AI 计算机视觉
天文图像处理：星系分类与天体定位一、前言二、天文图像处理基础2.1天文图像的获取2.2天文图像的格式2.3天文图像处理的基本流程三、天文图像预处理3.1去噪处理3.2平场校正3.3偏置校正四、星系分类4.1星系的分类体系4.2基于特征提取的星系分类方法4.3基于深度学习的星系分类方法五、天体定位5.1天体坐标系统5.2基于星图匹配的天体定位方法5.3基于深度学习的天体定位方法六、总结与展望致读者一
深度学习——CNN（3）飘涯
前言：前面介绍了最基本的Lenet，下面介绍几种其他的网络结构CNN-AlexNet网络结构如下图：从图中可以看出，采用双gpu训练增加LRN归一化层：本质上，这个层也是为了防止激活函数的饱和的。采用dropout防止过拟合基于AlexNet进行微调，诞生了ZF-netCNN-GoogleNetGoogLeNet借鉴了NIN的特性，在原先的卷积过程中附加了11的卷积核加上ReLU激活。这不仅仅提升
AI 人工智能与 Copilot 的融合发展策略 AI天才研究院 AI人工智能与大数据人工智能 copilot ai
AI人工智能与Copilot的融合发展策略关键词：人工智能、Copilot、代码生成、人机协作、机器学习、自然语言处理、软件开发摘要：本文探讨了人工智能与Copilot技术的融合发展策略。我们将从技术原理、实现方法、应用场景等多个维度深入分析，提出一套完整的融合框架和发展路径。文章首先介绍背景和核心概念，然后详细讲解关键技术，包括自然语言处理、代码生成算法等，接着通过实际案例展示应用效果，最后讨论
AI 人工智能与 Copilot 碰撞出的火花 AI天才研究院 AI大模型企业级应用开发实战人工智能 copilot ai
AI人工智能与Copilot碰撞出的火花关键词：AI人工智能、Copilot、代码辅助、智能编程、人机协作、软件开发、技术创新摘要：本文深入探讨了AI人工智能与Copilot碰撞所产生的一系列效应。首先介绍了相关背景，包括目的、预期读者、文档结构和术语表。接着阐述了核心概念与联系，展示了其原理和架构的示意图及流程图。详细讲解了核心算法原理和具体操作步骤，并通过Python代码进行说明。同时给出了数
微算法科技技术突破：用于前馈神经网络的量子算法技术助力神经网络变革 MicroTech2025 量子计算算法神经网络
随着量子计算和机器学习的迅猛发展，企业界正逐步迈向融合这两大领域的新时代。在这一背景下，微算法科技（NASDAQ:MLGO）成功研发出一套用于前馈神经网络的量子算法，突破了传统神经网络在训练和评估中的性能瓶颈。这一创新性的量子算法以经典的前馈和反向传播算法为基础，借助量子计算的强大算力，极大提升了网络训练和评估效率，并带来了对过拟合的天然抗性。前馈神经网络是深度学习的核心架构，广泛应用于图像分类、
微算法科技研究量子视觉计算，利用量子力学原理提升传统计算机视觉任务的性能
计算机视觉，作为人工智能领域的一个重要分支，致力于模拟人类视觉系统对图像或视频等视觉数据的理解与分析能力。它涵盖了图像识别、目标检测、图像分割等一系列复杂任务，广泛应用于自动驾驶、医疗影像分析、安防监控等多个领域。然而，随着数据规模的不断膨胀和任务复杂度的日益提升，传统计算机视觉算法在处理大规模、高维度数据时遇到了性能瓶颈。微算法科技(NASDAQ：MLGO)研究量子视觉计算，探索量子计算与经典卷
vLLM快速入门：开启高效推理与部署之旅
在如今这个人工智能飞速发展的时代，语言模型的应用已经深入到我们生活的方方面面，从智能聊天机器人到文本生成工具，都离不开强大的语言模型技术支持。而vLLM作为一个专注于高效推理和部署的开源项目，正在为研究人员和开发人员提供一种全新的解决方案，让语言模型的使用变得更加便捷、高效。初识vLLM：背景与意义vLLM（VeryLargeLanguageModelInference）是一个专注于大型语言模型推
深入解析 vLLM 分布式推理与部署策略
在当今人工智能快速发展的时代，大型语言模型（LLM）的推理和部署面临着诸多挑战，尤其是当模型规模日益庞大时，如何高效地利用硬件资源成为关键问题。vLLM作为一种强大的工具，为分布式推理和部署提供了多种策略，本文将详细探讨其相关技术和应用场景，希望能对您提供有价值的参考。分布式推理策略的选择在开始分布式推理和部署之前，明确何时采用分布式推理以及可选的策略至关重要。1.单GPU推理：如果模型能够在单个
英伟达Triton 推理服务详解 leo0308 基础知识机器人 Triton 人工智能
1.TritonInferenceServer简介TritonInferenceServer（简称Triton，原名NVIDIATensorRTInferenceServer）是英伟达推出的一个开源、高性能的推理服务器，专为AI模型的部署和推理服务而设计。它支持多种深度学习框架和硬件平台，能够帮助开发者和企业高效地将AI模型部署到生产环境中。Triton主要用于模型推理服务化，即将训练好的模型通过
Java NLP炼金术：从词袋到深度学习，构建AI时代的语言魔方墨夶 Java学习资料人工智能 java 自然语言处理
一、JavaNLP的“三剑客”：框架与工具链1.1ApacheOpenNLP：传统NLP的“瑞士军刀”目标：用词袋模型实现文本分类与实体识别代码实战：文档分类器的“炼成术”//OpenNLP文档分类器（基于词袋模型）importopennlp.tools.doccat.*;importopennlp.tools.util.*;publicclassDocumentClassifier{//训练模型
高效批量单词翻译工具的设计与应用
本文还有配套的精品资源，点击获取简介：在信息技术飞速发展的今天，批量单词翻译工具通过计算机的数据处理能力，大大提高了语言学习和文字处理的效率。用户通过简单输入单词列表到一个文本文件，并运行翻译程序，即可获得翻译结果并保存至指定文件。该工具集成了内置或外部翻译引擎，利用自然语言处理技术实现快速准确的翻译，并可能提供词性识别等附加功能。尽管机器翻译无法完全取代人工校对，但它为用户提供了一种高效的翻译解
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
深度学习模型表征提取全解析 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 深度学习人工智能 python embedding 语言模型
模型内部进行表征提取的方法在自然语言处理（NLP）中，“表征（Representation）”指将文本（词、短语、句子、文档等）转化为计算机可理解的数值形式（如向量、矩阵），核心目标是捕捉语言的语义、语法、上下文依赖等信息。自然语言表征技术可按“静态/动态”“有无上下文”“是否融入知识”等维度划分一、传统静态表征（无上下文，词级为主）这类方法为每个词分配固定向量，不考虑其在具体语境中的含义（无法解
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
【Qualcomm】高通SNPE框架简介、下载与使用 Jackilina_Stone 人工智能 Qualcomm SNPE
目录一高通SNPE框架1SNPE简介2QNN与SNPE3Capabilities4工作流程二SNPE的安装与使用1下载2Setup3SNPE的使用概述一高通SNPE框架1SNPE简介SNPE（SnapdragonNeuralProcessingEngine），是高通公司推出的面向移动端和物联网设备的深度学习推理框架。SNPE提供了一套完整的深度学习推理框架，能够支持多种深度学习模型，包括Pytor
深度学习篇---昇腾NPU&CANN 工具包 Atticus-Orion 上位机知识篇图像处理篇深度学习篇深度学习人工智能 NPU 昇腾 CANN
介绍昇腾NPU是华为推出的神经网络处理器，具有强大的AI计算能力，而CANN工具包则是面向AI场景的异构计算架构，用于发挥昇腾NPU的性能优势。以下是详细介绍：昇腾NPU架构设计：采用达芬奇架构，是一个片上系统，主要由特制的计算单元、大容量的存储单元和相应的控制单元组成。集成了多个CPU核心，包括控制CPU和AICPU，前者用于控制处理器整体运行，后者承担非矩阵类复杂计算。此外，还拥有AICore
深度学习图像分类数据集—桃子识别分类 AI街潜水的八角深度学习图像数据集深度学习分类人工智能
该数据集为图像分类数据集，适用于ResNet、VGG等卷积神经网络，SENet、CBAM等注意力机制相关算法，VisionTransformer等Transformer相关算法。数据集信息介绍：桃子识别分类：['B1','M2','R0','S3']训练数据集总共有6637张图片，每个文件夹单独放一种数据各子文件夹图片统计:·B1:1601张图片·M2:1800张图片·R0:1601张图片·S3:
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
【AI大模型】LLM模型架构深度解析：BERT vs. GPT vs. T5 我爱一条柴ya 学习AI记录 ai 人工智能 AI编程 python
引言Transformer架构的诞生（Vaswanietal.,2017）彻底改变了自然语言处理（NLP）。在其基础上，BERT、GPT和T5分别代表了三种不同的模型范式，主导了预训练语言模型的演进。理解它们的差异是LLM开发和学习的基石。一、核心架构对比特性BERT(BidirectionalEncoder)GPT(GenerativePre-trainedTransformer)T5(Text
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。