笃℃

【论文阅读_NL2SQL】Towards Complex Text-to-SQL in Cross-Domain Database with Intermediate Representation

文章目录

【论文阅读_NL2SQL】Towards Complex Text-to-SQL in Cross-Domain Database with Intermediate Representation
- 1. 来源
- 2. 介绍
- 3. 模型
- - 3.1 中间表示
  - 3.2 模式链接
  - 3.3 神经模型
- 4. 实验
- - 4.1 实验设置
  - 4.2 结果
- 5. 总结

1. 来源

论文地址：https://aclanthology.org/P19-1444/
code：https://github.com/microsoft/IRNet

2. 介绍

作者提出了一种称为IRNet的神经方法的复杂和跨域文本到sql。IRNet旨在解决两个挑战：

用自然语言（NL）表达的意图与SQL中的实现细节之间的不匹配；
预测大量域外词造成的列的挑战。

IRNet不是端到端合成一个SQL查询，而是将合成过程分解为三个阶段。

在第一阶段中，IRNet对一个问题和一个数据库模式执行一个模式链接。
然后，IRNet采用一个基于语法的神经模型来合成一个SemQL查询，这是作者设计的一个连接NL和SQL的中间表示。
最后，IRNet从合成的SemQL查询中确定性地推断出SQL查询。

在具有挑战性的文本到sql基准Spider上，IRNet实现了46.7%的准确率，比以前的方法获得了19.5%的绝对改进。在撰写本文时，IRNet在 Spider 排行榜上排名第一。

3. 模型

在本节中，将详细介绍IRNet。作者首先描述了如何解决不匹配问题和词汇问题（使用中间表示和模式链接）。然后，作者给出了合成SemQL查询的神经模型。

3.1 中间表示

为了消除这种不匹配，作者设计了一种特定于领域的语言，称为SemQL，它作为NL和SQL之间的中间表示。图2 显示了SemQL的上下文无关语法。图3 显示了一个说明性的SemQL查询。作者将在下面详细介绍SemQL的设计。

【论文阅读_NL2SQL】Towards Complex Text-to-SQL in Cross-Domain Database with Intermediate Representation_第3张图片

【论文阅读_NL2SQL】Towards Complex Text-to-SQL in Cross-Domain Database with Intermediate Representation_第4张图片

受lambda DCS（Liang，2013）的启发，SemQL被设计为树状结构。这种结构一方面可以有效地约束合成过程中的搜索空间。另一方面，鉴于SQL的树状结构性质（Yu et al.，2018b；Yin and Neubig，2018），遵循相同的结构也可以更容易直观地翻译为SQL。

不匹配问题 主要是由于SQL查询中的实现细节和问题缺少规范造成的。因此，在中间表示中隐藏实现细节的做法是很自然的，这就形成了SemQL的基本思想。考虑到图3中的示例，在SemQL查询中消除了SQL查询中的GROUPBY, HAVING 和 FROM子句，而且在where 和having 的条件也被SemQL查询中的过滤子树统一表示。可以在稍后的推理阶段使用领域知识从SemQL查询中确定性地推断出实现细节。例如，SQL查询的GROUPBY子句中的一个列通常出现在SELECT子句中，或者它是一个表的主键，其中一个聚合函数被应用于它的列之一。

此外，作者严格要求在SemQL中声明一个列属于的表。如图3所示，

在SemQL查询在列“名称”及其表“朋友”中声明。
表的声明有助于区分模式中重复的列名。
作者还为特殊列 “*” 声明了一个表，因为作者观察到 “*” 通常与问题中提到的表对齐。
考虑到图3中的示例，列 “*” 在本质上与表 “朋友”一致，这在问题中明确提到了。
为 “*” 声明一个表还有助于在下一个推断阶段推断出FROM子句。

当涉及从SemQL查询推断SQL查询时，作者基于数据库模式的定义是精确和完整的假设来执行推断。具体来说，如果列是另一个表的外键，在模式中应该声明一个外键约束。这种假设通常认为它是数据库设计中的最佳实践。

在Spider 基准的训练集中，超过95%的例子都持有这个假设。这个假设构成了推论的基础。
- 以SQL查询中的FROM子句的推理为例。作者首先确定连接模式中连接SemQL查询中所有声明的表的最短路径（数据库模式可以表述为无向图，其中顶点是表，边是表之间的外键关系）。
- 连接路径中的所有表最终会生成FROM子句。补充材料提供了推理的详细过程和更多的SemQL查询的示例。

3.2 模式链接

IRNet中的模式链接的目标是识别问题中提到的列和表，并根据问题中提到的列为这些列分配不同的类型。模式链接是在 text-sql 上下文中实体链接的实例化，其中实体引用数据库中的列、表和单元格值。作者使用一种简单而有效的基于弦匹配的方法来实现链接。在下面，作者将说明IRNet如何基于数据库中的单元格值不可用的假设来详细执行模式链接。

总的来说，作者定义了在问题中可能提到的三种类型的实体，即表、列和值，

值代表数据库中的单元格值。
- 为了识别实体，作者首先在一个问题中列举所有长度为1-6的n克。
- 然后，作者按长度的降序来列举它们。
- 如果一个n-gram与列名完全匹配或是列名的子集，作者将这个n-gram识别为列。
对表的识别也遵循同样的方法。
- 如果n-g可以同时识别为列和表，作者对列进行优先级排序。
- 如果一个n-gram以单个引号开始和结束，作者承认它为值。
- 一旦识别出一个n克，作者将删除与它重叠的其他n克。
- 为此，作者可以识别一个问题中提到的所有实体，并通过将那些已识别的n克和剩下的1克连接起来，得到这个问题的一个不重叠的n克序列。作者将序列中的每个n-克称为一个跨度，并分配每个跨度根据其实体来跨越一个类型。

例如，如果一个跨度被识别为列，作者将为其分配一个类型列。图4描述了一个问题的模式链接结果。

对于那些识别为列的，如果它们与模式中的列名完全匹配，作者为这些列分配类型精确匹配，否则为类型部分匹配。为了将单元格值与模式中相应的列连接起来，作者首先在ConceceptNet（Speer和Havasi，2012）中查询值跨度，这是一个开放的、大规模的知识图，并在模式上搜索ConceceptNet返回的结果。作者只考虑ConceceptNet的两类查询结果，即“是一种”和“相关术语”，因为作者观察到单元格值所属的列通常出现在这两个类别中。如果在模式中存在一个精确或部分匹配列名的结果，则作者为该列分配一个类型值精确匹配或值部分匹配。

3.3 神经模型

作者提出了合成SemQL查询的神经模型，它以一个问题、一个数据库模式和模式链接结果作为输入。图4通过一个说明性的示例描述了模型的总体架构。

为了解决词汇问题，作者在为模式中的问题和列构造表示时考虑了模式链接结果。此外，作者还设计了一个内存增强指针网络，用于在合成过程中选择列。当选择一个列时，它会首先决定是否从内存中进行选择，这使它不同于普通的指针网络（Vinyals et al.，2015）。内存增强指针网络背后的动机是，普通的指针网络很容易根据作者的观察结果选择相同的列。

NL编码器。设x=[（x1，τ1），···，（xL，τL）]表示一个问题的非重叠跨度序列，其中xi是第i个跨度，τi是在模式链接中分配的span xi的类型。NL编码器以x作为输入，并将x编码为一系列隐藏状态Hx。xi中的每个单词都被转换为其嵌入向量，其类型τi也被转换为一个嵌入向量。然后，NL编码器将类型和单词嵌入的平均值作为嵌入的跨度e i x。最后，NL编码器在所有的跨度嵌入上运行一个双向的LSTM（霍克雷特和施米德胡伯，1997）。将前向和后向LSTM的输出隐藏状态连接起来构造Hx。

模式编码器。s=（c，t）表示一个数据库模式，其中c={（c1，φi），···，（cn，φn）}是作者在模式链接中分配的不同列及其类型的集合，而t={t1，···，tm}是表的集合。模式编码器以s作为列Ec和表Et的输入和输出表示。作者以下面的列表示形式为例。表的表示的构造遵循相同的方式，除了作者没有为模式链接中的表分配类型。

具体地说，ci中的每个单词首先被转换为其嵌入向量，其类型φi也被转换为一个嵌入向量 ϕi。然后，模式编码器取单词嵌入的平均值作为列的初始表示形式 eˆic。模式编码器进一步对跨度嵌入进行关注，并获得一个上下文向量c i c。最后，模式编码器将初始嵌入、上下文向量和嵌入类型的和作为列表示e i c。列 ci 表示的计算方法如下。

解码器解码器的目标是合成SemQL查询。给定SemQL的树状结构，作者使用一个基于语法的解码器（Yin和Neubig，2017,2018），它利用LSTM通过动作的顺序应用来建模SemQL查询的生成过程。在形式上，SemQL查询y的生成过程可以形式化如下。

其中ai是在时间步i时所采取的动作，

解码器与三种类型的操作交互以生成SemQL查询，包括应用程序规则、选择列和可选择查询。APPLYRULE ®将生产规则r应用于SemQL查询的当前派生树。选择列©和可选择(t)分别从模式中选择列c和表t。在这里，作者详细说明了操作选择列和可选择列。有兴趣的读者可以参考Yin和Neubig（2017）来了解行动应用规则的细节。

作者设计了一个内存增强的指针网络来实现动作选择列。内存用于记录所选的列，这类似于Liang等人（2017）中使用的内存机制。当解码器要选择一个列时，它首先决定是否从内存中进行选择，然后根据该决定从内存或模式中选择一个列。一旦选定列，将从模式中删除并被记录在记忆中。选择列c的概率计算如下。

其中S表示从模式中选择，MEM表示从内存中选择，vi表示通过对Hx执行注意而获得的上下文向量，Ec m表示内存中列的嵌入，Ec s表示从未被选择的列的嵌入。wm是可训练的参数。

当涉及到可选择性时，解码器通过一个指针网络从模式中选择一个表 t ：

如图4所示，解码器首先预测一个列，然后预测它所属的表。为此，作者可以利用列和表之间的关系来删除不相关的表。

粗到细。作者进一步采用了一个从粗到细的框架（Solar-Lezama，2008；Bornholt等人，2016；Dong和拉帕塔，2018），将SemQL查询的解码过程分解为两个阶段。在第一阶段，骨架解码器输出SemQL查询的骨架。然后，一个细节解码器通过选择列和表来填充骨架中缺失的细节。补充材料提供了对SemQL查询的骨架和从粗到细的框架的详细描述。

4. 实验

在本节中，作者通过将IRNet与最先进的方法进行比较，并在IRNet中的几个设计选择来评估它们的贡献。

4.1 实验设置

数据集。作者在Spider（Yu et al.，2018c）上进行实验，这是一个大规模的、人注释的和跨域的文本到sql基准。继Yu等人（2018b）之后，作者使用该数据库被分割以进行评估，其中206个数据库被分为146个培训、20个开发和40个测试。有8625、1034、2147个问题-sql查询对用于培训、开发和测试。就像任何竞争基准一样，Spider的测试集是不公开的，作者的模型被提交给数据所有者进行测试。作者使用Yu等人（2018c）提出的SQL精确匹配和组件匹配来评估IRNet和其他方法。

基线。作者还评估序列到序列模型（Sutskever等，2014）增强神经注意机制（Bahdanau等，2014）和复制机制（顾等，2016），SQLNet（徐等，2017），TypeSQL（余等，2018）和SyntaxSQLNet（余等，2018b）这是最先进的方法。

实现。作者使用PyTorch实现了IRNet和基线方法（Paszke等人，2017）。单词嵌入、类型嵌入和隐藏向量的维数被设置为300。Word嵌入用Glove初始化（penn Word等人，2014），并在NL编码器和模式编码器之间共享。它们在训练期间是固定的。动作嵌入和节点类型嵌入的维数分别设置为128和64。dropout是0.3。作者使用Adam（Kingma和Ba，2014）和默认的超参数进行优化。批处理大小被设置为64。

Bert。语言模型预训练已被证明对学习通用语言表示是有效的。为了进一步研究作者的方法的有效性，受SQLova（Hwang等人，2019）的启发，作者利用BERT（Devlin等人，2018）对问题、数据库模式和模式链接结果进行编码。解码器与IRNet中保持相同。具体来说，问题中的跨序列与模式中所有不同的列名连接在一起。每个列的名称都用一个特殊的标记来分隔。BERT将该连接作为输入。问题中跨度的表示作为其单词和类型的平均隐藏状态。为了构造一列的表示，作者首先对其单词的隐藏状态运行一个双向LSTM（BI-LSTM）。然后，作者将它的类型嵌入和BI-LSTM的最终隐藏状态的和作为列表示。表表示法的构造也遵循同样的方法。补充材料提供了一个图方法来说明编码器的体系结构。为了建立基线，作者还用BERT增强了SyntaxSQLNet。请注意，由于资源的限制，作者只使用BERT的基本版本。作者不进行任何数据扩充以进行公平的比较。作者所有的代码都是公开提供的（
https://github.com/zhanzecheng/IRNet）。

4.2 结果

5. 总结

作者提出了一种用于复杂和跨域文本到sql的神经方法SemQL，旨在解决词汇问题和与模式链接和中间表示的不匹配问题。在具有挑战性的Spider基准测试上的实验结果证明了IRNet的有效性。

机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
mysql禁用远程登录 igotyback mysql
去mysql库中的user表里，将host都改成localhost之后刷新权限FLUSHPRIVILEGES;
向内而求陈陈_19b4
10月27日，阴。阅读书目:《次第花开》。作者:希阿荣博堪布，是当今藏传佛家宁玛派最伟大的上师法王，如意宝晋美彭措仁波切颇具影响力的弟子之一。多年以来，赴海内外各地弘扬佛法，以正式授课、现场开示、发表文章等多种方法指导佛学弟子修行佛法。代表作《寂静之道》、《生命这出戏》、《透过佛法看世界》自出版以来一直是佛教类书籍中的畅销书。图片发自App金句:1.佛陀说，一切痛苦的根源在于我们长期以来对自身及外
html 中如何使用 uniapp 的部分方法某公司摸鱼前端 html uni-app 前端
示例代码：Documentconsole.log(window);效果展示：好了，现在就可以uni.使用相关的方法了
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Google earth studio 简介陟彼高冈yu 旅游
GoogleEarthStudio是一个基于Web的动画工具，专为创作使用GoogleEarth数据的动画和视频而设计。它利用了GoogleEarth强大的三维地图和卫星影像数据库，使用户能够轻松地创建逼真的地球动画、航拍视频和动态地图可视化。网址为https://www.google.com/earth/studio/。GoogleEarthStudio是一个基于Web的动画工具，专为创作使用G
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
下载github patch到本地小米人er 我的博客 git patch
以下是几种从GitHub上下载以.patch结尾的补丁文件的方法：通过浏览器直接下载打开包含该.patch文件的GitHub仓库。在仓库的文件列表中找到对应的.patch文件。点击该文件，浏览器会显示文件的内容，在页面的右上角通常会有一个“Raw”按钮，点击它可以获取原始文件内容。然后在浏览器中使用快捷键（如Ctrl+S或者Command+S）将原始文件保存到本地，选择保存的文件名并确保后缀为.p
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
关于提高复杂业务逻辑代码可读性的思考编程经验分享开发经验 java 数据库开发语言
目录前言需求场景常规写法拆分方法领域对象总结前言实际工作中大部分时间都是在写业务逻辑，一般都是三层架构，表示层（Controller）接收客户端请求，并对入参做检验，业务逻辑层（Service）负责处理业务逻辑，一般开发都是在这一层中写具体的业务逻辑。数据访问层（Dao）是直接和数据库交互的，用于查数据给业务逻辑层，或者是将业务逻辑层处理后的数据写入数据库。简单的增删改查接口不用多说，基本上写好一
拥有断舍离的心态，过精简生活--《断舍离》读书笔记爱吃丸子的小樱桃
不知不觉间房间里的东西越来越多，虽然摆放整齐，但也时常会觉得空间逼仄，令人心生烦闷。抱着断舍离的态度，我开始阅读《断舍离》这本书，希望从书中能找到一些有效的方法，帮助我实现空间、物品上的断舍离。《断舍离》是日本作家山下英子通过自己的经历、思考和实践总结而成的，整体内涵也从刚开始的私人生活哲学的“断舍离”升华成了“人生实践哲学”，接着又成为每个人都能实行的“改变人生的断舍离”，从“哲学”逐渐升华成“
直返最高等级与直返APP：无需邀请码的返利新体验古楼
随着互联网的普及和电商的兴起，直返模式逐渐成为一种流行的商业模式。在这种模式下，消费者通过购买产品或服务，获得一定的返利，并可以分享给更多的人。其中，直返最高等级和直返APP是直返模式中的重要概念和工具。本文将详细介绍直返最高等级的概念、直返APP的使用以及与邀请码的关系。【高省】APP（高佣金领导者）是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，运行三年，稳定可靠。高省APP，
SQL Server_查询某一数据库中的所有表的内容 qq_42772833 SQL Server 数据库 sqlserver
1.查看所有表的表名要列出CrabFarmDB数据库中的所有表（名），可以使用以下SQL语句：USECrabFarmDB;--切换到目标数据库GOSELECTTABLE_NAMEFROMINFORMATION_SCHEMA.TABLESWHERETABLE_TYPE='BASETABLE';对这段SQL脚本的解释：SELECTTABLE_NAME：这个语句的作用是从查询结果中选择TABLE_NAM
如果做到轻松在股市赚钱？只要坚持这三个原则。履霜之人
大A股里向来就有七亏二平一赚的说法，能赚钱的都是少数人。否则股市就成了慈善机构，人人都有钱赚，谁还要上班？所以说亏钱是正常的，或者说是应该的。那么那些赚钱的人又是如何做到的呢？普通人能不能找到捷径去分一杯羹呢？方法是有的，但要做到需要你有极高的自律。第一，控制仓位，散户最大的问题是追涨杀跌，只要涨起来，就把钱往股票上砸，然后被套，隔天跌的受不了，又一刀切，全部割肉。来来回回间，遍体鳞伤。所以散户首
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
【加密社】Solidity 中的事件机制及其应用加密社闲侃区块链智能合约区块链
加密社引言在Solidity合约开发过程中，事件（Events）是一种非常重要的机制。它们不仅能够让开发者记录智能合约的重要状态变更，还能够让外部系统（如前端应用）监听这些状态的变化。本文将详细介绍Solidity中的事件机制以及如何利用不同的手段来触发、监听和获取这些事件。事件存储的地方当我们在Solidity合约中使用emit关键字触发事件时，该事件会被记录在区块链的交易收据中。具体而言，事件
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
使用Apify加载Twitter消息以进行微调的完整指南 nseejrukjhad twitter easyui 前端 python
#使用Apify加载Twitter消息以进行微调的完整指南##引言在自然语言处理领域，微调模型以适应特定任务是提升模型性能的常见方法。本文将介绍如何使用Apify从Twitter导出聊天信息，以便进一步进行微调。##主要内容###使用Apify导出推文首先，我们需要从Twitter导出推文。Apify可以帮助我们做到这一点。通过Apify的强大功能，我们可以批量抓取和导出数据，适用于各类应用场景。
利用Requests Toolkit轻松完成HTTP请求 nseejrukjhad http 网络协议网络 python
RequestsToolkit的力量：轻松构建HTTP请求Agent在现代软件开发中，API请求是与外部服务交互的核心。RequestsToolkit提供了一种便捷的方式，帮助开发者构建自动化的HTTP请求Agent。本文旨在详细介绍RequestsToolkit的设置、使用和潜在挑战。引言RequestsToolkit是一个强大的工具包，可用于构建执行HTTP请求的智能代理。这对于想要自动化与外
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh [email protected] 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

【论文阅读_NL2SQL】Towards Complex Text-to-SQL in Cross-Domain Database with Intermediate Representation

【论文阅读_NL2SQL】Towards Complex Text-to-SQL in Cross-Domain Database with Intermediate Representation

文章目录

1. 来源

2. 介绍

3. 模型

3.1 中间表示

3.2 模式链接

3.3 神经模型

4. 实验

4.1 实验设置

4.2 结果

5. 总结

你可能感兴趣的:(NL2SQL,论文阅读,方法介绍,数据库,论文阅读,sql)