baidu_huihui

小哥哥，检索式chatbot了解一下？

夕小瑶

机器学习话题的优秀回答者

215 人赞同了该文章

喵喵喵，一不小心又匿了三个月，突然诈尸害不害怕(￣∇￣)

小夕从7月份开始收到第一场面试邀请，到9月初基本结束了校招（面够了面够了T_T），深深的意识到今年的对话系统/chatbot方向是真的超级火呀。从微软主打情感计算的小冰，到百度主打智能家庭（与车联网？）的DuerOS和UNIT，到渗透在阿里许多产品的全能型智能客服小蜜，以及腾讯的小微和搜狗的汪仔，更不必说那些大佬坐镇的独角兽公司了，小夕深感以对话为主战场的NLP之风在工业界愈演愈烈，吓得小夕赶紧码了这篇文章。

1. 扫盲

对话的概念很大，从输入形式上分为文本和语音，本文当然只考虑文本。从对话目的上分为任务型对话与非任务型/闲聊型对话。顾名思义，任务型对话就是为了解决任务而进行的对话，比如你让Siri帮你定闹钟、发短信等，而闲聊型对话当然就是human-to-human的正常聊天啦。本文就不讨论任务型对话了，有兴趣的同学可以戳这里扫扫盲，本文聚焦在非任务型对话的多轮对话问题上。

要完成对话的建模，目前主要分为检索式、生成式以及检索与生成融合的方式。顾名思义，检索式就是通过检索与匹配的方式从已有的大量candidate responses中找出最合适的那个作为response；生成式则是事先通过训练来把对话知识塞进模型中，推理的时候首先模型的encoder部分去读历史对话，然后模型中的decoder/语言模型部分直接生成相应的回复；检索与生成相结合的方法则玩法很多了，比如用生成模型来做检索模型的reranker，用生成模型来作改写，用生成模型生成的response来作为检索模型的一条response等。限于篇幅，本文只讲纯检索式的，其他的以后再说（maybe不会太久╮(￣▽￣"")╭）。

2. 检索式模型的套路

检索式对话的一般套路是首先构建一个由大量query-response pair构成的知识库（比如从豆瓣、贴吧等地方抽取），然后将对话中最后一次的回复作为query，通过经典的信息检索方式（倒排索引+TFIDF/BM25）作q-q匹配来召回若干相关的candidate responses。注意，这一步实在太粗糙了，完全没有考虑语义，所以直接使用检索分数来挑选最优response显然是太过简单粗暴不靠谱。所以我们还需要使用考虑语义的深度文本匹配模型来将历史对话与这些检索出来的candidate responses进行matching/reranking，从而挑选出一个更加合适的response。

那么怎么进行文本的深度匹配呢？

一个很简单的做法是直接把复述识别/自然语言推理/检索式问答这些相关领域的文本匹配模型直接拿来用，但是显然这样仅仅建模的是单轮对话，于是聊天机器人就变成了只有7秒记忆的金鱼╮(╯▽╰)╭，因此，建模多轮对话是非常有必要的。

不过了解一下文本匹配模型是很有帮助的。这方面今年COLING有一篇文章[6]总结的不错，把基于表示与基于交互的SOTA匹配模型都给详细总结对比了。

基础比较差的同学可以看这篇文章，从2013年的DSSM[9]开始入手，慢慢补。篇幅所限，加上这方面研究相对很充分了，小夕就不展开讲啦。所以话说回来，将多轮对话与候选回复进行匹配的正确方式是什么呢？

3. 论文串烧

一切还要从两年前的秋天说起，曾经，有一个少年。。。

算了算了，还是正经点吧，要不然没法写了╮(￣▽￣"")╭总之，小夕从众多鱼龙混杂的检索式多轮对话的论文里精选出如下4篇进行串烧（按时间顺序，从经典到state-of-art），包括：

EMNLP2016 百度自然语言处理部的xiangyang大佬
@pkpk
的Multi-view[1]
ACL2017 MSRA
@吴俣
大佬的SMN[2]
COLING2018 上交的DUA[3]
ACL2018 百度自然语言处理部xiangyang大佬和lilu女神的DAM[4]

不过不要怕，小夕的论文分享总是浅显易懂还带点萌(￣∇￣)

必须要提的：Multi-view model

想一下，怎么才能从单轮q-r的匹配扩展到多轮呢？一个最最最简单的想法就是直接把多轮对话首尾连接变成一个长长的单轮╮(￣▽￣"")╭比如这种：

如上图，首先将各轮的对话连接起来（这里在连接处插入一个"__SOS__"的token），然后这里用RNN系网络取最后时刻隐态的方法分别得到query和response的向量表示，进而将这俩向量通过的方法得到匹配分值（M为网络参数），进而通过得到匹配概率（p为参数）。当然，其实这里本质上就是一个基于表示的文本匹配模型，所以完全可以用更复杂的表示方法和匹配函数（如SSE模型[8]）来完成这个过程。

聪明的童鞋肯定可以想到，显然这种将长长的word embedding sequence直接塞进网络得到整个多轮对话的表示（context embedding）的做法未免太看得起神经网络对文本的表示能力了，因此作者提出，不仅要在这个word-level上进行匹配，而且还要在一个更高的level上进行匹配，这个level称为utterance-level（即把对话中的每条文本（utterance）看作word）。

如上图的绿色->黄色->红色的部分，首先得到对话的每条文本（utterance）的向量表示（这里用的14年Kim提出的那个经典CNN），这样历史的多轮对话就变成了一个utterance embedding sequence。之后再通过一层Gated RNN（GRU、LSTM等）把无用的utterances中的噪声滤掉，进而取最后一个时刻的隐状态得到整个多轮对话（context）的context embedding啦。

拿到context embedding后，就可以跟之前word-level中的做法一样，得到对话与candidate response的匹配概率啦。最后，将word-level得到的匹配概率与utterance-level得到的匹配概率加起来就是最终的结果。

实验结果如下

可以看到utterance-level确实是明显比word-level work的，而且集成一下提升效果更显著。因此从这篇论文后的大部分论文也follow了这种对每条utterance分别进行处理（表示或交互），而后对utterance embedding sequence用Gated RNN进行过滤和得到context embedding的思路。

而到了2017年，文本匹配的研究明显变得更加成（花）熟（哨），各种花式attention带来了匹配效果的大幅度提升，这也标志着检索式多轮对话这方面的玩法也将变得丰（麻）富（烦）。

一次大大的进化：SMN model

如果说Multi-view模型在检索式多轮对话领域开了个好头，那么SMN则是将这个大框架往前推进了一大步。虽然表面上看Multi-view模型与SMN模型相去甚远，但是熟悉文本匹配的小伙伴应该有注意到，16年左右，基于交互的匹配模型开始代替基于表示的匹配模型成为主流[6]，因此在Multi-view中内嵌的匹配模型是基于表示的，而到了17年的这个SMN模型则使用了前沿的基于交互的匹配方法。另外除了改变文本匹配的“派系”之外，SMN还有一个比较亮的操作是在做文本匹配的时候考虑了文本的不同粒度 (granularity) 之间的匹配，这个操作也成为了后续一些paper的follow的点。

对文本匹配比较熟悉的同学应该在AAAI2016看过这么一篇paper：

Text Matching as Image Recognition （参考文献[5]）

如图，基本思想就是，使用传统的attention来计算出两个文本的word-level对齐矩阵/相似度矩阵后，将该矩阵看成一个图像，然后使用图像分类模型（如CNN）来得到更高level的相似度特征表示（比如phrase level, segment level等），进而最终得到全局的相似度匹配特征。这也是最早的几个交互式文本匹配模型之一。

SMN这篇paper就是采用了这个思想。给定一个candidate response，在生成word-level的每个utterance的向量表示的时候，首先计算出历史上每个utterance跟该response的对齐矩阵，然后对每个对齐矩阵，均使用上面这种图像分类的思想生成high-level表征文本对相似度的特征向量作为该utterance的向量表示（utterance embedding）。

之后就是使用前面Multi-view中的做法，从这个utterance embedding sequence中得到整个对话的context embedding，最后将该context embedding和之前的word-level下得到的context embedding与response的向量去计算相似度了。

不过作者这里在计算对齐矩阵和得到context embedding的时候，用了更复杂一些的方法。如图

在计算对齐矩阵的时候，作者不仅用了原始的word embedding，而且同时用了RNN系模型对文本encoding之后的隐状态（即编码过上下文信息的word embedding，可以看作phrase-level的"word embedding"了），这样就生成了两份对齐矩阵，然后这样将两份对齐矩阵作为两个channel丢进“图像分类模型”，从而保证了即使图像分类模型很浅，也能抽取出比较high-level的特征，得到高质量的utterance embedding。

另外，作者这里在得到最终的context embedding的时候，除了使用RNN最后一个隐状态的传统做法（记为）外，作者还额外实验了对顶层各个time step的隐状态进行加权求和（权重可训练）的方式（）以及更复杂的集成utterance自身表示的信息并使用self-attention的方式（），实验结果表明，总的来看的方式稍好一些（不过考虑到额外引入的计算和存储开销，一般不值得这样做）。有兴趣的同学可以去看原paper，这里就不展开讲啦。

从实验效果来看，SMN相比较之前的Multi-view有很大的提升，这也说明了：

在q-r匹配上，基于交互的模型相比基于表示的模型有更大的优势，这一点与检索式问答和NLI任务中的实验表现一致；
对文本进行多粒度表示是很有必要的。

utterance也要深度encoding！DUA model

虽然看似SMN已经考虑很周到了，但是如果细想一下，其实SMN的建模方式还是跟现实中人们的聊天习惯存在不小的gap的。其中一个方面就是，Multi-view和SMN都没有重视utterances之间的语义关系，仅仅是通过一层Gated RNN进行了软过滤和简单encoding。然而其实很多时候建模utterances之间的关系是很有必要的，甚至对于过滤来说也是很重要的信息，这也是DUA的motivation。我们知道，其实聊天中很少从头到尾都是一个主题，比如下面的对话：

case1:

u1-> 路人甲：小夕，中秋节你去哪里玩儿啦？

u2-> 小夕：当然是去买买买呀～

u3-> 路人甲：你之前不是想去爬百望山嘛？没去嘛？

u4-> 小夕：想去呀，然鹅她们去玩儿都不带我(｡ ́︿ ̀｡)

u5-> 路人甲：你稍等下啊，我下楼取个快递

u6-> 小夕：去吧去吧，顺便帮我买个辣条！

u7-> 路人甲：好呀，要啥口味的？鸡肉味？

u8-> 小夕：这特喵的还分口味？

u9-> 路人甲：回来啦，对了，要不然下周我带你去吧？

u10-> 小夕：好呀好呀，喵喵喵～

这里如果把小夕看作是检索式chatbot，假如对话进行到第6步(u6)，这时候最后一个utterance是u5，也就是“你稍等下啊，我下楼去取个快递”。显然，这时候其实相当于对话的话题发生了剧烈偏移，如果这时候小夕去跟一堆candidate responses做匹配的时候还去考虑u1-u4这些爬山相关的utterances的话，显然就容易召回跟u5很不相关的回复。同样的道理，如果对话进行到u8，其实这时候真正有用的historical utterances是u6-u7；对话进行到u10的时候，有用的utterances又变成了u1-u4。

除此之外，对话中还容易夹杂一些类似于停用词的噪声，比如

case2:

u1-> 路人乙：小夕，明天约约约？

u2-> 小夕：。。。

u3-> 路人甲：哈哈

u4-> 小夕：应该木有时间

这里的u2和u3就是类似于停用词的“停用utterance”，所以对于这一类utterance，最好的办法就是忽略掉而不是让它们参与匹配。

怎么解决上述这两类问题呢？那就直接上这个让人看着灰常懵逼的DUA的模型图吧：

如图，这个图乍一看有点乱（其实画的确实不怎么样（作者应该不会看我的文章吧2333））

啊啊啊作者竟然真的看我文章了QAQ论文作者在评论区出现的那一刻我的心情是复杂的！

论文里的公式标记也用的乱乱的（尤其第3.3节凭空冒出来的n弄得我懵逼了好久，到底是不是3.1节的n，是的话这里貌似就不对了，如果不是，这里又代表啥）；一些细节也没交代清楚（比如3.1的S到底是个矩阵还是向量，如果是向量，那么怎么得到的这个向量？是矩阵的话3.2节的聚合又不对了）。

超级感谢论文作者
@NowOrNever
的耐心解惑，一下子清楚多啦。如下：
首先，3.3节的n与3.1节的n是相同的指代，如果作者觉得指代相同的时候有什么问题的话，欢迎进一步交流。同时，非常抱歉我们在3.1里把3.2中定义的东西用了进来，其中3.1节的S_k指的是3.2节中的S的每一个组成部分，即，S_1, S_2,...,S_t,S_r。如果还有相关问题，欢迎随时来交流！

不过，其实这里的思想很明确，就是说，以前的paper呀，得到utterance embedding后就直接拿去RNN了，都没有像处理word embedding那样去好好做encoding，所以我们这里对utterance embedding也同样要做深度的encoding！

那么怎么做这个encoding呢？通过观察上面的俩cases可以发现，很多时候对话中是有hole的（比如上面case1中的u9的上一句话是u4，所以u5-u8形成了一个空洞），甚至可能很多个hole，所以这里做encoding的时候最合适的是使用self-attention而不是RNN更不是CNN。所以作者在这里先用了一层（加性）self-attention来把上下文编码进每个utterance embedding：

这里是t时刻的utterance embedding（就是前面聚合操作之后的那个向量表示），是其上下文（即全部时刻的utterance embedding，一共n个）。通过这个encoding操作，一下子每个时刻的utterance都能跨越时间和空洞把自己的那一群小伙伴聚在一起啦。

然鹅显然self-attention丢失了utterance的顺序信息，因此作者这里又把encoding后的utterance embedding跟encoding前的utterance embedding拼接起来又过了一层Gated RNN：

Gated RNN（GRU、LSTM等）一方面可以按照时序进一步encoding，另一方面里面的输入门也起到了filter的作用，正好可以在加强encoding的同时把无用的信息过滤掉。看，这样就完成了当时的motivation，最后的这个utterance embedding可以说干净合理的多了。整个模型的其他部分则跟SMN基本没区别。

从实验结果来看，DUA的性能确实比SMN有了进一步明显的提升。

state-of-the-art：DAM model

这篇是多轮对话领域难得的好paper，可能xiangyang大佬太忙，都木有打打广告什么的╮(￣▽￣"")╭。作者这里抛弃了之前的建模utterance embedding sequence的思路，而是把NLP很多领域的前沿操作优雅干净的整合为一个全新的框架来建模多轮对话问题，不仅模型非常work，实验章节也对模型各个component的特点和有效性进行了充分的探索和论证，是继Multi-view和SMN以来多轮对话领域又一个不得不提的经典模型。

另外，遇到一张清晰漂亮的模型图不容易哇，就直接上图吧

ps：这张图这么少女心，我猜是lilu女神画的。

还记得前面说的SMN的一个亮点是做了两级粒度的文本表示嘛？那么很自然的就有了一个问题：两级就够了嘛？有没有必要设置更多级呢？如果有必要的话，那么怎么去表示和学习这更多级粒度的语义表示呢？

首先答案当然是肯定的，17年的SSE文本匹配模型和今年特别火的ELMo[10]都说明了对文本的深层表示可以学习到更加高level的语义单元，然而我们知道像SSE和ELMo这种堆多层RNN的做法会极大的增加模型的推理代价，这极大的限制了它们在工业界的应用。而堆多层CNN在文本里又不容易调work，需要精细的设计网络并借助一些tricks，因此很自然的做法就是使用Transformer[11] encoder来得到文本的多级表示啦（没看过transformer那篇paper的赶紧去补啦，做NLP哪能不知道transformer）。

所以如图，DAM首先就用transformer的encoder来得到了每个utterance和response的多粒度文本表示（即图中的Representation部分），之后作者对每个utterance-response pair的每个粒度下的表示分别计算两个对齐矩阵（即图中的Matching部分）。

等下，怎么是俩对齐矩阵？除了传统的计算对齐矩阵的方式，还有新的玩法啦？

这里作者提出了一种更加深（隐）层（晦）的匹配方法，操作不难，但是为什么会work还是挺难以理解透彻的（虽然作者在5.2节已经有很努力的讲了）。总之，先来简单提一下传统的attention计算对齐矩阵的方式。

传统的方法无非就是把文本1中的word embedding sequence和文本2中的word embedding sequence进行词-词比较，这里的比较分为加性方法和乘性方法，基础差的同学可以看下面这段复习一下。

注：词-词比较的方式分为加性和乘性，加性就是将要比较的两个word embedding进行相加（相加前可以先过一个线性变换甚至MLP）然后激活后跟一个虚拟的向量做内积（其实这个虚拟向量就是个可训练的同维度向量，我理解的它存在的意义就是对每个维度的加法比较+激活后的结果进行scaling，毕竟维度不同方差也可能不同嘛），内积的结果就是对齐程度啦。乘性则容易理解一些，就是将两个word embedding直接进行相乘（准确说是内积）或中间夹一个可训练方阵（即的形式），内积的结果就是对齐的程度啦。不过要记得当维度很高时，乘性方式最好对结果做个归一化以免进入softmax饱和区（参考Transformer）。

如上式，作者这里使用的是乘性的方式，这里的l就是指的第l级粒度，是指的第i个utterance，有个词，response有个词。这里就是说，对于每级语义粒度的每个utterance，都是将其中的每个词k去跟response中该粒度下的每个词t去算内积，从而得到一个的对齐矩阵。

对于传统的attention，如果两个词在semantic或syntactic上离得近，就容易得到比较大的匹配值（如run和runs, do和what）。然而对于一些比较深层和隐晦的语义关系就很难直接匹配了（我们不能强求前面的网络把各级粒度的语义单元的embedding都学的那么完美呀对吧），所以作者这里提出了一个更加间接和隐晦的attention方式，如下

这里的AttentiveModule的3个参数依次为attention的Query、Key和Value，不熟悉的同学去复习Transformer，这里就不赘述啦。首先看公式8和9，这里先通过传统的attention来把utterance和response中的每个词用对面文本的词加权表示，得到新的utterance的word embeding sequence表示和新的response的word embedding sequence表示，之后再用一层传统的attention来计算出一个对齐矩阵来作为第二个对齐矩阵。

显然这种方式将utterance中的词和response中的词之间的依赖关系（dependency information）也作为词的表示加入了对齐矩阵的计算，所以说是建模了更加深（复）层（杂）的语义关系。不过，作者在论文5.2节有提到这两种attention方式匹配文本的操作其实是互补的，并且给出了一个case解释，然而小夕功力有限，努力理解了一下还是没理解
╮(￣▽￣"")╭希望有看懂的小伙伴给小夕讲讲或者贴到评论区～

经过这么深层的匹配后，每个utterance中的每个词位都包含了2(L+1)维的匹配信息（L为Transformer encoder的层数，1为原始的word embedding，2为对齐矩阵的数量），作者这里又把utterances堆叠到一起，就形成了这个漂亮的3D粉色大立方体

所以这个大立方体的三个维度分别代表对话上下文中的每个utterance、utterance中的每个词（位）、response中的每个词（位）。

之后，再通过一个两层的3D的卷积神经网络来从这个大立方体中抽取特征，得到匹配层的特征，最后的最后通过一个单层感知机得到该candidate response的匹配概率。

说了这么多，来看看实验结果吧～

可以看到实验结果非常漂亮（当前的state-of-art），尤其是这种比较有实际意义的指标（从10个candidates里召回top1）。而且DAM没有像DUA那样对utterance embedding sequence做深层encoding（这里直接用的3D conv抽特征了），但是实验结果明显比DUA好，可以说网络设计的很棒棒啦。

另外，作者这里也给出了去掉各个component后的性能情况：

比如对比DAM与倒数第二行可以看到，去掉那个复杂的深度注意力机制后，网络性能出现了明显的下降，说明论文中提出的这个“间接”的注意力机制确实能捕获到一些神奇的模式。

总结

最后小夕非常主观的总结一下这四个模型的亮点：

Multi-view提出了将utterance建模为一个语义单元来建模多轮对话问题；
SMN使用基于交互的匹配模型代替基于表示的匹配模型，并对文本进行多粒度表示；
DUA对utterance embedding进行深度的encoding来建模utterances之间的依赖关系；
DAM一方面对文本对进行多粒度表示并提出了一种深度attention的方法，另一方面抛弃了之前建模utterance embedding sequence的思路，提出了一种将word-level和utterance-level的信息整合到一起，构建一个多通道的3D Image（其实把utterance看成单帧的图像，那这个大方块更像是一个视频），进而通过3D Image分类器完成匹配的新思路。

参考文献

[1] Multi-view Response Selection for Human-Computer Conversation, EMNLP2016
[2] Sequential Matching Network- A New Architecture for Multi-turn Response Selection in Retrieval-Based Chatbots, ACL2017
[3] Modeling Multi-turn Conversation with Deep Utterance Aggregation, COLING2018
[4] Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network, 2018ACL
[5] Text Matching as Image Recognition, AAAI2016
[6] Neural Network Models for Paraphrase Identification, Semantic Textual Similarity, Natural Language Inference, and Question Answering, COLING2018
[7] Enhanced LSTM for Natural Language Inference, ACL2017
[8] Shortcut-Stacked Sentence Encoders for Multi-Domain Inference, Proceedings of the 2nd Workshop on Evaluating Vector Space Representations for NLP. 2017
[9] Learning Deep Structured Semantic Models for Web Search using Clickthrough Data, CIKM2013
[10] Deep contextualized word representations, NAACL2018
[11] Attention Is All You Need, NIPS2017

编辑于 2018-11-02

对话系统

自然语言处理

深度学习（Deep Learning）

赞同 21529 条评论

文章被以下专栏收录

夕小瑶的科技屋

同步与改编自微信订阅号【夕小瑶的卖萌屋】中的文章，致力于输出最萌最有营养的原创NLP&ML干货。

进入专栏

关于SLU（意图识别、槽填充、上下文LU、结构化LU）和NLG的论文汇总

cstghitpku

真正的完全图解Seq2Seq Attention模型

Yuanche.Sh

BERT相关论文、文章和代码资源汇总

BERT最近太火，蹭个热点，整理一下相关的资源，包括Paper, 代码和文章解读。1、Google官方:1) BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding一切始于…

Pan Y...发表于AINLP

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

lqfar...发表于深度学习与...

29 条评论

切换为时间排序

写下你的评论...

发布

精选评论（1）

NowOrNever5 个月前
首先，非常感谢你对DUA的关注。看到作者对我们文章这么不满，那我赶紧来解释一下作者提出的相关问题吧。首先，3.3节的n与3.1节的n是相同的指代，如果作者觉得指代相同的时候有什么问题的话，欢迎进一步交流。同时，非常抱歉我们在3.1里把3.2中定义的东西用了进来，其中3.1节的S_k指的是3.2节中的S的每一个组成部分，即，S_1, S_2,...,S_t,S_r。如果还有相关问题，欢迎随时来交流！

5查看回复回复踩举报

展开其他 1 条回复

骆梁宸6 个月前
这个发文时间很拼了

1回复踩举报
夕小瑶 (作者) 回复骆梁宸6 个月前
这个评论时间也很拼了。。。

1回复踩举报
骆梁宸回复夕小瑶 (作者)6 个月前
这周五ICLR截稿?

2回复踩举报

忆臻6 个月前
小夕，什么时候来一发生成式对话，233

赞回复踩举报
知乎用户回复忆臻6 个月前

产品现在很少用生成

赞回复踩举报
夕小瑶 (作者) 回复忆臻6 个月前
生成式好难写的(ﾉ_ _)ﾉ不过我觉得男神你可以尝试一下?

赞回复踩举报

YJango6 个月前
辛苦了

赞回复踩举报
夕小瑶 (作者) 回复YJango6 个月前
☺️☺️

赞回复踩举报

房海朔6 个月前
这个点发文，我差点都以为你在美帝了

赞回复踩举报
夕小瑶 (作者) 回复房海朔6 个月前
哈哈哈，联想能力满分了

赞回复踩举报

知乎用户6 个月前

??谢谢小夕大佬

赞回复踩举报

我叫大王来巡山6 个月前
谢谢小姐姐！悄悄的潜水，默默的关注！

赞回复踩举报

展开其他 1 条回复

谭毅之6 个月前
大神请问一下我试着run了一下DAM的release code，但是总是跑不通。想问一下你有试过吗？

赞回复踩举报
夕小瑶 (作者) 回复谭毅之6 个月前
还没有呢，不过最近我也准备试一下～到时候私信你吧

赞回复踩举报
知乎用户回复谭毅之3 个月前

嗯，我也跑不通。

赞回复踩举报

转角6 个月前
吴俣大佬在ACL2018又发了一篇Learning Matching Models with Weak Supervision for Response Selection in Retrieval-based Chatbots,这种通用的方法可以用在所有的基于检索的对话模型上,作者在SMN模型上加入了这种方法结果有蛮大提升,感觉如果在DAM上使用的话可能可以得到更好地结果

2回复踩举报

大闸蟹5 个月前DUA的作者碰巧玩知乎，感谢精选鸭

1回复踩举报

展开其他 2 条回复

NowOrNever5 个月前
首先，非常感谢你对DUA的关注。看到作者对我们文章这么不满，那我赶紧来解释一下作者提出的相关问题吧。首先，3.3节的n与3.1节的n是相同的指代，如果作者觉得指代相同的时候有什么问题的话，欢迎进一步交流。同时，非常抱歉我们在3.1里把3.2中定义的东西用了进来，其中3.1节的S_k指的是3.2节中的S的每一个组成部分，即，S_1, S_2,...,S_t,S_r。如果还有相关问题，欢迎随时来交流！

5回复踩举报
夕小瑶 (作者) 回复NowOrNever5 个月前
哇，真的把作者炸出来了QAQ您误解啦，不是不满，而是叫精彩中带着一点点不完美，所以顺便小小吐槽了一下希望不要介意(・ω< )★写在这篇文章里的论文都是小夕觉得非常精彩的，DUA自然也是其中一篇～非常感谢您的关注和解惑，一会儿我补充在文章里╰(*´︶`*)╯

赞回复踩举报
NowOrNever回复夕小瑶 (作者)5 个月前
嗯嗯，还是非常感谢作者的推荐啦，我们的图确实画的不太好hhhh

赞回复踩举报

vincent5 个月前
大规模中文训练集怎么搞

赞回复踩举报

Liang4 个月前
Excellent article~ like it~~

One question, if two dialogs merged in context, it's hard to get the response correctly. In this case we need dialog generation, right? Any summary about dialog generation?

赞回复踩举报

快乐女孩1 个月前
请教下小夕，哪里能看到DAM的release code呀？

赞回复踩举报
夕小瑶 (作者) 回复快乐女孩29 天前
Google搜DAM github dialogue

赞回复踩举报

知乎用户7 天前

想请问一下这种检索式的多轮对话实际落地该怎么部署啊，看大厂也发这个类型的论文，是不是对于数据的构建要求极高？而且这还是一种Q-A匹配，总感觉实用性不是应该不如Q-Q高...

赞回复

你可能感兴趣的:(chatbot)

[python][gradio]chatbot控件用法 FL1623863129 Python python 前端服务器
chatbot模块是Gradio中的一个组件，用于展示聊天机器人的输出，包括用户提交的消息和机器人的回复。它支持一些Markdown语法，包括粗体、斜体、代码和图片等。Chatbot模块的输入不接受用户输入，而是通过函数返回的列表来设置聊天内容。返回的列表应包含多个内部列表，每个内部列表包含两个元素：用户消息和机器人回复。消息可以是字符串、元组或None。如果消息是字符串，可以包含Markdown
[论文笔记] LLaVA 心心喵论文笔记论文阅读
一、LLaVA论文中的主要工作和实验结果ExistingGap:之前的大部分工作都在做模态对齐，做图片的representationlearning，而没有针对ChatBot（多轮对话，指令理解）这种场景优化。Contribution:这篇工作已经在BLIP-2之后了，所以Image的理解能力不是LLaVA希望提升的重点，LLaVA是想提升多模态模型的Instruction-Followingab
阿里云计算巢：开启全新云服务时代，助力企业飞速成长阿里云最新优惠和活动汇总
阿里云计算巢致力于为企业和个人开发者提供全面、高效的云计算解决方案。本文将详细介绍阿里云计算巢的各项服务，带您领略其强大的功能和广泛的应用场景。其中，计算巢的StableDiffusionWebUI和aiacctorch服务能够大幅度提升PyTorch的推理性能，为AI应用提供强大的加速能力。此外，幻兽帕鲁、一站式企业专属Chatbot、雾锁王国等游戏和娱乐类服务也为用户带来了全新的体验。云XR实
#LLM入门|Prompt#1.8_聊天机器人_Chatbot 向日葵花籽儿 LLM入门教程笔记 prompt 机器人 microsoft
聊天机器人设计以会话形式进行交互，接受一系列消息作为输入，并返回模型生成的消息作为输出。原本设计用于简便多轮对话，但同样适用于单轮任务。设计思路个性化特性：通过定制模型的训练数据和参数，使机器人拥有特定的个性化特点。专门任务设计：针对特定任务或行为进行设计，模型可针对该任务进行Fine-tune，提高效果和准确性。优势简化开发：减少了构建聊天机器人所需的工作量和复杂度。灵活性：模型可根据需求进行定
“认知计算”为银行业开启新风向 AIOPstack
在台湾，有一个玉山银行的人工智能ChatBot在投放之初立刻吸引了大家的眼球，这个在社交网络Line上的“随身金融顾问”可以随时以语音或文字的形式，为顾客提供外汇咨询、房贷评估、信用卡推荐等金融咨询服务，聊天式的交互让智能客服有了温度，而更加直观人性化的服务也大大提高了顾客对金融产品的兴趣，加深了客户洞察与联结。——得益于政策扶植和大量资本的注入，中国人工智能市场正风生水起，不仅在互联网中获得大量
【Langchain+Streamlit】旅游聊天机器人 AI小万老师 langchain 人工智能 prompt 机器人旅游 ai
【Langchain+Streamlit】打造一个旅游问答AI-CSDN博客项目线上地址，无需openai秘钥可直接体验：http://101.33.225.241:8502/github地址：GitHub-jerry1900/langchain_chatbot:langchain+streamlit打造的一个有memory的旅游聊天机器人，可以和你聊旅游相关的事儿上节课，我们介绍了一个用stre
调用本地大模型实现聊天机器人ChatBot taoli-qiao Langchain 人工智能机器人
AWSInstance本地部署大模型AWS上申请带GPU的instance，例如g4dn系列，申请instance后安装CUDA的driver，driver安装完成后，就可以在带gpu的instance上部署开源的大模型了。如果想了解在aws上部署本地模型细节，可以阅读我的这两篇博客。AWSinstance上本地部署大模型Fastchat本地部署大模型这里为了能在ChatBot上调用本地模型，使用
Embedchain聊天机器人开发简明教程【开源RAG框架】新缸中之脑数据挖掘人工智能
你在考虑开发聊天机器人吗？在本教程中，我们将引导你完成使用Embedchain框架构建ChatBot的步骤。Embedchain库提供了用于开发可针对不同领域进行定制的聊天机器人的适应性基础设施。在本课程中，我们将集中精力开发Audi聊天机器人。我们将详细介绍安装Embedchain库、设置OpenAIAPI密钥、构建聊天机器人实例、为其提供训练资源，以及向聊天机器人询问问题以获得答案。NSDT工
薅 AWS 羊毛的船新方式，以 ChatBot 为例 Solo 社区 aws 云计算
还在担心一年免费服务器到期后该怎么办？（Solo社区投稿）网上绝大多数薅AWS羊毛的教程都是在教大家如何申请创建一年免费的VPS，太OUT了！就问一个问题，一年到期了那咋办？其实，除了一年免费的VPS外，AWS足足有40多个永久免费的服务，其中就包括的AWS最为出名的Lambda，以及日常开发常用的DynamoDB（NoSQL数据库）、SNS（发布订阅）。而这么多的服务挨个读文档、装SDK太麻烦了
大模型日报-20240203 程序无涯海大模型资讯篇 AI AIGC chatgpt GPT 人工智能大模型
刚刚，字节版GPTs「扣子」上线了https://mp.weixin.qq.com/s/efNjbeK8Zul39nLzQuawCg在持续一年的大模型热潮之后，「智能体」成为了科技公司们新的押注方向之一。近日，字节跳动正式推出「Coze扣子」AIBot开发平台。任何用户都可以快速、低门槛地搭建自己的Chatbot，且平台支持用户将其一键发布到飞书、微信公众号、豆包等渠道。当然，除了可以创建自己的C
ChatGPT: 人工智能技术的崭新应用久邦科技精选文摘深度学习人工智能神经网络
随着人工智能技术的不断发展和进步，越来越多的智能应用被引入到我们的日常生活中。其中，聊天机器人（Chatbot）是一种受到广泛关注和应用的人工智能技术，它可以模拟人类思维和行为，与用户进行实时对话，提供各种服务和支持。而ChatGPT（GenerativePre-trainedTransformer）则是一种基于自然语言处理和深度学习技术的聊天机器人，它已经成为了人工智能技术领域的热门话题。本文将
ingres nginx 反向代理常见配置（持续更新） Cloud孙文波 kubernetes kubernetes ingress-nginx
一、匹配到的location的关键字不传递给后端如果想实现访问的url匹配到的location，不携带给后端服务类似nginx的配置如下可以看到proxy_passhttp://chatbot_flask/;后面是带了"/"的，这代表反向代理给后端的upstream节点不携带"im_chat"这个关键字.假设我的请求是https://xxx.xxx.com/im_chat/v1/chat/crea
LangChain+通义千问+AnalyticDB 向量引擎保姆级教程阿里云云栖号云栖号技术分享 langchain 云计算数据库
本文以构建AIGC落地应用ChatBot和构建AIAgent为例，从代码级别详细分享AI框架LangChain、阿里云通义大模型和AnalyticDB提供引擎的开发经验和最佳实践，给大家快速搭建AIGC应用提供参考。前言9月13日，通义千问大模型已通过录制方式招募，并正式向公众开放。通义模型具备的能力包括：1.创作文字，如写故事、写公文、写邮件、写剧本、写诗歌等；2.编写代码；3.提供各类语言的翻
【NLP冲吖~】〇、NLP（自然语言处理、大纲）漂泊老猫自然语言处理NLP 自然语言处理人工智能
0、自然语言处理自然语言处理是一门用于理解人类语言、情感和思想的技术，是人工智能深度学习领域的一项重要分支，去年爆火的GPT就是该分支的一个重要落地的应用。随着计算机算力的不断提升，自然语言处理技术近年来发展迅速，有代表模型BERT和GPT等；应用场景有chatbot、知识图谱、情感分析等。自然语言是与机器语言相对的一个概念，它是指人类在一定条件下自然形成和使用的口头或书面的语言，如汉语、英语、法
用Flask打造一个大模型智能问答WEB网站 gzroy Python编程人工智能 WEB应用 flask python 后端
目前已经有很多类似GPT的大模型开源，可以提供类似ChatGPT的智能问答功能。我也基于这些开源模型，用Flask来建立一个智能问答网站，可以方便用户建立自己的ChatGPT系统。这个网站需要提供用户登录功能，对已登录的用户，可以在网站上提出问题，并由大模型处理后返回答案。演示效果如下：chatbot_FLASKAPP配置先定义一个config.py文件，里面定义FlaskAPP的secretke
【LangChain学习之旅】—（10）用RouterChain确定客户意图之墨_ Langchain langchain 大模型
【【LangChain学习之旅】—（10）用RouterChain确定客户意图任务设定整体框架具体步骤如下：具体实现构建提示信息的模板构建目标链Reference：LangChain实战课任务设定首先，还是先看一下今天要完成一个什么样的任务。这里假设咱们的鲜花运营智能客服ChatBot通常会接到两大类问题。鲜花养护（保持花的健康、如何浇水、施肥等）鲜花装饰（如何搭配花、如何装饰场地等）你的需求是，
教你用Python搭建一个属于自己的AI聊天机器人程序员小芽 python 人工智能机器人
如何使用ChatGPTAPI近年来，人工智能（AI）的发展日新月异，而聊天机器人（Chatbot）则是AI领域的明星应用之一。今天，我们将深入浅出地介绍如何使用ChatGPTAPI，构建属于自己的智能聊天机器人的基础。一、准备工作注册OpenAI账户要使用ChatGPTAPI，首先需要在OpenAI官网（https://www.openai.com）上注册一个账户。完成注册并登录后，通过（http
5G消息一站式解决方案，实现全新“跳代”应用体验邦之信短信平台 5G
随着5G技术的普及和深化，通信行业迎来发展的“红利期”。5G消息作为基础短信业务的升级，可通过手机一键开启。不仅支持在原生短信界面发送多种内容，如：语音、视频、图片、地理位置等。还可通过chatbot功能模拟人类智能对话，实现应用与个人交互，使用户在消息窗口就能完成搜索、发现、订阅、支付等业务办理，实现全新“跳代”应用体验。5G消息可承载的内容极为丰富，无需下载任何第三方应用，基于手机原生短信窗口
机器学习周刊第六期：哈佛大学机器学习课、Chatbot Ul 2.0 、LangChain v0.1.0、Mixtral 8x7B 机器学习算法与Python实战机器学习 langchain 人工智能
—date:2024/01/08—吴恩达和Langchain合作开发了JavaScript生成式AI短期课程：《使用LangChain.js构建LLM应用程序》大家好，欢迎收看第六期机器学习周刊本期介绍10个内容，涉及Python、机器学习、大模型等,目录如下：1、哈佛大学机器学习课2、第一个JavaScript生成式Al短期课程3、一个地理相关的Python库4、电脑本地运行大模型聊天软件,支持
大模型入门0: 基础知识 YueTann python
大模型0基础知识:transformer基础与NLP1参数量预估与scalinglaw2sft3RAG与langchain4prompt5rlhf6agent7分布式训练8推理优化9传统任务本文结构transformer自然语言处理包括几大任务NLP:文本分类，词性标注，信息检索NLG：机器翻译，自动摘要，问答QA、对话机器ChatBot下游任务:词性标注（POS），句法分析（DP），命名实体识别
人人都在用的PDF软件，也要接入ChatGPT了智创有术有限公司开源中文分词游戏
随着人工智能技术的不断进步和发展，Chatbot技术的应用已经逐渐从娱乐和社交领域扩展到了更多的实际场景中。在办公软件领域，聊天机器人已经成为了提升工作效率、减少人力投入的重要工具，多家头部企业都在探讨将AI接入到软件及应用中的使用方案。福昕软件作为全球著名的PDF技术与解决方案提供商，近日也宣布将推出基于自然语言处理技术的聊天机器人ChatGPT的新功能，虽然功能还处于部署阶段，但是预计将会进一
ChatBot闲聊---腾讯自然语言处理 NLP 不说话的卡卡西 python 自然语言处理腾讯云人工智能
https://cloud.tencent.com/document/product/271/39416接口描述接口请求域名：nlp.tencentcloudapi.com。闲聊服务基于腾讯领先的NLP引擎能力、数据运算能力和千亿级互联网语料数据的支持，同时集成了广泛的知识问答能力，可实现上百种自定义属性配置，以及儿童语言风格及说话方式，从而让聊天变得更睿智、简单和有趣。pipinstallitc
DevOps-ChatBot：DevOps开源端到端智能AI助手 CodeFuse devops 开源人工智能
1.项目背景随着ChatGPT等通用大模型以及各类垂直领域大模型的出现，各个领域的产品交互模式、用户信息获取模式都在逐步发生改变。但通用大模型自身存在的生成内容不可靠、信息内容不及时、领域任务不完善的问题始终存在，面向DevOps这个对于事实的准确性、信息的及时性、问题的复杂性、数据的安全性要求都比较高的领域，大模型该如何赋能？为此，我们发起并开源DevOps-ChatBot端到端AI智能助手，专
RAG：让大语言模型拥有特定的专属知识博文视点语言模型人工智能机器学习
作为一个在Chatbot领域摸爬滚打了7年的从业者，笔者可以诚实地说，在大语言模型的推动下，检索增强生成（RetrievalAugmentedGeneration，RAG）技术正在快速崛起。RAG的搜索请求和生成式AI技术，为搜索请求和信息检索领域带来了革命性的改变。RAG能够帮助大语言模型根据可靠的数据直接给出答案。本文就来介绍一下RAG的技术原理，并和Fine-tuning（微调）进行对比，同
WeNet语音识别+Qwen-72B-Chat Bot+Sambert-Hifigan语音合成陈增林语音识别人工智能通义千问语言合成
WeNet语音识别+Qwen-72B-ChatBot+Sambert-Hifigan语音合成简介利用WeNet进行语音识别，使用户能够通过语音输入与系统进行交互。接着，Qwen-72B-ChatBot作为聊天机器人接收用户的语音输入或文本输入，提供响应并与用户进行对话。最后，系统利用Sambert-Hifigan进行语音合成，将机器人的响应转换为自然流畅的语音输出，使用户能够以语音方式接收机器人的
改善 GitHub Pages 阅读体验：Quick Docs soulteary 为了不折腾而去折腾的那些事 github GitHub pages docker
一个不到10MB的小工具，来提供本地、快速的文档访问，来改善开发过程中，阅读在线文档体验糟糕的问题。以及，介绍如何快速制作一个利于分发使用的，离线文档工具包。写在前面即使现在AI辅助编码和ChatBot类的产品已经非常多，写代码的体验已经变的非常好，但是日常Coding过程中，我们难免还需要翻阅开源产品的文档。因为各种原因，包括部署在GitHubPages上的文档的访问体验都一言难尽。在浏览文档的
教你用Python搭建一个属于自己的AI聊天机器人酒酿小小丸子人工智能 python 机器人开发语言学习
如何使用ChatGPTAPI近年来，人工智能（AI）的发展日新月异，而聊天机器人（Chatbot）则是AI领域的明星应用之一。今天，我们将深入浅出地介绍如何使用ChatGPTAPI，构建属于自己的智能聊天机器人的基础。一、准备工作注册OpenAI账户要使用ChatGPTAPI，首先需要在OpenAI官网（https://www.openai.com）上注册一个账户。完成注册并登录后，通过（http
09｜链（下）：想学“育花”还是“插花”？用RouterChain确定客户意图知春秋 LangChain实战 python
09｜链（下）：想学“育花”还是“插花”？用RouterChain确定客户意图任务设定首先，还是先看一下今天要完成一个什么样的任务。这里假设咱们的鲜花运营智能客服ChatBot通常会接到两大类问题。鲜花养护（保持花的健康、如何浇水、施肥等）鲜花装饰（如何搭配花、如何装饰场地等）你的需求是，如果接到的是第一类问题，你要给ChatBotA指示；如果接到第二类的问题，你要给ChatBotB指示。我们可以
WeNet语音识别调用通义千问陈增林语音识别人工智能通义千问
WeNet语音识别调用通义千问WeNet语音识别对通义千问（Qwen-72B-ChatBot）调用，首先通过WeNet将用户的语音输入转录为文本，然后将此文本输入通用问答模型以获取答案。本人原创作品，体验一下连续对话WeNet语音识别部分：使用WeNet库将录制的语音转换为文本。通过载入中文模型(chs_model)并使用其功能，对录制的语音进行转录处理。生成的文本作为用户输入被传递到下一步。Qw
字节跳动推出的 AI 工具：Coze，无需编程基础，快速创建 AI Chat Bot，功能堪比 GPT4.0 神码观察开源推荐 windows 开源
今天给大家介绍一款由字节跳动公司推出的人工智能工具：Coze。它是一个应用编辑平台，用于开发新一代AIChatBot，无需编程基础，就可以快速创建各种类型的ChatBot，并将其发布到各类社交平台和通讯软件上。据说该工具提供了免费的ChatGPT3.5和GPT4的功能，其功能可与GPT4.0相媲美。接下来看看这个工具都具有哪些强大的功能1.多种插件工具集Coze集成了超过60款各类型的插件。包括，
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

小哥哥，检索式chatbot了解一下？

小哥哥，检索式chatbot了解一下？

1. 扫盲

2. 检索式模型的套路

3. 论文串烧

必须要提的：Multi-view model

一次大大的进化：SMN model

utterance也要深度encoding！DUA model

state-of-the-art：DAM model

总结

文章被以下专栏收录

推荐阅读

关于SLU（意图识别、槽填充、上下文LU、结构化LU）和NLG的论文汇总

真正的完全图解Seq2Seq Attention模型

BERT相关论文、文章和代码资源汇总

模型汇总24 - 深度学习中Attention Mechanism详细介绍：原理、分类及应用

29 条评论

你可能感兴趣的:(chatbot)