PaperWeekly

图灵测试70载，回顾对话机器人的经典实践和最新进展

本文内容整理自 PaperWeekly 和 biendata 在 B 站组织的直播回顾，点击文末阅读原文即可跳转至 B 站收看本次分享完整视频录像，如需嘉宾课件，请在 PaperWeekly 公众号回复关键词课件下载获取下载链接。

作者介绍：卢栋才，来自华为云语音语义创新 Lab，博士学位，毕业于中国科技大学，曾获世界机器人大赛冠军，所负责的家庭服务机器人可佳和佳佳机器人在国内外有较高的影响力。曾研发的知识图谱问答技术，获得 CCKS2019 的技术创新奖，2020 年联合组织了一个 CCKS 相关的评测任务。同时，在一些机器人相关的会议和期刊上发表过一些论文。从 2012 年开始从事人机交互系统的算法，包括系统的研发，目前致力于华为云对话机器人平台相关工作。

从 1950 年图灵测试的提出到现在，对话系统已经走过了将近 70 年的时间，在这期间对话系统技术得到了快速的发展。方法也从当初的规则演变成如今的深度学习方法，对话系统的鲁棒性和准确性都得到了大幅提升。

2020 年，自然语言处理顶级会议 ACL 被接收论文中，对话系统相关工作论文数量达到历史之最，这也进一步验证了对话系统最近几年得到了非常大的关注。

本文将围绕对话机器人相关技术及其在行业中应用实践展开，同时介绍华为云对话机器人在多模态、小样本、预训练方向上的最新进展。将按照以下 5 部分展开：

对话机器人介绍以及历史简单回顾
对话机器人中的自然语言理解
对话机器人中的对话管理
多模态对话机器人进展
对话机器人未来方向以及总结

对话机器人介绍以及历史简单回顾

回顾对话机器人的发展历史，首先要提及的就是著名的图灵测试。1950 年图灵发表了一篇论文《计算机器与智能》，首次提出了对人工智能的评价准则，也就是图灵测试。其含义是指测试者和被测试者，通常是一个人和一台机器，在彼此分隔的情况下，由测试者通过一些装置向被测试者随意提问。

如果经过一段时间的交流后，有超过 30% 的测试者不能区分出哪些问题是由人或机器回答的，那么就证明这台机器通过测试，并且认为机器具有了一定的人类智慧。虽然说用图灵测试来评测对话系统目前存在很多的争议，但不妨碍图灵测试的思路引领了几十年间对话系统的发展。

图灵测试诞生后第一个人机对话系统是 ELIZA，由 Weizenbaum 于 1964 年到 1966 年间在 MIT 编码完成。ELIZA 主要是用在临床治疗中去，来模仿心理医生对患者提供咨询服务。当时只是用一些关键字的识别，但反响还是比较大的。时间跨越到 1995 年，业界诞生了一个非常聪明的，而且很有大众知名度的对话机器人 Alice。

Alice 三次获得了罗伯纳奖。罗伯纳奖是重要的人工智能的竞赛，采用的是标准化的图灵测试，评审会选出参赛程序中最像人类的。Alice 的成绩为什么如此惊人？主要原因在于其使用了 AIML 语言，在当年和同类产品相比具有很大的的竞争优势。

总结这时期对话机器人的功能，基本都是基于关键字的识别，或者是通过专家系统的规则来构建的对话系统。但是，随着专家系统规则的演变，逐渐地出现了瓶颈。而基于数据驱动方法就得到很广泛的研究，并且慢慢地应用到了对话系统中。这一时期的对话系统主要是由自然语言理解这个模块来驱动，同时会结合基于强化学习的对话管理。

为了解释它为什么是由自然语言理解和对话管理来驱动这个问题，研究者们做过两个典型的工作：在 2005 年到 2013 年，剑桥大学的 Steve Young 教授提出了基于 POMDP 的对话管理，以及一个基于管道 Pipeline 方式的对话系统。

这一时期，基于机器学习自然语言理解方法百花齐放，出现了很多经典的机器学习模型。

上文提及的剑桥大学 Steve Young，就是现在苹果手机里面后台的 Siri 之父，为后续的深度学习的方法的对话系统研究，包括应用落地，打下了非常坚实的基础。基本上形式化了很多对话系统的经典的问题。但是随着后面的发展，基于传统的机器学习也很快遇到了瓶颈，特别是在语音识别和图像分类方面，准确率无法得到很大的提升。

所以在第三代的研究中，这些系统基本上转向了基于大数据和深度学习的技术。比如现在大家熟知的，Amazon Alex、Google Home、Siri 这些助手类机器人。它们其实主要是以深度学习方法，即意图的识别、语言理解的方式。基于深度学习技术，使得端到端的对话系统变得可行。

最近的几年的研究中，端到端的对话系统得到了越来越多的关注和投入。2017 年开始，对话系统已经开始大规模在行业落地应用了，也有人称 2017 年是对话机器人的元年。

那么，为什么需要对话系统、对话机器人呢？对话机器人到底有什么用？我们为什么要研究它？这点要从对话机器人巨大的需求背景讲起。

需求主要是在两个方向，一个是 to B，另一个是 to C。to B 场景比如企业客服，客服人员的劳动是简单重复的，可以用对话机器人自动客服取代人类客服。

其二是办公助手，像华为 Welink，即类似钉钉、微信、WeChat 一样的办公类软件，其实也有一部分可以去辅助人触达一些应用。这种办公类的助手，可以帮助订机票，新建日程。还有一个方向是市场销售，机器人也可以帮助企业做一些推销、销售、介绍产品。

对于 toC 来说，一个典型的应用是个人助理，特别像家里会涉及到音箱等，这些个人助理现在有很大的应用背景。包括针对老人、小孩等特定人群的情感陪护需求，相对应的可以开发情感陪护的机器人。甚至有些机器人可以与小孩进行同步学习，教小孩一些课程，做一些娱乐的活动。

那么什么是对话机器人？首先通过最后三个字 “机器人”，第一个想到可能是一个实体机器人。

确实，实体机器人可以做人机对话交互，特别像科大可佳机器人，能够做一些多模态交互，给人类情感上一些陪护，甚至机器人它可以根据人的指令去做一些家居的控制，科大的可佳机器人可以去操作冰箱、微波炉，可以听懂人的指令去操作环境上的一些物体，另外类似日本的阿森姆机器人，这一类机器人就是实体类的硬件机器。

还有一类是虚拟的软件机器人，它可以部署在我们的操作系统里面，像微软的 Cortana。也可以部署到硬件里面，甚至是手机里面，像 Siri、Amazon Alex。

总结一下，对话机器人主要的目的是希望能够通过多轮对话的方式帮助用户完成任务，或者是保持用户持续的一个有效的交流，并且可以部署到大量的硬件设备里面去。

这里将对话机器人做两个分类，第一类是任务完成型的对话机器人，第二是闲聊型对话机器人。上图表格是两种机器人的对比，我们可以称之为一个是理性机器人，一个是感性机器人。

任务完成型对话机器人它可以偏理性一点，它需要去做一些任务。通常它可能需要调用一些知识库，或者一些服务后台的 API。

但感性机器人即闲聊对话机器人，对产品层级来说，它可能会更偏向于感性一点，需要理解用户的一些情感。任务完成型对话机器人它一般都有特定的目标，因为它确实需要完成一些具体的任务。闲聊对话机器人它通常是没有特定的目标的，它会跟你一直持续的聊下去。

而且从对话轮数控制来说，任务完成型对话机器人它希望是对话轮数越少越好，因为越少越好，能更快地达到目标。闲聊对话机器人它可能希望能够跟人对话次数越来越多，而且能够持续的交流下去。

任务完成型对话机器人它通常包含多个模块，而且可以采用规则或者统计学习的方法。但闲聊对话机器人它通常采用一些检索，或者是 sequence to sequence 的生成方法，这是这两类方法的不同点。下文将重点在任务完成型这一类机器人上展开内容。

从历史角度看，从图灵测试到现在已经 70 年过去了，对话机器人这一领域目前还是存在非常大的挑战。大体总结为以下几点：

首先，语言的多样性非常复杂，一个含义可能有各种各样的表达。同样，同一个表达，在不同的语境下代表的含义可能不一样，也就是语言的歧义性。

语言的多样性和歧义性会给对话机器人的进展带来非常大的挑战。

此外还有语义的表示，首先需要让机器去理解语言，而语言本身的符号是无法被机器所理解的，需要把符号转换成机器的内部表示。那么内部表示怎么定义呢，什么样的内部表示才是丰富的呢。但是表示越丰富，对应的学习能力可能越弱，反之表示越弱，可能学习得越快，这需要如何权衡呢？

再者是系统的鲁棒性，关于精度和召回的平衡。对话机器人也面临着一个问题，特别是在 to B 场景里面数据是极度匮乏的，在没有数据情况下，如何去进行训练，如何去做模型的调优，如何保证它的鲁棒性？还包括现在深度学习的可解释性，面对符号和环境知识的桥接。

当机器人跟人对话时，它一般会建立在共同的知识基础上，大家都知道中国的首都是北京，但如果机器人不知道这个知识，那它怎么跟人继续交流呢？

上图是一个对话机器人常用的框架流程，主要分三个模块。

第一块是自然语言理解，自然语言理解的目的就是将自然语言文本转成机器内部语义表示。任务型对话它通常有个假设。假设语义表示，它是由三个语义元素来组成的，一个是领域、一个意图、一个槽。

一个领域通常是包含多个意图，比如天气这个领域，有可能查天气，有可能查温度，有可能是查风向，这些不同的意图，通常一个意图上可能有多个槽，我说查天气它查的是什么呢？可能有时间、可能有地点，槽可能是任务型对话里面的概念，大家可以认为槽是一个关键字的这样一个关键信息的概念，类似于时间、地点，也可以是用户定义的任何的一个词条类型。

这里举个例子，当用户说：“今天深圳天气怎么样”，自然语言理解的任务就是需要识别出来这句话里面领域和意图是什么。所以输出领域为天气，意图是查天气。句子中提取到时间和地点槽位，时间是今天，地点是深圳。通常在实际落地应用里，还需要把时间今天翻译成一个真正的一个时间表达，比如说 2020 年 8 月 26 号。让后台系统方便对接。

自然语言理解模块之后，进入对话管理的模块，其中包含两个子模块，对话状态跟踪和对话策略。从对话管理职责来看，这一步的输入就是自然语言理解模块的输出，输出是一个 action，action 表明系统应该去做什么，应该回复给用户什么东西，而且这个生成的 action 一般是一个形式化的、结构化的内容，所以说它一般会再经过一个自然语言生成的模块。

自然语言生成模块的目的就是把对话管理的输出，转成一个用户能够理解的自然语言描述，这个时候它会生成一个回复就是：“好的，今天深圳的天气是晴，温度 20~30 度。”这么一条自然语言描述。这就构成了非常典型的对话机器人的常用框架。

重点来看，对话管理又可细分对话状态跟踪和对话策略模块。对话状态跟踪的意思就是需要输入自然语言理解的结果，同时需要去更新机器里面内部维持的状态，它状态跳转到什么地方了，而且每一个槽的值发生了什么变化。

比如说像这里面已经知道时间是今天，地点是深圳，当没有获取到这个信息的时候，它之前的时间、地点肯定是空的、未知的，当接受到这个信息，需要去更新它，时间，原来是今天，地点是深圳，这就是对话状态跟踪需要做的。

对话策略就是需要根据这些机器人里面的状态，去选择一个行动，这个行动就需要去反馈给用户，图上所示就是通过状态的结果，去生成一个 inform 动作。

对话机器人中的自然语言理解

那么，华为云在自然语言理解方面有哪些实践、进展？首先来讲讲对话机器人中的自然语言理解模块。

自然语言理解模块任务包含三个任务，一个是领域识别，一个意图识别，一个槽填充。

领域识别、意图识别其实它任务是一样的，都是一个分类任务。在上图的圆圈里，是我们涉及到的一些典型的算法，在领域、意图识别里面。左下角就是一些规则的方法，前面对话机器人的历史介绍的时候有提到过，主要包括一些关键字的识别，正则规则，然后上下文无关文法。这一块其实工业界机器人平台也有在使用。

上图左上角是传统的机器学习方法，像传统的 SVM、决策树，甚至 LR 的一些方法。到后面深度学习里面用的比较多了，像 TextCNN,Fasttext，包括 R-CNN。从最近几年趋势来看，其实预训练已经开始流行了，甚至分类识别的一个任务的范式其实已经发生改变了。像基于 BERT，华为的 NEZHA 这样的预训练的模型加微调方式，都可以很好的去做这类任务。

针对一些平台级的，特别是 to B 的场景，有很多不同类型的场景，因为有些企业可能没有数据，有些企业数据量不多，而有些企业确实随着日志的产生，它有很多数据。针对不同的数据，不可能一上来就套用BERT或一个预训练模型，这种方法是不太可行的。

针对这些不同情况我们做了一些探索。先看如果在无样本情况下，如何做这样的领域一种识别，所以说华为云的一些对话机器人技术平台上，其提供了一些规则的方式定制，因为规则的话，一旦配置一条规则，其实它能泛化识别出大量的文本，在规则里面提供适配的一些通配符，包括它可以配置一些槽位的字段，甚至一些普通的字段，普通字段可能是一些 word，包括用户自己的字典，这些都可以配置。

右边是给的一些示例，通过这些规则配置，我就可以做一些冷启动的方式。即使在这个用户没有训练数据的情况下，也有很大的帮助。

第二种情况，有很多数据时如何选择最好的方法呢？这就要用到最近几年众人熟知的，通过预训练加微调的方式，像上图右边这种方式，基本的结构是 transformer，transformer 之后输出了一个CLS标签的 Logits，后面接个全连接层，来预测做分类。

这种任务通过大量的实验后发现确实效果比较好，比如云上办公软件华为 Welink。

Welink 有一些助手的意图，在 80 多家意图里面，每个意图给它分配 10 条语料、50 条语料、100 条语料，然后把所有语料放进去，它的效果确实不断递增，而且最终效果基本上可以达到 95% 以上的效果。如果你数据越多，它效果确实会答的非常好。

不过存在一个问题，即部署成本较高。因为如果每个用户都上一个 BERT，成本上的压力是很大的。虽然说它是通过预训练的方式加微调，但仍然需要交大量的数据。

我们有没有其他方法去解决呢？有的，可以使用一些模型蒸馏的方法来解决，例如上图 Tiny-NEZHA 这样一个蒸馏的方式去把大模型去蒸馏到小模型里。

NEZHA 其实跟 BERT 本身模型上其实差距不是很大，都是基于 transformer 的结构，但它有一些细微上的结构上的不同，一是可能采用一些相对位置编码，第二个就是字掩码，因为字掩码可能是字，或是基于词级别的掩码，和增大 batch size 可能会用一些混合精度训练，包括 LAMB 优化器，这四点可能会有点不一样。

第二块就是我们的蒸馏技术 Tiny-BERT，会在两个地方都做蒸馏，一个是在预训练中的通用蒸馏，通用蒸馏即在训练里面也可以做蒸馏。第二个就是在任务相关的其实也可以做蒸馏，也做了一些数据增强的工作，中文系列模型 NEZHA 的话已经也开源了，代码和模型可以公开下载。

蒸馏方法如何实现呢？首先要想清楚学什么，其次知道怎么学。因为大模型 teacher 和 Student 原本就可以学很多向量的表示了，向量生成的一个表示，包括本身的隐藏 State 等都可以去学。

每个层学的方向不一样，在输出层，可以通过传统的 logits 学生模型的预测层的 logits 上去拟合 logits，在中间层，就是一个 Embedding 层的一个蒸馏，可以去用 MSE 去不断的去逼近中间层的表达。

通过这几种方式，其实在 NLPCC 任务里面其实也做了很多这样的蒸馏实验，包括大小模型、高瘦模型、矮胖模型等，还包括如下面表格里面，在 4 层在 6 层在 8 层里面它的一个对应的效果。最终结果还是看上图的右上角，在 ChineseProve 这样一个小模型任务，我们最后 score 达到 77.7 分，拿到第一位。

假如需要再轻量级的模型，是否还有其他方法？对工业界来说，可以结合一些传统的特征，也可以结合一些深度的特征。传统的特征例如语言模型、词性、实体，包括同义词、停用词这些都可以利用上，而深度特征像 word2vec，包括结合一些浅层的深度学习的编码器等都可以实现。

第二个问题，在没有大量的数据前提下，也就是小样本场景下的领域意图识别如何处理。这种情况下，随时会加一些新的类别，而且新的类别下可能几条数据，无法跟之前的数据一起训练。

这种情况下学界提出小样本学习的概念，其目标是只需提供你若干个样本（可能是 1~5 个样本），根据这 1~5 个样本去学习，来判断这个类别是什么。

小样本学习的思路分两个过程，一个是元训练的阶段，这一步非常简单。有一个基本的训练数据后，把这个基本的数据划分成两个集合，一个是支撑集，一个是询问集，支撑集里可能是每个类别是非常有限的，只能 sample 句子，k 通常很少很少可能 1~5 个， Query 可以自己选。最后元测试的阶段就随机去采 1 到 5 个样本，再输入一个 Query，通过这批小样本是不是能够预测正确。

小样本学习有三种不同类型的方法，像刚见过的基于模型的，还有基于 optimize的优化的方式，此外还有基于度量的方式。我们在度量方式做了一些探索。

度量方式分很多种，比如 MatchingNet 是匹配的网络；原型网络 protoNet，唯一的不同就是 distance 计算不太一样，此外还有 relationnet。我们在小样本上跟传统的 BERT 预训练加微调的方式确实做了对比。

在十个类别、五个样本都做了一些对比的实验。BERT传统分类有 83.2% 准确率，但小样本学习的方法可能达到 93% 的准确率，提高确实比较大。最终十个类别十个样本最终能达到准确率 96% 的效果。

同样，在实验的过程中也发现了一个问题，为什么它能达到准确率 96%？这背后有个取巧方法，目前小样本学习也存在这样的现象。在已有框架下是每个 Epoch 的训练测试数据其实是随机采样的，当有 2000 个类别时，随机采 5 个，而数据本身包含大量简单样本时，这样的采样方式很难涵盖到其中的困难样本，所以实际效果十分存疑。

为此，我们也做了实验，提出了一个结合小样本学习和课程学习的方法。方法分为几部分，一部分先做难度的评估。我们可以采用 BM25 或 TFIDF 计算一下每个样本之间的差距，专挑那些难的样本放在一起来学习。另一部分做数据划分，可以把相似难度的数据划分到一起。

在之前的实验里面，直接用难的样本去训练效果如上图所示是非常非常差的。

换一个思路，在能够保证测试级别比较难的基础上完成学习训练，但发现效果还是会下降得很快。而前文讲过测出来可能会达到准确率 96% 的效果，但这样分析和实验后，会发现真实的小样本学习其实没有这么好的效果。为了解决这种情况，就要结合课程学习，不断从易到难。

最终如上图，提高三到六个点的准确率，目前工作也在也在持续地进行中。

可以得到的结论是，在简单数据上，课程学习虽然不能显著提升效果，能提高 3 到 6 个点的准确率，但确实可以降低方差（方差就是说原本我随着训练的难度，测试难度越大，好跟不好差距特别大），而且直接使用传统的小样本学习的方法，在难的样本里其实并不能取得很好的效果，之前能达到准确率 95% 这样的效果其实是不可信的。同时加入小样本加课程学习，在难样本上提升效果比较明显。

再来看槽填充方法。比如说用户想要预定明天去北京的机票，机器人需要提取出来 time 是明天，而 destination 是北京，通常在实际使用中明天可能会需要转成一个具体的时间表达，这样一个任务可以转换成一个序列标注任务

在线上场景中除了可以采用 CRF、LSTM-CRF、BERT 这些模型，一般情况下有一套完整流程，通常对话前会内置一些实体，首先会做自定义的实体识别，其目的在于作为一个实体的归一化和做细度的特征提取，之后才会输入到模型里，来提高模型的泛化能力。同时还会结合槽填充的规则做融合，得到输出结果。

应用场景中，槽填充会有哪些问题呢？首先是时间归一化，时间表达会比较多。另外不同的客户人名可能不太一样，人名表达也具有多样化，不同用户人名的识别也会带来一些难度。同时模型和规则的融合方法也存在挑战。最后就是多轮中可能会有一些槽填充的问题。新平台里面需要内置一些槽位，这样用户用起来可能会比较方便、简单。

从上文可以看出，将领域识别、意图识别槽填充拆开出来当多个任务会带来一些问题：

领域识别和意图识别会产生错误，槽填充也会产生错误，经过一层一层 pipeline 可能会叠加一些误差。这个时候可以采用多任务模型的方式，即把这三个标签信息、三个语料同时去放到一个模型里面去学习；

如上图模型，融合 bert 和 crf 对领域、意图、槽联合建模，实验结果也证明确实会带来较大的提高。传统的 CRF 模型可能效果确实不是很好，最后的 ChunkF1 可能只能达到 0.79 的准确率。通过 BERT 它可能达到 0.87 的准确率。加入领域识别槽填充这一系列后，最后的 ChunkF1 大约能提高大概两个点。

对话机器人中的对话管理

为什么对话机器人需要对话管理模块呢？为什么不直接用自然语言理解直接对接服务 API？对话管理模块存在很有必要，而且是对话系统的核心，其原因在于用户很多情况下不会一次性表达完意图，同时系统各个模块的准确率，也并不一定能达到 100% 的准确。

不管是语音识别或者自然语言理解本身解析都可能产生错误，导致反馈不正确的回复，或者根本就不知道怎么回复。这两种情况都需要机器人跟用户进行多次的交流确认，才能获取用户的完整的意图，也就是需要对话管理模块来完成这部分工作。

对话管理一般分为状态跟踪和对话策略的学习两部分。状态跟踪就是用来跟踪用户的目标，比如用户当前说了什么、之前说了什么。上图左边是一个简单的状态集合，包括可能有一些相关的状态之间跳转，可以看到通常会有状态如何跳转的先验知识。

右边的结构是随着用户跟机器人的对话同时进行的。用户说 “我要预定明天去北京的机票”，这时用户状态从空就跳到了目的地出发地这样一个状态，并随着问题交互的进行，直到填充所有的槽位。这样一个过程是通过状态跟踪来做的。

再来看对话策略，对话策略的目的是告诉机器人应该说什么。看一个例子，按照上图红色框所示，根据输入的当前状态的信息，用户已经输入目的地了并告知了出发时间，系统应该去判断，发现出发地是未知的，这时的策略也很简单，提问 “请问从哪里出发？” 而不是 “请问去哪里？”。

对话管理任务到底存在哪些问题和困难呢？

首先是用户的意图是无法事先知道的，用户随时可能会说任何其他的话，甚至调戏机器人。所以机器人很难捕捉到用户真实的意图，甚至要面对用户可能会随时切换意图的可能。

第二，真实环境中噪音比较大，导致对话管理获取到的信息并不是用户真实表达的含义。

第三，绝大部分领域的意图槽位内容会很多，比如时间或者其他数字信息是连续的。如果要用模型真实建模来跟踪所有可能的状态，传统的方法基本上不可用。要建模所有可能的状态，并在状态之间跳转，需要枚举所有可能的语料，这本身是一个统计学问题。

对话管理本身方法也有很多。从上文讲过的历史来看，首先想到的是状态机的方法，像比如说上图左边的 S1，用户从 S1 状态下定义我在 S1 状态下它应该做什么行动，可以 forward，可以 backward，可以 left，可以 right。

当执行了 forward，就会到达 S3 状态，这个时候就完成了一轮的交互，这就是一个通过状态机的方式去实现的对话管理。对于状态怎么跳转，包括状态下应该做什么行为，都定义得非常清楚。

第二种，假设有 10 个槽，那个槽里面很多值，一一列举两种组合或者几种可能，其空间是非常大的，导致维护起来很困难。解决这一问题的思路之一是基于槽的框架的方法。

我们来看看大致思路，首先对模型做简单的形式化，认为槽跟槽之间是独立的，与所填的值无关，在没有填槽情况下，就进行提问，填充后就不问，多轮交互之后提问结束，目前很多企业，包括成熟的大企业和创业公司，很多都会采用槽的框架的方式。

不管是基于状态机还是槽框架，本质上都是一套规则，而历史上后续 Steve young 教授提出一个基于数据驱动的对话管理方法，本质上来说就是把对话管理当做一个部分马可夫决策过程，POMDP。如果大家感兴趣可以看一下 Steve Young 于 2013 年发表的非常经典的综述论文，主题就是 POMDP 的对话管理。

沿着历史的脉络梳理，这之后开始深度学习的方法就比较多了。目前效果最好的、比较经典的是 trade 模型，该模型获得了ACL2019 的 outstanding paper，作者把对话状态跟踪的任务建模成生成任务，首先把历史信息编码成向量，同时会把领域槽进行编码，最后融合生成对应槽的值。

当年这篇论文获得很大的成功，效果确实比较好。另一个典型的例子是上图右边基于强化学习的对话管理，把对话策略建模成深度强化学习的问题。

随着预训练火热之后，用 BERT 也能够解决对话状态跟踪的问题。可以通过 Bert 阅读理解技术，预测用户所说的话里面每个槽位的 Start pos 和 end pos，最终提取槽的值，同时它会再联合一个分类的任务去做联合模型。但是在真实场景中是没有标注数据的，所以我们一般会通过仿真器和一个机器人进行交互，这种交互的方式可以生成大量对话数据，同时也建立了一个访仿真器。

通过这个仿真器，可以生成很多对话样本。现在根据我们的意图和槽位，生成大概有 7000 多个对话样本，训练集里面大概有 3000 多个对话样本，最后通过 Bert 阅读理解分类联合方式，它的跟踪准确率可以达到 90% 左右。但这也存在一个问题 —— 生成的数据可能无法很好地模拟真实的情况。

针对对话策略来说，现在工业界绝大部分用的都是这种对话逻辑、对话流程的方式。因为在 toB 场景中，它的对话选择很丰富，刚开始在某个状态下，用户说任何一个意图，它可能会跳转到任何一个状态，它的行为会很多。

如果把它建模成一个真实的强化学习问题，第一对数据量要求很大，虽然也可以通过仿真生成数据，但它也需要很大的数据量。其次真实场景的一个行为空间是很大的，所以很难通过一个强化学的方式去模拟它。

但是在对这种对话流程方案进行设计的时候，也要解决很多实际上的问题。一个是槽位记忆的问题，它需要支持不同意图槽位之间的关联，例如在订票时，已经说了时间地点，那么在说查天气的时候它不应该反问你要查什么地方的天气。第二个是意图记忆的问题，它需要支持多轮的意图识别。例如用户在问天气时，问 “那上海的呢？” 就会利用多轮的信息识别成天气意图。

对话系统可以拆成语言理解、状态跟踪，和对话策略。其实自然语言理解也能够融入到对话管理里，深度学习已经允许把对话系统建模成端到端的方式。

有两个经典的工作，一个是 HRED，它把对话系统建立成双层的端到端的网络，第一层用来编码对话文本历史，第二层用来编码对话状态。这种方法比较粗暴，来了文本就直接编码，然后历史信息传递下去。

还有一个比较经典的工作是 Steve young教授团队的，它看起来是端到端，还是分局部的模块，特别像 pipeline 的方式，它先做一个意图的检测，也就是意图的网络，再做一个叫做 brief checker 的槽填充，最后再从 database 里面去做一个搜索，最后这三个信息融入到 policy network ，policy network 可以认为是对话策略网络，最后去生成它的一个回复，这样一个局部的端到端的任务型对话系统，比前面一种方法更好理解，而且解释性更强。

这就是两个比较经典的端到端的对话管理，那么针对未来的人机对话方式，怎么去设计一个更好的端到端对话系统架构呢？是不是仍然采用之前这两种方式？未来的人机对话的方式到底是什么呢？

多模态对话机器人进展

多模态自然人机交互系统是下一代人机交互系统的一个发展趋势，它可以融合视觉、听觉、触觉、嗅觉甚至味觉，表达的效率比单一的视觉甚至单一的文本丰富性更强。多模态自然语言人机交互的对话模式，是目前最为自然而且最理想的人际交互方式。

之所以研究多模态对话系统，是因为真实环境里的语音识别引擎带来的错误很难避免，同时它带来的语义歧义性也特别大。那是不是能够在理解语言的基础上，融合其他模块的信息，比如视频图片，引入一种多模态信息融合就能够提升计算机对用户意图的理解的准确性呢？

多模态对话的应用目前不是很多，但也有文章对此进行了研究，一个是情感感知对话系统，在驾驶时，驾驶员需要集中精力去关注路况，但是他很难腾出手去操作一个界面，这是一个很经典的多模态问题，它可以通过驾驶员，可以通过口头或者是视觉的提示，甚至是语音文本，驾驶时语音识别效果可能会更差，那么能不能通过视觉的信息，手势的信息去理解，这是一个非常典型的场景。

中科院自动化研究出了一个多模态自然语言口语对话系统，它可以结合人的一些表情手势姿态去进行对话，但本质上这几个应用场景还是一个模态之间的串联，它其实没有做到很好的模态之间的融合。所以我们一直在调查研究是不是可以做模态的融合。

通过调查，发现电子商务其实有这样一个场景：用户说 “我要买裤子，我要买衣服”，他还会发送一些样本图片，然后机器人也同时会反馈一些图片给他，这就是天生的一个文本加图片的方式，它可以构成一个多模态对话的流程。

多模态的简单定义是，给定多模态对话上下文，包括用户的询问，目标是生成对应的系统的文本回复。针对上文电商的场景，提供的可能只有文本跟图片，当然后面都可以扩充，还可以加语音甚至其他某些信息，那么这里面可能不含图片。它形式上就是你只需要输入一个历史上下文，再加上用户的 query，需要生成的是系统的回复。

对于端到端的对话管理，也可以使用 HRED 模型，该模型非常简单，但是它仅支持单模态。在 HRED 里面，只需要把图片信息加入，把图片编码，编码之后再融合文本，文本通过 RNN 得到向量，把这两个拼接在一起，再通过一层上面的 RNN，这就是现在用的比较多的基于 HRED 构造的多模态的 HRED 模型。

后面对模型进行了改进，第一使它可以在生成里面进行控制，经过意图的理解，去控制生成一个简单、通用的回复，也可以去生成一个多模态的、知识相关的回复。第二个改进点，可以在生成过程中融合一些知识进来，比如说三元组这些信息或者属性表格，会比较好地控制生成的质量。但这几个模型，也存在比较大的问题。

这里列举的两个经典论文提及的这些方法都是基于层级循环的神经网络。这个方法的模态融合很弱，是把句子编码成一个向量，其实这会损失句子里面的细度信息，比如说关键字实体。

另外一方面虽然使用了属性三元组，但其实并不能很好地有效利用这些知识，即知识的利用率比较低，所以华为采用了一种叫做 MATE 的模型，它是基于语义元素集的、上下文依赖的一个多模态对话系统。将模型拆开来看，左边是一个多模态元素集的编码器，用来编码来自对话历史的记录，包括用户查询的所有图像，都存储在对话记忆模块。

为什么存在图像记忆模块？因为有些当前的文本看不到前面的图片，所以说这里面会做一个 attention 操作。通过注意力机制或者图像的一些文本的嵌入，有选择性的是否加入一些图片。

最后所有嵌入都会拼接成多模态的语义元素集。这样每个元素跟图片里面的元素都可以进行一个很好的交互。第二块是右半部分，它是一个解码过程，解码过程可以分两步。

第一步先关注在编码器里面输出，它只关注前面生成的注意力操作。第二阶段，解码之后再结合领域知识，再做一个 attention 操作，这样能够进一步很好地去利用这样的知识，而且同时会利用好前面的一个编码器的输出，这样能够进一步地优化系统回复的质量。

上图是我们论文的一个实验结果，实验发现如果使用第一种解码器和第二个解码器，确实有一些提高。同时我们第一阶段的编码器，相对于前面所有方法中最好的方法，在 BLEU-1 上能提高 6 个点，在 BLEU-4 上能提高 9 个点，而且是绝对值的提升，这个提升是非常大的。

同时下面的表格，把不同的模块进行替换，进行进一步的分析，包括在去掉 image position，previous image，knowledge 的情况下进行的对比。

上图是展示的一个样例。它关注了语义元素集的信息，左下部分、右下部分， formal shoes 能关注到更上层的比较关键更元素集的一些信息，包括 star。

对话机器人未来方向以及总结

以上就是我们在对话机器人上的一些进展和工作。针对机器人的这个行业来说，我们是希望每个人都能享受到对话人机交互的乐趣。即使跨洋彼岸，机器人也能够跟用户更好地进行交流，甚至机器人能够服务好用户。上图是一张图片，显示器里面是凯文・凯利，右边是科大的佳佳机器人，当时是做了一个跨洋跨语种的对话。但要把这样的事做好，其实是一个很大的挑战。

首先，机器要理解用户，甚至能够理解用户很多开放性的问题，这需要很大量的常识知识，例如上文提及：中国的首都是北京，机器人怎么会知道这样一个知识？真实世界知识太多，如果它能够理解用户各种各样的问题，需要具备大量的常识知识去丰富它的能力。

再者同样比较重要的。也是现在比较流行的个性化需求。每个人的特性不一样，甚至机器人的特性也不一样，如何去依照每一个用户的个性去做不同的、基于个性化的回复，也是目前相对来说研究得比较多，且前景比较好的方向。另外，对于小样本学习需要解决的问题，特别是 toB 的场景企业的问题，挑战是比较严峻的，真实的场景里面企业其实没有太多数据，甚至是没有数据，小样本学习是企业会重点关注的一个问题。

多模态、多领域，预训练，预训练在相对未来一段时间内还是会成为主流。从目前实践证明，预训练加微调的方式效果确实会比传统的深度学习的重新训练效果好很多。再结合现在深度学习的可解释性，有一部分人在研究神经网络与符号类进行结合去解释深度学习，更好地去建模真实的 AI 问题。

然后是无监督学习，无监督学习和小样本学习面对的同样还是企业场景的问题，客户可能没有标注数据，也许会有一些非结构化数据，这些数据怎么用，怎么去学习，也是对话机器人从业者面临的挑战。最后，现在的一些语料，甚至是对话机器人的语料，绝大部分是 2014 年之前的，还是单语种的数据，到最近才开放了多语种的数据集，所以多语种对话机器人也将会是比较好的方向。

关于数据实战派

数据实战派希望用真实数据和行业实战案例，帮助读者提升业务能力，共建有趣的大数据社区。

更多阅读

#投稿通道#

让你的论文被更多人看到

如何才能让更多的优质内容以更短路径到达读者群体，缩短读者寻找优质内容的成本呢？答案就是：你不认识的人。

总有一些你不认识的人，知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁，促使不同背景、不同方向的学者和学术灵感相互碰撞，迸发出更多的可能性。

PaperWeekly 鼓励高校实验室或个人，在我们的平台上分享各类优质内容，可以是最新论文解读，也可以是学习心得或技术干货。我们的目的只有一个，让知识真正流动起来。

???? 来稿标准：

• 稿件确系个人原创作品，来稿需注明作者个人信息（姓名+学校/工作单位+学历/职位+研究方向）

• 如果文章并非首发，请在投稿时提醒并附上所有已发布链接

• PaperWeekly 默认每篇文章都是首发，均会添加“原创”标志

???? 投稿邮箱：

• 投稿邮箱：[email protected]

• 所有文章配图，请单独在附件中发送

• 请留下即时联系方式（微信或手机），以便我们在编辑发布时和作者沟通

????

现在，在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly

PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击「交流群」，小助手将把你带入 PaperWeekly 的交流群里。

你可能感兴趣的:(大数据,编程语言,机器学习,人工智能,数据分析)

算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
AI音乐模拟器：AIGC时代的智能音乐创作革命 lauo 人工智能 AIGC 开源前端机器人
AI音乐模拟器：AIGC时代的智能音乐创作革命引言：AIGC浪潮下的音乐创作新范式在数字化转型的浪潮中，人工智能生成内容（AIGC）正在重塑各个创意领域。音乐产业作为创意经济的重要组成部分，正经历着前所未有的变革。据最新市场研究数据显示，全球AI音乐市场规模预计将从2023年的5.8亿美元增长到2030年的26.8亿美元，年复合增长率高达24.3%。这一快速增长的市场背后，是AI音乐技术正在打破传
LangChain中的向量数据库接口－Weaviate 洪城叮当 langchain 数据库经验分享笔记交互人工智能知识图谱
文章目录前言一、原型定义二、代码解析1、add_texts方法1.1、应用样例2、from_texts方法2.1、应用样例3、similarity_search方法3.1、应用样例三、项目应用1、安装依赖2、引入依赖3、创建对象4、添加数据5、查询数据总结前言 Weaviate是一个开源的向量数据库，支持存储来自各类机器学习模型的数据对象和向量嵌入，并能无缝扩展至数十亿数据对象。它提供存储文档嵌
数据分析常用指标名词解释及计算公式走过冬季学习笔记数据分析大数据
数据分析中有大量常用指标，它们帮助我们量化业务表现、用户行为、产品健康度等。下面是一些核心指标的名词解释及计算方式，按常见类别分类：一、流量与用户规模指标页面浏览量名词解释：用户访问网站或应用时，每次加载或刷新一个页面就算一次PV。它衡量的是页面被打开的总次数。计算方式：PV=∑(所有页面被加载的次数)(通常由埋点或日志直接统计)独立访客数名词解释：在特定时间范围内（如一天、一周、一月），访问网站
提升企业级数据处理效率！TDengine 四个集群优化点详解 TDengine （老段） TDengine 运维大数据数据库物联网时序数据库服务器运维 tdengine
为了帮助企业更好地进行大数据处理，我们在此前TDengine3.x系列版本中进行了几项与集群相关的优化和新功能开发，以提升集群的稳定性和在异常情况下的恢复能力。这些优化包括clusterID隔离、leaderrebalance、raftlearner和restorednode。本文将对这几项重要优化进行详细阐述，以解答企业在此领域的疑问，并帮助大家更好地应对相关挑战。clusterID隔离问题fi
视频分析：让AI看懂动态画面随机森林404 计算机视觉音视频人工智能 microsoft
引言：动态视觉理解的革命在数字信息爆炸的时代，视频已成为最主要的媒介形式。据统计，每分钟有超过500小时的视频内容被上传到YouTube平台，而全球互联网流量的82%来自视频数据传输。面对如此海量的视频内容，传统的人工处理方式已无法满足需求，这正是人工智能视频分析技术大显身手的舞台。视频分析技术赋予机器"看懂"动态画面的能力，使其能够自动理解、解释甚至预测视频中的内容，这一突破正在彻底改变我们与视
Tomcat：Java Web应用的幕后英雄互联网动态分析 tomcat
在当今数字化浪潮中，Java作为一门成熟且广泛应用的编程语言，支撑着无数企业级应用和互联网服务的稳定运行。而在JavaWeb开发领域，Tomcat无疑是一个举足轻重的存在，它宛如一位默默耕耘的幕后英雄，为众多Web应用提供了可靠的运行环境。Tomcat的起源与发展Tomcat的故事始于1999年，当时SunMicrosystems（后被Oracle收购）与Apache软件基金会合作，旨在为Java
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
法律科技领域人工智能代理构建的十个经验教训，一位人工智能工程师通过构建、部署和维护智能代理的经验教训来优化法律工作流程的历程。知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 ai
目录介绍什么是代理人？为什么它对法律如此重要？法律技术中代理用例示例-合同审查代理-法律研究代理在LegalTech中使用代理的十个教训-教训1：即使代理很酷，它们也不能解决所有问题-教训2：选择最适合您用例的框架-教训3：能够快速迭代不同的模型-教训4：从简单开始，必要时扩展-教训5：使用跟踪解决方案；您将需要它-教训6：确保跟踪成本，代理循环可能很昂贵-教训7：将控制权交给最终用户（人在环路中
24GB GPU 中的 DeepSeek R1：Unsloth AI 针对 671B 参数模型进行动态量化知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek ollama
简介最初的DeepSeekR1是一个拥有6710亿个参数的语言模型，UnslothAI团队对其进行了动态量化，将模型大小减少了80%（从720GB减少到131GB），同时保持了强大的性能。当添加模型卸载功能时，该模型可以在24GBVRAM下以低令牌/秒的推理速度运行。推荐文章《本地构建AI智能分析助手之01快速安装，使用PandasAI和Ollama进行数据分析，用自然语言向你公司的数据提问为决策
Llama-Omni会说话的人工智能“语音到语音LLM” 利用低延迟、高质量语音转语音 AI 彻底改变对话方式（教程含源码）知识大胖 NVIDIA GPU和大语言模型开发教程 llama 人工智能 nvidia llm
介绍“单靠技术是不够的——技术与文科、人文学科的结合，才能产生让我们心花怒放的成果。”——史蒂夫·乔布斯近年来，人机交互领域发生了重大变化，尤其是随着ChatGPT、GPT-4等大型语言模型(LLM)的出现。虽然这些模型主要基于文本，但人们对语音交互的兴趣日益浓厚，以使人机对话更加无缝和自然。然而，实现语音交互而不受语音转文本处理中常见的延迟和错误的影响仍然是一个挑战。关键字：Llama-Omni
什么是热力学计算？它如何帮助人工智能发展？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能量子计算
现代计算的基础是晶体管，这是一种微型电子开关，可以用它构建逻辑门，从而创建CPU或GPU等复杂的数字电路。随着技术的进步，晶体管变得越来越小。根据摩尔定律，集成电路中晶体管的数量大约每两年增加一倍。这种指数级增长使得计算技术呈指数级发展。然而，晶体管尺寸的缩小是有限度的。我们很快就会达到晶体管无法工作的阈值。此外，人工智能的进步使得对计算能力的需求比以往任何时候都更加迫切。根本问题是自然是随机的（
上海交大：工具增强推理agent
标题：SciMaster:TowardsGeneral-PurposeScientificAIAgentsPartI.X-MasterasFoundation-CanWeLeadonHumanity’sLastExam?来源：arXiv,2507.05241摘要人工智能代理的快速发展激发了利用它们加速科学发现的长期雄心。实现这一目标需要深入了解人类知识的前沿。因此，人类的最后一次考试（HLE）为评
微算法科技的前沿探索：量子机器学习算法在视觉任务中的革新应用 MicroTech2025 量子计算算法
在信息技术飞速发展的今天，计算机视觉作为人工智能领域的重要分支，正逐步渗透到我们生活的方方面面。从自动驾驶到人脸识别，从医疗影像分析到安防监控，计算机视觉技术展现了巨大的应用潜力。然而，随着视觉任务复杂度的不断提升，传统机器学习算法在处理大规模、高维度数据时遇到了计算瓶颈。在此背景下，量子计算作为一种颠覆性的计算模式，以其独特的并行处理能力和指数级增长的计算空间，为解决这一难题提供了新的思路。微算
中国银联豪掷1亿采购海光C86架构服务器信创新态势海光芯片 C86 国产芯片海光信息
近日，中国银联国产服务器采购大单正式敲定，基于海光C86架构的服务器产品中标，项目金额超过1亿元。接下来，C86服务器将用于支撑中国银联的虚拟化、大数据、人工智能、研发测试等技术场景，进一步提升其业务处理能力、用户服务效率和信息安全水平。作为我国重要的银行卡组织和金融基础设施，中国银联在全球183个国家和地区设有银联受理网络，境内外成员机构超过2600家，是世界三大银行卡品牌之一。此次中国银联发力
【亲测免费】 Mamba：快速跨平台的包管理器林梦雅
Mamba：快速跨平台的包管理器项目基础介绍和主要编程语言Mamba是一个用C++重新实现的Conda包管理器。它旨在提供比传统Conda更快的包管理和依赖解析速度。Mamba的核心部分使用C++编写，以确保高效性和性能。同时，Mamba也使用了Python和其他一些辅助语言来实现其功能。项目核心功能Mamba的核心功能包括：快速依赖解析：利用libsolv库进行高效的依赖解析，这是RedHat、
AI人工智能浪潮中文心一言的独特优势
AI人工智能浪潮中文心一言的独特优势：为什么它是中国市场的“AI主力军”？关键词：文心一言,AI大模型,中文处理,多模态融合,产业落地,安全可控,百度ERNIE摘要：在全球AI大模型浪潮中，百度文心一言（ERNIEBot）凭借“懂中文、会多模态、能落地、守规矩”的四大核心优势，成为中国市场最具竞争力的AI产品之一。本文将用“超级大脑”的比喻，从中文理解、多模态能力、产业生态融合、安全可控性四个维度
全面探索Kafka：架构、应用与流处理
Kafka：企业级消息系统与流处理平台的深度解析ApacheKafka作为分布式流处理平台，广泛应用于大数据处理和实时分析领域。本文将基于其官方文档，详细探讨Kafka的核心功能、应用场景以及如何进行有效管理。背景简介Kafka作为高吞吐量的消息系统，支持企业级的发布-订阅模式。它能够处理大量实时数据，并支持高并发读写操作。本文将依据Kafka官方文档的内容，逐层深入，从入门到高级应用，帮助读者全
Flink时间窗口详解 bxlj_jcj Flink flink 大数据
一、引言在大数据流处理的领域中，Flink的时间窗口是一项极为关键的技术，想象一下，你要统计一个电商网站每小时的订单数量。由于订单数据是持续不断产生的，这就形成了一个无界数据流。如果没有时间窗口的概念，你就需要处理无穷无尽的数据，难以进行有效的统计分析。而时间窗口的作用，就是将这无界的数据流按照时间维度切割成一个个有限的“数据块”，方便我们对这些数据进行处理和分析。比如，我们可以定义一个1小时的时
什么是ORM？它如何简化后端开发？破碎的天堂鸟学习教程数据库
什么是ORM？ORM（对象关系映射，Object-RelationalMapping）是一种编程技术，用于解决面向对象编程语言与关系型数据库之间的数据转换问题。其核心是将数据库中的表结构映射为程序中的类和对象，使开发者能够以操作对象的方式操作数据库，而非直接编写SQL语句。具体而言：映射机制：数据库表→编程语言中的类（如User类对应users表）表字段→类的属性（如username字段对应Use
正义的算法迷宫—人工智能重构司法体系的技术悖论与文明试炼
一、法庭的数字化迁徙当美国威斯康星州法院采纳COMPAS算法评估被告再犯风险，当中国"智慧法院"系统年处理1.2亿件案件，司法体系正经历从石柱法典到代码裁判的范式革命。这场转型的核心驱动力是司法效率与公正的永恒张力：美国重罪案件平均审理周期达18个月，中国基层法官年人均结案357件（是德国同行的6倍），而算法能在0.3秒内完成百万份文书比对。人工智能渗透司法引发三重裂变：证据分析从经验推断转向数据
2023高薪前端面试题（二、前端核心——Ajax）
原生AjaxAjax简介Ajax全程为AsynchronousJavaScript+XML，就是异步的JS和XML通过AJAX可以在浏览器中向服务器发送异步请求，最大的优势是：无刷新获取数据，实现局部刷新Ajax是一种用于创建快速动态网页的技术AJAX不是新的编程语言，而是一种将现有的标准组合在一起使用的新方式Ajax的应用场景页面上拉加载更多数据列表数据无刷新分页表单项离开焦点数据验证搜索框提示
探索实时流处理的未来：Kafka Streams 深度指南秋或依
探索实时流处理的未来：KafkaStreams深度指南项目介绍欢迎进入KafkaStreams：实时流处理的世界！这不仅仅是一本书，更是一个通往流处理领域深层奥秘的门户。由PrashantPandey编著，这本书以ApacheKafka2.1中的KafkaStreams库为核心，为读者铺就了一条从理解基础概念到熟练掌握KafkaStreams编程的路径。无论是软件工程师、数据架构师，还是对大数据处
Elasticsearch搜索引擎存储：从原理到实践的全景解析 Python×CATIA工业智造搜索引擎 elasticsearch 大数据
引言在大数据时代，数据规模呈指数级增长，传统数据库的模糊查询、实时分析能力逐渐成为瓶颈。Elasticsearch（简称ES）凭借其分布式架构、实时搜索和灵活的数据分析能力，成为企业级搜索与存储的核心引擎。截至2025年，ES在全球日志分析、电商搜索、实时监控等场景的市场占有率超过60%。本文将从存储架构、核心技术、应用场景及优化策略四个维度，深入解析Elasticsearch的设计哲学与实践价值
【python实战】不玩微博，一封邮件就能知道实时热榜，天秀吃瓜一条coding 从实战学python 人工智能 python linux 爬虫
❤️欢迎订阅《从实战学python》专栏，用python实现办公自动化、数据可视化、人工智能等各个方向的实战案例，有趣又有用！❤️更多精品专栏简介点这里有的人金玉其表败絮其中，有的人却若彩虹般绚烂，怦然心动前言哈喽，大家好，我是一条。在生活中我是一个不太喜欢逛娱乐平台的人，抖音、快手、微博我手机里都没装，甚至微信朋友圈都不看，但是自从开始写博客，有些热度不得不蹭。所以就有了这样一个需求，能不能让微
python-pandas数据分析+案例分析
文章目录前言一、汽车销售数据可视化分析1.各年度汽车总销量及环比，各车类、级别车辆销量及环比2.车辆销售规模及环比、不同价位车销量及环比3.各车系、厂商、品牌车销量及环比，市占率及变化趋势4.品牌、车类、车型、级别的各top销量二、地质灾害航空公司客户价值分析1.原始数据存在少量的缺失值和异常值前言一、汽车销售数据可视化分析1.各年度汽车总销量及环比，各车类、级别车辆销量及环比importnump
【Kafka专栏 13】Kafka的消息确认机制：不是所有的“收到”都叫“确认”！
作者名称：夏之以寒作者简介：专注于Java和大数据领域，致力于探索技术的边界，分享前沿的实践和洞见文章专栏：夏之以寒-kafka专栏专栏介绍：本专栏旨在以浅显易懂的方式介绍Kafka的基本概念、核心组件和使用场景，一步步构建起消息队列和流处理的知识体系，无论是对分布式系统感兴趣，还是准备在大数据领域迈出第一步，本专栏都提供所需的一切资源、指导，以及相关面试题，立刻免费订阅，开启Kafka学习之旅！
SAX解析xml文件小猪猪08 xml
1.创建SAXParserFactory实例 2.通过SAXParserFactory对象获取SAXParser实例 3.创建一个类SAXParserHander继续DefaultHandler，并且实例化这个类 4.SAXParser实例的parse来获取文件 public static void main(String[] args) { //
为什么mysql里的ibdata1文件不断的增长？ brotherlamp linux linux运维 linux资料 linux视频 linux运维自学
我们在 Percona 支持栏目经常收到关于 MySQL 的 ibdata1 文件的这个问题。当监控服务器发送一个关于 MySQL 服务器存储的报警时，恐慌就开始了 —— 就是说磁盘快要满了。一番调查后你意识到大多数地盘空间被 InnoDB 的共享表空间 ibdata1 使用。而你已经启用了 innodbfileper_table，所以问题是： ibdata1存了什么？当你启用了 i
Quartz-quartz.properties配置 eksliang quartz
其实Quartz JAR文件的org.quartz包下就包含了一个quartz.properties属性配置文件并提供了默认设置。如果需要调整默认配置，可以在类路径下建立一个新的quartz.properties，它将自动被Quartz加载并覆盖默认的设置。下面是这些默认值的解释 #-----集群的配置 org.quartz.scheduler.instanceName =
informatica session的使用 18289753290 workflow session log Informatica
如果希望workflow存储最近20次的log，在session里的Config Object设置，log options做配置，save session log :sessions run ;savesessio log for these runs:20 session下面的source 里面有个tracing
Scrapy抓取网页时出现CRC check failed 0x471e6e9a != 0x7c07b839L的错误酷的飞上天空 scrapy
Scrapy版本0.14.4 出现问题现象： ERROR: Error downloading <GET http://xxxxx CRC check failed 解决方法 1.设置网络请求时的header中的属性'Accept-Encoding': '*;q=0' 明确表示不支持任何形式的压缩格式，避免程序的解压
java Swing小集锦永夜-极光 java swing
1.关闭窗体弹出确认对话框 1.1 this.setDefaultCloseOperation (JFrame.DO_NOTHING_ON_CLOSE); 1.2 this.addWindowListener ( new WindowAdapter () { public void windo
强制删除.svn文件夹随便小屋 java
在windows上，从别处复制的项目中可能带有.svn文件夹，手动删除太麻烦，并且每个文件夹下都有。所以写了个程序进行删除。因为.svn文件夹在windows上是只读的，所以用File中的delete()和deleteOnExist()方法都不能将其删除，所以只能采用windows命令方式进行删除
GET和POST有什么区别？及为什么网上的多数答案都是错的。 aijuans get post
如果有人问你，GET和POST，有什么区别？你会如何回答？我的经历前几天有人问我这个问题。我说GET是用于获取数据的，POST，一般用于将数据发给服务器之用。这个答案好像并不是他想要的。于是他继续追问有没有别的区别？我说这就是个名字而已，如果服务器支持，他完全可以把G
谈谈新浪微博背后的那些算法 aoyouzi 谈谈新浪微博背后的那些算法
本文对微博中常见的问题的对应算法进行了简单的介绍，在实际应用中的算法比介绍的要复杂的多。当然，本文覆盖的主题并不全，比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”，希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作：原创、转发、回复、阅读、关注、@等。其中，前四个是针对短博文，最后的关注和@则针
Connection reset 连接被重置的解决方法百合不是茶 java 字符流连接被重置
流是java的核心部分,,昨天在做android服务器连接服务器的时候出了问题,就将代码放到java中执行,结果还是一样连接被重置被重置的代码如下; 客户端代码; package 通信软件服务器; import java.io.BufferedWriter; import java.io.OutputStream; import java.io.O
web.xml配置详解之filter bijian1013 java web.xml filter
一.定义 <filter> <filter-name>encodingfilter</filter-name> <filter-class>com.my.app.EncodingFilter</filter-class> <init-param> <param-name>encoding<
Heritrix Bill_chen 多线程 xml 算法制造配置管理
作为纯Java语言开发的、功能强大的网络爬虫Heritrix，其功能极其强大，且扩展性良好，深受热爱搜索技术的盆友们的喜爱，但它配置较为复杂，且源码不好理解，最近又使劲看了下，结合自己的学习和理解，跟大家分享Heritrix的点点滴滴。 Heritrix的下载（http://sourceforge.net/projects/archive-crawler/）安装、配置，就不罗嗦了，可以自己找找资
【Zookeeper】FAQ bit1129 zookeeper
1.脱离IDE，运行简单的Java客户端程序 #ZkClient是简单的Zookeeper~$ java -cp "./:zookeeper-3.4.6.jar:./lib/*" ZKClient 1. Zookeeper是的Watcher回调是同步操作，需要添加异步处理的代码 2. 如果Zookeeper集群跨越多个机房，那么Leader/
The user specified as a definer ('aaa'@'localhost') does not exist 白糖_ localhost
今天遇到一个客户BUG，当前的jdbc连接用户是root，然后部分删除操作都会报下面这个错误：The user specified as a definer ('aaa'@'localhost') does not exist 最后找原因发现删除操作做了触发器，而触发器里面有这样一句 /*!50017 DEFINER = ''aaa@'localhost' */ 原来最初
javascript中showModelDialog刷新父页面 bozch JavaScript 刷新父页面 showModalDialog
在页面中使用showModalDialog打开模式子页面窗口的时候，如果想在子页面中操作父页面中的某个节点，可以通过如下的进行： window.showModalDialog('url',self,‘status...’); // 首先中间参数使用self 在子页面使用w
编程之美-买书折扣 bylijinnan 编程之美
import java.util.Arrays; public class BookDiscount { /**编程之美买书折扣书上的贪心算法的分析很有意思，我看了半天看不懂，结果作者说，贪心算法在这个问题上是不适用的。。下面用动态规划实现。哈利波特这本书一共有五卷，每卷都是8欧元，如果读者一次购买不同的两卷可扣除5%的折扣，三卷10%，四卷20%，五卷
关于struts2.3.4项目跨站执行脚本以及远程执行漏洞修复概要 chenbowen00 struts WEB安全
因为近期负责的几个银行系统软件，需要交付客户，因此客户专门请了安全公司对系统进行了安全评测，结果发现了诸如跨站执行脚本，远程执行漏洞以及弱口令等问题。下面记录下本次解决的过程以便后续 1、首先从最简单的开始处理，服务器的弱口令问题，首先根据安全工具提供的测试描述中发现应用服务器中存在一个匿名用户，默认是不需要密码的，经过分析发现服务器使用了FTP协议，而使用ftp协议默认会产生一个匿名用
[电力与暖气]煤炭燃烧与电力加温 comsci
在宇宙中,用贝塔射线观测地球某个部分,看上去,好像一个个马蜂窝,又像珊瑚礁一样,原来是某个国家的采煤区..... 不过,这个采煤区的煤炭看来是要用完了.....那么依赖将起燃烧并取暖的城市,在极度严寒的季节中...该怎么办呢? &nbs
oracle O7_DICTIONARY_ACCESSIBILITY参数 daizj oracle
O7_DICTIONARY_ACCESSIBILITY参数控制对数据字典的访问.设置为true,如果用户被授予了如select any table等any table权限,用户即使不是dba或sysdba用户也可以访问数据字典.在9i及以上版本默认为false,8i及以前版本默认为true.如果设置为true就可能会带来安全上的一些问题.这也就为什么O7_DICTIONARY_ACCESSIBIL
比较全面的MySQL优化参考 dengkane mysql
本文整理了一些MySQL的通用优化方法，做个简单的总结分享，旨在帮助那些没有专职MySQL DBA的企业做好基本的优化工作，至于具体的SQL优化，大部分通过加适当的索引即可达到效果，更复杂的就需要具体分析了，可以参考本站的一些优化案例或者联系我，下方有我的联系方式。这是上篇。 1、硬件层相关优化 1.1、CPU相关在服务器的BIOS设置中，可
C语言homework2，有一个逆序打印数字的小算法 dcj3sjt126com c
#h1# 0、完成课堂例子 1、将一个四位数逆序打印 1234 ==> 4321 实现方法一： # include <stdio.h> int main(void) { int i = 1234; int one = i%10; int two = i / 10 % 10; int three = i / 100 % 10;
apacheBench对网站进行压力测试 dcj3sjt126com apachebench
ab 的全称是 ApacheBench ，是 Apache 附带的一个小工具，专门用于 HTTP Server 的 benchmark testing ，可以同时模拟多个并发请求。前段时间看到公司的开发人员也在用它作一些测试，看起来也不错，很简单，也很容易使用，所以今天花一点时间看了一下。通过下面的一个简单的例子和注释，相信大家可以更容易理解这个工具的使用。
2种办法让HashMap线程安全 flyfoxs java jdk jni
多线程之--2种办法让HashMap线程安全多线程之--synchronized 和reentrantlock的优缺点多线程之--2种JAVA乐观锁的比较( NonfairSync VS. FairSync) HashMap不是线程安全的,往往在写程序时需要通过一些方法来回避.其实JDK原生的提供了2种方法让HashMap支持线程安全.
Spring Security（04）——认证简介 234390216 Spring Security 认证过程
认证简介目录 1.1 认证过程 1.2 Web应用的认证过程 1.2.1 ExceptionTranslationFilter 1.2.2 在request之间共享SecurityContext 1
Java 位运算 Javahuhui java 位运算
// 左移( << ) 低位补0 // 0000 0000 0000 0000 0000 0000 0000 0110 然后左移2位后，低位补0： // 0000 0000 0000 0000 0000 0000 0001 1000 System.out.println(6 << 2);// 运行结果是24 // 右移( >> ) 高位补"
mysql免安装版配置 ldzyz007 mysql
1、my-small.ini是为了小型数据库而设计的。不应该把这个模型用于含有一些常用项目的数据库。 2、my-medium.ini是为中等规模的数据库而设计的。如果你正在企业中使用RHEL,可能会比这个操作系统的最小RAM需求(256MB)明显多得多的物理内存。由此可见，如果有那么多RAM内存可以使用，自然可以在同一台机器上运行其它服务。 3、my-large.ini是为专用于一个SQL数据
MFC和ado数据库使用时遇到的问题你不认识的休道人 sql C++mfc
=================================================================== 第一个 =================================================================== try{ CString sql; sql.Format("select * from p
表单重复提交Double Submits rensanning double
可能发生的场景： *多次点击提交按钮 *刷新页面 *点击浏览器回退按钮 *直接访问收藏夹中的地址 *重复发送HTTP请求（Ajax）（1）点击按钮后disable该按钮一会儿，这样能避免急躁的用户频繁点击按钮。这种方法确实有些粗暴，友好一点的可以把按钮的文字变一下做个提示，比如Bootstrap的做法： http://getbootstrap.co
Java String 十大常见问题 tomcat_oracle java 正则表达式
　1.字符串比较，使用“==”还是equals()? 　　"=="判断两个引用的是不是同一个内存地址(同一个物理对象)。　　equals()判断两个字符串的值是否相等。　　除非你想判断两个string引用是否同一个对象，否则应该总是使用equals()方法。　　如果你了解字符串的驻留(String Interning)则会更好地理解这个问题。　　
SpringMVC 登陆拦截器实现登陆控制 xp9802 springMVC
思路，先登陆后，将登陆信息存储在session中，然后通过拦截器，对系统中的页面和资源进行访问拦截，同时对于登陆本身相关的页面和资源不拦截。实现方法： 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23