AI科技大本营

深度文本匹配在智能客服中的应用

参加2018 AI开发者大会，请点击↑↑↑

作者 | 云知声

一. 深度文本匹配的简介

1. 文本匹配的价值

2. 深度文本匹配的优势

3. 深度文本匹配的发展路线

二. 智能客服的简介

1. 智能客服的应用背景

2. 智能客服的核心模块

FAQ 库的构建
语义召回
相似度模型
模型更新

三. 深度文本匹配在智能客服中的应用

1. 为什么使用深度文本匹配

2. 怎么样使用深度文本匹配

深度文本匹配模型
文本匹配引擎

3. 深度智能客服的效果评测

四. 参考

▌一、深度文本匹配的简介

1. 文本匹配的价值

文本匹配是自然语言理解中的一个核心问题，它可以应用于大量的自然语言处理任务中，例如信息检索、问答系统、复述问题、对话系统、机器翻译等等。这些自然语言处理任务在很大程度上都可以抽象成文本匹配问题，比如信息检索可以归结为搜索词和文档资源的匹配，问答系统可以归结为问题和候选答案的匹配，复述问题可以归结为两个同义句的匹配，对话系统可以归结为前一句对话和回复的匹配，机器翻译则可以归结为两种语言的匹配。

2. 深度文本匹配的优势

传统的文本匹配技术如图1中的 BoW、TFIDF、VSM等算法，主要解决词汇层面的匹配问题，而实际上基于词汇重合度的匹配算法存在着词义局限、结构局限和知识局限等问题。

词义局限：的士和出租车虽然字面上不相似，但实为同一种交通工具；而苹果在不同的语境下表示的东西不同，或为水果或为公司；
结构局限：机器学习和学习机器虽词汇完全重合，但表达的意思不同；
知识局限：秦始皇打 Dota，这句话虽从词法和句法上看均没问题，但结合知识看这句话是不对的。

传统的文本匹配模型需要基于大量的人工定义和抽取的特征，而这些特征总是根据特定的任务（信息检索或者自动问答）人工设计的，因此传统模型在一个任务上表现很好的特征很难用到其他文本匹配任务上。而深度学习方法可以自动从原始数据中抽取特征，省去了大量人工设计特征的开销。首先特征的抽取过程是模型的一部分，根据训练数据的不同，可以方便适配到各种文本匹配的任务当中；其次，深度文本匹配模型结合上词向量的技术，更好地解决了词义局限问题；最后得益于神经网络的层次化特性，深度文本匹配模型也能较好地建模短语匹配的结构性和文本匹配的层次性[1]。

3. 深度文本匹配的发展路线

图 1 深度文本匹配的发展路线

随着深度学习在计算机视觉、语音识别和推荐系统领域中的成功运用，近年来有很多研究致力于将深度神经网络模型应用于自然语言处理任务，以降低特征工程的成本。最早将深度学习应用于文本匹配的是微软 Redmond 研究院。2013年微软 Redmond 研究院发表了 DSSM [2]，当时 DSSM 在真实数据集上的效果超过了SOTA(State of the Art)；为了弥补 DSSM 会丢失上下文的问题，2014年微软又设计了CDSSM [3]；2016年又相继发表了 DSSM-LSTM， MV-DSSM。微软的 DSSM 及相关系列模型是深度文本匹配模型中比较有影响力的，据了解百度、微信和阿里的搜索场景中都有使用。

其他比较有影响的模型有：2014年华为诺亚方舟实验室提出的 ARC-I和ARC-II [4]，2015年斯坦福的 Tree-LSTM [5]，2016年 IBM 的 ABCNN [6]，中科院的 MatchPyramid [7]，2017年朱晓丹的 ESIM[8]，2018 年腾讯 MIG 的多信道信息交叉模型 MIX [9]。

一般来说，深度文本匹配模型分为两种类型，表示型和交互型。表示型模型更侧重对表示层的构建，它会在表示层将文本转换成唯一的一个整体表示向量。典型的网络结构有 DSSM、CDSMM 和 ARC-I。这种模型的核心问题是得到的句子表示失去语义焦点，容易发生语义偏移，词的上下文重要性难以衡量。交互型模型摒弃后匹配的思路，假设全局的匹配度依赖于局部的匹配度，在输入层就进行词语间的先匹配，并将匹配的结果作为灰度图进行后续的建模。典型的网络结构有 ARC-II、DeepMatch 和 MatchPyramid。它的优势是可以很好的把握语义焦点，对上下文重要性合理建模。由于模型效果显著，业界都在逐渐尝试交互型的方法。

图 2 深度文本匹配模型的类型

▌二、智能客服的简介

1. 智能客服的应用背景

由于人工客服在响应时间、服务时间和业务知识等方面的局限性，有必要研发智能客服系统，使其通过智能化的手段来辅助人工客服为用户服务。智能客服与人工客服的优劣势对比如图 4 所示。

图 3 智能客服与人工客服的优劣势对比

2. 智能客服的核心模块

智能客服的一般框架如图 5 所示：当有 Query 请求时，首先对 Query 进行补全、解析和需求理解；其次，问题召回模块通过精准召回、核心召回和语义召回从 FAQ 库召回与 Query 相关的问题；接着，问题排序模块通过 CTR 模型和相似度模型对召回的问题进行排序，选出 Top k 返回给用户；最后，反馈系统记录用户的点击行为等，对模型进行更新。具体哪些模型会被更新，与语义召回和相似度模型阶段使用的算法有关。

图 4 智能客服的一般框架

在智能客服的框架中，最重要的模块是 FAQ 库的构建、语义召回、相似度模型和模型更新，它们性能的好坏对用户的使用体验有很大影响。

FAQ 库的构建

对于重视用户体验的客服系统来说，FAQ 库的构建是非常严格的，它的内容需要非常完整和标准，不能像聊天机器人那样可以插科打诨。一般的做法是将积累的 FAQ ，或是将场景相关的设计文档、PRD文档中的相应内容整理成 FAQ，添加到 FAQ 库中。日常的维护就是运营人员根据线上用户的提问做总结，把相应的问题和答案加入 FAQ 库。不难想像，随着用户量的增加，用户的问题种类五花八门，问法多种多样，这种维护方式肯定会给运营带来很大的压力，也会给用户带来糟糕的体验。那么，有没有什么自动或是半自动的方法可以解决新问题的挖掘和 FAQ 库的更新？

一种理想的 FAQ 库构建的流程应该是：从客服的直接对话出发，提取出与产品相关的问题，计算问题之间的距离，通过增量聚类的方法把用户相似的问题聚到一起，最后由运营人员判断新增的问题能否进入 FAQ 库，同时将他们的反馈更新给文本匹配模型。

图 5 理想的FAQ 库构建的流程

语义召回

当 FAQ 库达到一定规模时，再让用户请求的 Query 与 FAQ 库中的问题一一计算相似度是非常耗时的，而问题召回模块可以通过某些算法只召回与请求 Query 相关的问题，减少问题相似度模型阶段的复杂度。精准召回和核心召回是基于词汇重合度的检索方法，它们的局限是不能召回那些 FAQ 库中与请求 Query 无词汇重合，但语义表达是一样的问题，而语义召回可以解决此类问题。

相似度模型

相似度模型分别计算召回的相关问题与请求 Query 之间的相似度，作为排序模型的特征之一。需要注意，此处的相似度模型不同于语义召回中的相似度计算，前者更靠近输出端，对准确率要求高；后者对召回率要求高。因此，这两个模块在实现时使用的模型往往不同，在我们的文本匹配引擎中，语义召回使用的是基于表示型的深度文本匹配模型，相似度模型使用的是基于交互型的深度文本匹配模型和其他传统文本匹配模型的混合模型。

模型更新

智能客服投入线上使用后，用户 query 可能与某些模型的训练数据分布不一致，导致智能客服的响应不理想。因此，十分有必要从收集到的用户行为数据中挖掘相关知识，并更新相关模型。

▌三、深度文本匹配在智能客服中的应用

1. 为什么使用深度文本匹配

问题聚类、语义召回和相似度模型都可以归结为文本匹配问题。传统智能客服在这些模块中使用的是传统文本匹配方法，不可避免地会遇到词义局限、结构局限和知识局限等问题；加上传统文本匹配方法多是无监督的学习方法，那么由这些方法训练的模型就无法利用运营人员的反馈和用户的点击行为等知识。然而，使用深度文本匹配的方法则可以有效地解决这些弊端。具体改进方面如图 6 所示。

图 6 深度文本匹配对传统智能客服的改进

2. 怎么样使用深度文本匹配

我们曾在智能客服的不同领域中尝试过多种深度文本匹配方法，通过业务场景推动技术演进的方式，逐淅形成了一套成熟的文本匹配引擎。我们的文本匹配引擎除了使用传统的机器学习模型（如话题匹配模型、词匹配模型、VSM等）外，还使用了基于表示型和基于交互型的深度文本匹配模型。

深度文本匹配模型

Representation-based Model

表示型的深度文本匹配模型能抽出句子主成分，将文本序列转换为向量，因此，在问题聚类模块，我们使用表示型的深度文本匹配模型对挖掘的问题和 FAQ 库的问题做预处理，方便后续增量聚类模块的计算；在语义召回模块，我们使用表示型的深度文本匹配模型对 FAQ 库的问题做向量化处理，并建立索引，方便问题召回模块增加对用户 query 的召回。另外，我们使用基于 Bi-LSTM 的表示型模型以捕获句子内的长依赖关系。模型结构如图 7 所示。

图 7 基于 Bi-LSTM 的表示型模型

Iteraction-based Model

我们在相似度模型模块使用了基于交互型的深度文本匹配模型 MatchPyramid，其原因有三点：

第一点，表示型的深度文本匹配模型对句子表示时容易失去语义焦点和发生语义偏移，而交互型的深度文本匹配模型不存在这种问题，它能很好地把握语义焦点，对上下文重要性进行合理建模。

第二点，在语义召回阶段，用户 query 与召回问题间的语义相似度会作为排序模型的特征之一，同样地，相似度模型阶段，用户 query 与召回问题间的另一种语义相似度也会作为排序模型的特征之一。

第三点，相似度模型需要实时计算，用户每请求一次，相似度模型就需要计算 n 个句对的相似度，n 是问题召回的个数。而序列型的神经网络不能并行计算，因此我们选择了网络结构是 CNN 的 MatchPyramid 模型。模型结构如图 8 所示。

图 8 An overview of MatchPyramid on Text Matching

文本匹配引擎

由于自然语言的多样性，文本匹配问题不是某个单一模型就能解决的，它涉及到的是算法框架的问题。每个模型都有独到之处，如何利用不同模型的优点去做集成，是任何文本匹配引擎都需要解决的问题。我们的文本匹配引擎融合了传统文本匹配模型和深度文本匹配模型，具体的框架如图 9 所示。

图 9 文本匹配引擎的框架

3. 深度智能客服的效果评测

应用上述的文本匹配引擎后，我们为某汽车公司开发的智能客服系统，在测试集上的 precision 达到了 97%；与某寿险公司合作完成的智能客服，其 precision 比 baseline 高出 10 个点。除此之外，在对话系统的音乐领域中，使用深度文本匹配引擎替代模糊匹配后，整体 precision 提高了 10 个点；在通用领域的测试集上，我们的文本匹配引擎也与百度的 SimNet 表现不相上下。

四、参考

1. 庞亮，兰艳艳，徐君等. 深度文本匹配综述. 计算机学报. 2017, 40(4):985-1000.

2. Po-Sen Huang, Xiaodong He, Jianfeng Gao, et al. Learning Deep Structured Semantic Models for Web Search using Clickthrough Data. 2013, In CIKM.

3. Yelong Shen, Xiaodong He, Jianfeng Gao, et al. A Latent Semantic Model with Convolutional-Pooling Structure for Information Retrieval. 2014, In CIKM.

4. Baotian Hu, Zhengdong Lu, Hang Li, et al. Convolutional Neural Network Architectures for Matching Natural Language Sentences. 2014, In NIPS.

5. Kai Sheng Tai, Richard Socher, Christopher D. Manning. Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks. 2015.

6. Wenpeng Yin, Hinrich Schutze, Bing Xiang, et al. ABCNN: Attention-Based Convolutional Neural Network for Modeling Sentence Pairs. 2016.

7. Liang Pang, Yanyan Lan, Jiafeng Guo, et al. Text Matching as Image Recognition. 2016.

8. Qian Chen, Xiaodan Zhu, Zhenhua Liu, et al. 2017.

9. [Haolan Chen, Di Niu, Dong Liu, et al. MIX: Multi-Channel Information Crossing for Text Matching. 2018, In KDD.

2018 AI开发者大会

◆

只讲技术，拒绝空谈

◆

2018 AI开发者大会是一场由中美人工智能技术高手联袂打造的AI技术与产业的年度盛会！是一场以技术落地为导向的干货会议！大会设置了10场技术专题论坛，力邀15+硅谷实力讲师团和80+AI领军企业技术核心人物，多位一线经验大咖带你将AI从云端落地。

大会日程以及嘉宾议题请查看下方海报

（点击查看大图）

点击「阅读原文」，查看1024专属福利。2018 AI开发者大会——摆脱焦虑，拥抱技术前沿。

AI数字人系统开发上线全攻略：从0到1全流程解析 v_qutudy 人工智能 AI系统开发 AI数字人开发
一、需求分析：定义数字人核心能力1.1功能规划矩阵模块基础功能进阶功能形象生成2D/3D建模实时表情捕捉与驱动语音交互TTS语音合成情感识别与应激反应动作系统预设动作库骨骼动画与物理引擎智能决策规则引擎强化学习驱动决策多模态交互文本/语音输入AR/VR空间交互1.2非功能性指标实时性：唇形同步延迟B[语音识别]A-->C[姿态检测]A-->D[文本理解]B-->E[NLP引擎]C-->F[动作解析
二维码在教学中的应用小尘老师
7月7日，阅读《现代极简教育技术》P174-180模块二主要是将二维码在教学中的灵活应用。二维码在生活中非常常见，大部分人看到都知道那是二维码。但真要问什么是二维码，应该有很多人跟我一样是有点懵的。没想到二维码背后还有这么多的知识。真的是长见识了。关于教师如何设计二维码，黎教授也分成5个小点教大家。主要是网页，PPT，word文件，图片音视频，其他二维码。黎教授介绍的方法中，草料二维码我用的是最多
淘宝搜同款商品怎么操作？同款产品如何搜索？氧惠导师
在淘宝这个平台上面，大家可以购买商品，而且后续的方式有很多种，大家在街上看到一件商品自己喜欢，可以拍下照片直接去淘宝搜同款，淘宝搜同款怎么操作?➤推荐网购薅羊毛app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！）➤由于信息差的关系，很
C ++ 中的指针和引用的区别 ice.Ynov23 C++学习笔记 c语言 c++算法
目录C++中的指针和引用的区别1.定义与初始化2.内存与地址3.操作灵活性4.使用场景5.语法对比6.代码示例7.关键区别总结C++中的指针和引用的区别1.定义与初始化指针：可以声明时不初始化（但建议初始化为nullptr避免野指针）可以指向不同的对象（重新赋值）使用*声明和解引用 intx=10; int*p=&X; p=nullptr;引用：必须初始化，且一旦绑定到一个对象后不能更改（不可重新
桌面问题 —— 解决 Windows 桌面部分快捷方式图标变为空白的问题 ice.Ynov23 Windows Solutions windows
解决Windows桌面部分快捷方式图标变为空白的问题第一种文件没有消失的情况打开本地应用数据存储位置（C:\Users\用户名\AppData\Local）快捷打开方式：按下Windows+R键，在弹出的运行对话框中输入%localappdata%，回车确定。在打开的本地应用数据存储窗口中，找到并删除Iconcache.db文件。打开任务管理器，找到Windows资源管理器。右键单击Windows
CPO：对比偏好优化—突破大型语言模型在机器翻译中的性能边界 AI专题精讲强化学习人工智能强化学习 AI技术应用
温馨提示：本篇文章已同步至"AI专题精讲"CPO：对比偏好优化—突破大型语言模型在机器翻译中的性能边界摘要中等规模的大型语言模型（LLMs），如参数量为7B或13B的模型，在机器翻译（MT）任务中展现出良好性能。然而，它们仍未能达到最先进的传统编码器-解码器翻译模型，或是如GPT-4（OpenAI,2023）等更大规模LLM的表现。在本研究中，我们致力于弥合这一性能差距。我们首先评估了在机器翻译任
主流数据库语言语法对比两圆相切数据库
以下是五大数据库（MySQL、PostgreSQL、Oracle、SQLServer、SQLite）核心语法对比，涵盖DDL、DML、查询、函数、事务等全场景，包含底层原理差异和实用示例。##一、数据一、类型深度对比分类MySQLPostgreSQLOracleSQLServerSQLite整数TINYINT,INT,BIGINTSMALLINT,INT,BIGINTNUMBER(10)TIN
大型语言模型的智能本质是什么 ZhangJiQun&MXP 教学 2021 论文 2024大模型以及算力语言模型人工智能自然语言处理
大型语言模型的智能本质是什么基于海量数据的统计模式识别与生成系统，数据驱动的语言模拟系统，其价值在于高效处理文本任务（如写作、翻译、代码生成），而非真正的理解与创造大型语言模型（如GPT-4、Claude等）的智能本质可概括为基于海量数据的统计模式识别与生成系统，其核心能力源于对语言规律的深度学习，但缺乏真正的理解与意识。以下从本质特征、技术机制、典型案例及争议点展开分析：一、智能本质的核心特征统
（四）Python总结笔记：函数 Laura_Wangzx Python学习笔记 python
Python总结笔记（四）函数python中的函数函数中的参数变量作用域偏函数PFA递归函数高阶函数BIFs中的高阶函数匿名函数lambda闭包Closure装饰器Decorator函数式编程FunctionalProgramming1.python中的函数￭函数的意义:■1.对输入进行变换映射后输出，可以进行反复调用。以函数名对代码块进行封装■2.过程化VS结构化￭函数的创建及结构:■定义函数名
Python 算法基础篇之线性搜索算法：顺序搜索、二分搜索挣扎的蓝藻 Python算法初阶：入门篇 python 算法开发语言
Python算法基础篇之线性搜索算法：顺序搜索、二分搜索引用1.顺序搜索算法2.二分搜索算法3.顺序搜索和二分搜索的对比a)适用性b)时间复杂度c)前提条件4.实例演示实例1：顺序搜索实例2：二分搜索总结引用在算法和数据结构中，搜索是一种常见的操作，用于查找特定元素在数据集合中的位置。线性搜索算法是最简单的搜索算法之一，在一组数据中逐一比较查找目标元素。本篇博客将介绍线性搜索算法的两种实现方式：顺
C++ 固有的不可移植特性
为了支持底层编程，C++定义了一些固有的不可移植的特性，即因机器而异的特性，当将含有不可移植特性的程序从一台机器转移到另一台机器上时，通常需要重新编写该程序。1位域类可以将其非静态数据成员定义成位域，在一个位域中含有一定数量的二进制位。当一个程序需要向其他程序或硬件设备传递二进制数据时，通常会用到位域。位域在内存中的布局是与机器相关的且位域的类型必须是整型或枚举类型。typedefunsi
Doherty功率放大器设计原理 just u 笔记
转于https://m.eefocus.com/rf-microwave/242568射频功率放大器被广泛应用于各种无线通信发射设备中。线性功放在基站中的成本比例约占1／3，如何有效、低成本地解决功放的线性化问题显得非常重要。高效率高线性度的功放研究是一个热门课题，特别是近几年针对WCDMA功率放大器。目前国内能生产10W以上的WCDMA功率放大器厂家只有少数几家公司，因为WCD-MA功率放大器对
一直在追梦的路上随梦起航
自大学毕业至今，始终如一地在追逐梦想的征程路上奔波，似乎不敢懈怠。怕自己的一时疏忽而与机遇失之交臂。其实，对于我们来说，所谓的奔波，不是朝九晚五工作中身体上的透支、也不是背着超出体能负荷量的行李爬山涉水、更不是为了生计而在风雨兼程中的奔波劳碌。而它是实现梦想过程中必经之路的一个代名词，对于每个人来说再熟悉不过的人生测试，从童年到少年到青年，每个阶段的升华都通过它来步步向前，就因为它，美好的童年时光
计算机视觉算法实战——关键点检测
✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨✨个人主页欢迎您的访问✨期待您的三连✨1.引言关键点检测（KeypointDetection）是计算机视觉领域中的一个重要研究方向，旨在从图像或视频中检测出具有特定语义信息的关键点。这些关键点通常代表了物体的特定部位或特征，例如人体的关节、面部特征点、车辆的轮子等。关键点检测在姿态估计、动作识别、目标跟踪、三维重建等任务中
Tableau日常分析小技巧(2):数值中空值处理 Tableau日常小技巧
在日常分析中，我们常遇到数据源度量字段中有空值，那么，遇到这种情况我们如何在Tableau中做数据处理呢？数据源比较简单，如下图所示：将数据源导入TableauDesktop中，同时将类别放入‘行功能’,将销售额放入标记框文本中如图所示：表格中出现的空值是我们数据源中的缺失值，有两种方法可以处理缺失值方法一：使用zn()函数zn()函数表达式为zn(expression)表示如果表达式不为null
那些缘来缘去的朋友晨风晚梦
长到这个年纪的时候忽然发现周围的朋友换了好些人了，但是也总有一些朋友是一路相伴了，这种朋友不多，但却真的是避风港和心底得温暖。我和妮子是高中同学，我们住同一个宿舍，吃同一桶泡面，熬同样的夜互相说着最少女的心事，那样的日子想起来就都是诗意和美好。高中的时候我们喜欢看饶雪漫，喜欢看韩寒，喜欢看郭敬明。我们想要最纯的友谊，也想要遇见最美的爱情，但同时我们又想是骄傲有个性的女主，那会儿我们总是无病呻吟，在
季节美人却愁痛或乐
清晨的鸟鸣声吵醒了睡梦中的人，带着朦胧睡意打开了灯。窗外天空还是灰蒙蒙的，就像睡意中的人，但鸟儿们早已叽叽喳喳叫个不停，这是属于此季节独有的景象。已经记不得什么时候醒得像今天一样的早，只曾记得这些日子以来，与游戏，小说，电视剧形影不离，每天不熬夜就觉得浑身难受。在这样的日子下，时间成了模糊的概念，要不是窗外栽种这些樱桃树、梨树，树上茂盛地开着白花和粉色的花，房屋里面的主人或许还不知道，春天，已经到
MDB 4.3 协议文档详细介绍
MDB4.3协议文档详细介绍【下载地址】MDB4.3协议文档详细介绍MDB4.3协议是2019年发布的多点总线通信协议，专为售货机与纸币器、硬币器、刷卡器等设备设计。该版本新增了远程售货机功能，支持无现金支付和移动应用操作，极大提升了用户体验。此外，协议还优化了触摸屏处理，避免无效操作，并引入了购物车和优惠券功能，丰富了促销方式。MDB4.3通过技术升级，提升了售货机的操作灵活性和系统稳定性，为自
记忆中的阿拉斯加费尔班极光流浪阿紫
那是十多年前冬天爱玩的姐妹淘聚会讨论着想出国玩不记得是谁说要看极光一向自助旅行不跟团的姐妹做了功课后找了一个热爱极光的人一起去阿拉斯加辉哥是个很神奇的大叔他热爱极光每年要去拍摄极光他说最适合看极光的地方第一是阿拉斯加费尔班第二是冰岛他安排自己的极光旅游并欢迎有兴趣的人一起去玩机票酒店行程自理我们只是网路上认识他做一些询问他就热心的给我们资料及这次的行程所谓行程只有出发跟回来时间还有中间他打算当天来
C++博弈论善良的小乔博弈 c++算法开发语言
C++中的博弈算法主要用于解决两人对弈或多方博弈中的策略问题，常用于解决在棋类、卡牌、游戏等情景下的最优策略。这类算法通常基于数学博弈论，重点在于模拟玩家的策略选择并寻找最优解。下面将逐步介绍博弈算法的基本思想、常用算法以及具体实现思路。一、博弈算法的基本思想博弈算法的核心在于状态空间搜索，通过模拟玩家的所有可能动作，推导出局面评价和策略选择，常见特性包括：零和博弈：一个玩家的得分增加意味着另一个
人不为吃，天诛地灭仍需历验
人不为吃，天诛地灭。但吃钱的来源，却是五花八门。正如“君子爱财，取之有道”之说。倘若，嗟（借）来之食，贷款之食，赊账之食，啃老之食……这个中的“美味”究竟有多少，也只有吃货们心知肚明。图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App
路面裂缝漏检率高？陌讯多尺度检测降 30% 2501_92487936 计算机视觉 opencv 人工智能深度学习算法目标检测
在市政工程与公路养护领域，路面裂缝检测是保障交通安全的关键环节。传统人工巡检不仅效率低下（日均检测≤50公里），且受主观因素影响漏检率高达15-20%[1]。而主流开源视觉算法在面对阴影干扰、多类型裂缝混杂等场景时，往往陷入"精度与速度不可兼得"的困境。本文将结合实战案例，解析陌讯视觉算法在路面裂缝检测中的技术突破与落地经验。一、技术解析：从传统方法到多模态融合架构传统裂缝检测多采用"边缘检测+形
人生中的第一篇博客——梦开始的地方爱和冰阔落经验分享笔记
文章目录前言`一、自我介绍二、编程目标1.扎实掌握C语言2.深度挖掘C++三、编程学习时间的花费四、梦寐以求的大厂offer前言`写一篇博客记录自己从一直知道CSDN这个软件到自己真正开始用它写一篇博客来开启记录记录学习生活的风景提示：以下是本篇文章正文内容，下面案例可供参考一、自我介绍大家好！我是一名大一网络工程专业的小萌新，踏入编程世界的时间不长，目前只能算是刚入门的水平。虽然现在还只是“小小
lesson17：Python函数之递归、匿名函数与变量作用域
目录引言一、递归函数：用自身解构复杂问题1.递归的基本结构2.递归的典型应用场景3.递归的优缺点与优化二、匿名函数：用lambda实现“一句话函数”1.lambda与普通函数的区别2.lambda的典型应用3.lambda的局限性三、变量作用域：理解LEGB规则1、LEGB规则的深度解析（1）Local（局部作用域）（2）Enclosing（嵌套作用域）（3）Global（全局作用域）（4）Bui
新手发小红书笔记怎么赚钱?新手小红书赚钱攻略详解日常购物技巧呀
小红书作为一个社交分享平台，用户在这里可以搜集到各种各样的干货，帮助他们解决生活中的问题。如果有这方面经验的用户，可以在小红书上面注册账号，分享一些干货，运气好的话也可以进行变现赚钱，那么如何做小红书赚钱？大家好，我是高省APP联合创始人万方导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能赚钱有收益的平台，
lesson11：Python的字典及方法你的电影很有趣 windows python
目录前言一、字典的定义与核心价值创建方式：二、核心特性：键的规则与无序性演变1、键的不可变性与唯一性2、无序性与Python版本差异三、常用操作与方法全解析四、与列表/元组的对比：数据结构选型指南五、高级应用技巧六、避坑指南：常见错误与最佳实践总结前言在Python的“数据结构工具箱”中，字典（Dictionary）无疑是最灵活、最强大的工具之一。无论是存储用户信息、解析JSON数据，还是实现缓存
深度学习超参数优化（HPO）终极指南：从入门到前沿
摘要：在深度学习的实践中，模型性能的好坏不仅取决于算法和数据，更在一半程度上取决于超参数的精妙设置。本文是一篇关于超参数优化（HyperparameterOptimization,HPO）的综合性指南，旨在带领读者从最基础的概念出发，系统性地梳理从经典到前沿的各类优化方法，并最终落地于实用策略和现代工具。无论您是初学者还是资深从业者，都能从中获得宝贵的见解。第一部分：夯实基础——HPO的核心概念1
lesson18：Python函数的闭包与装饰器（难）你的电影很有趣 python 开发语言
目录引言闭包：函数式编程的"状态容器"一、闭包的本质与定义二、闭包的三大形成条件三、闭包的工作原理：变量的“持久化”四、闭包的核心应用场景五、闭包的注意事项六、闭包与装饰器的关系装饰器：基于闭包的功能增强工具一.装饰器的定义与作用二.装饰器的实现原理（基于闭包）三、装饰器进阶：灵活扩展功能1.带参数的装饰器2.保留函数元信息3.类装饰器与装饰器嵌套四、装饰器实战案例案例一：时间开销计算（性能监控）
Hadoop与云原生集成：弹性扩缩容与OSS存储分离架构深度解析
Hadoop与云原生集成的必要性Hadoop在大数据领域的基石地位作为大数据处理领域的奠基性技术，Hadoop自2006年诞生以来已形成包含HDFS、YARN、MapReduce三大核心组件的完整生态体系。根据CSDN技术社区的分析报告，全球超过75%的《财富》500强企业仍在使用Hadoop处理EB级数据，其分布式文件系统HDFS通过数据分片（默认128MB块大小）和三副本存储机制，成功解决了P
《度五行》生活报报甲辰537：用五行平衡理论探究世界治理的可能性 YangduSam2021
231013癸卯壬戌甲辰，20231013周五，兴大上海六班2941天，西交大2013上海班3641天，后TA15761天，度生活1041天，《度.生活五行》:天干，壬癸劫财；卯戌合，卯辰穿，辰戌冲。这几年最大的感受就是乱，从小到大，从近到远的乱。笔者的以为是：就要乱成一锅粥了。突然想起自做的五行研究题目：用阴阳五行平衡理论探讨世界治理的可能性。阴阳五行是中国古代哲学中的重要思想，强调的是一种平衡
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

深度文本匹配在智能客服中的应用

你可能感兴趣的:(深度文本匹配在智能客服中的应用)