京东云开发者

京东智能客服言犀意图体系搭建和意图识别技术介绍

01 背景介绍

近年来随着人工智能技术的不断发展，以及各行业内部系统对智能化需求的日益增大，智能客服机器人服务水平大幅提升，越来越多的企业开始建立自己的智能客服产品，尤其是一些中大型企业。搭建一款智能客服机器人需要哪些技术储备，其中的核心环节有哪些，成为各个商家需要回答的问题。

京东于2012年在京东商城上线智能客服，并于2020年11月25日在JDDiscovery-2020京东全球科技探索者大会上正式发布了京东智能客服品牌“言犀”。经过多年探索，言犀技术团队沉淀出一整套高效的智能客服机器人搭建、运营方法。本文重点对言犀智能客服机器人意图体系搭建及识别技术进行介绍。

‍

02 整体介绍

首先，对智能客服机器人做一个简单的说明。我们将智能客服机器人简单拆分为用户意图识别和方案生成两个部分。其中意图识别需要离线梳理好意图体系，线上系统将用户话术进行识别并将其关联到具体的意图知识点上。这一阶段主要依赖团队的AI技术能力，保证意图体系的清晰、完备，以及线上的精准识别。方案生成阶段，针对每个意图知识点，结合用户的具体情况生成适合用户的解决方案。这一阶段主要依赖智能客服系统与各个业务系统的深度结合，能够获取足够的权限提供有效的解决方案。

图1所示为京东智能客服言犀意图识别框架。系统分为离线意图体系模块和线上意图理解模块，同时通过意图回流模块将线上数据与离线意图体系打通。其中意图体系是整个系统的基石，需要保证构建的意图体系合理、完备，且有整套运营工具持续调优。线上意图理解模块通过启发式问答、高频问法精准识别、长尾意图有效引导形成漏斗形识别流程，保证整体识别效果。最后，针对线上未识别的问题通过意图回流模块完善离线意图体系，不断优化识别效果。相关模块的落地细节将在后续章节展开。

图1：意图识别整体框架

03 意图体系建立

搭建一个智能客服机器人，第一步就是要梳理清楚当前业务下有哪些知识点，然后基于不同的知识点设计解决方案。对比线上识别模块，业界在各种标准任务上已经沉淀出一批成熟的识别算法，能够满足不同需求。相对而言，一套合理、完备的意图体系更能够决定一款智能客服机器人的应答效果。经过多年反复实践，京东言犀落地了一套标准的意图体系建立流程。

如图2所示，我们将整个意图梳理流程，以及参与人员进行标准化定义。同时通过全流程工具提效，保证梳理效率以及产出质量。通过整套机制，当前京东智能客服言犀已落地3000+意图，结合不同的业务状态、槽值信息，为用户提供10w+的精准解决方案。

图2：意图体系梳理流程

整套方案中，参与人员包括算法、场景负责人、AI训练师、外包标注人员四中角色。其中算法人员熟悉各类识别算法，并提供工具支撑，同时基于对算法的了解从数据维度判断如何划分意图体系。场景负责人拥有丰富的业务经验，对每一类业务有什么问题，应该如何应答提供专业意见。AI训练师作为算法和场景负责人之间的桥梁，同时对算法和业务有一定了解，并将业务知识按照算法规则梳理出来与各方进行沟通调整。外包同学基于AI训练师梳理的明确规则，进行数据标注。

梳理流程标准化为8个步骤（不包含图中的上线、回流阶段）。第一阶段输出标注规则，主要包括每一个意图的明确定义，易混淆意图的区分方式，以及意图下常见的代表问法，用于标注人员更加具象的感受意图含义、边界。基于第一阶段产出的代表问，算法自动扩充相似问，通过这种流程产出的数据自然带有层级关系，方便后续数据利用。同时，在这种模式下外包标注人员只需要判断相似问与所属代表问是否语义一致即可。将复杂的分类标注任务，转换为相似问判断任务，大幅降低标注难度，提升标注效率。最后，针对第一阶段中少量代表问标注数据，以及第二阶段中大量相似问标注数据。我们设计了不同的异常检测工具，方便标注人员快速发现标注错误。

通过上述一整套标准化拆解任务，结合相似问挖掘、异常检测等工具，AI训练师人效提升60%以上。整套工具也沉淀到运营系统中，用于意图体系的持续调优，防止随着人员变动、业务变化而导致意图体系逐渐混乱。

04 意图理解

基于离线搭建的意图体系，线上系统需要对用户的问题进行精准识别，将用户问题识别到具体的意图知识点。这一节分别对线上各个意图理解模块进行说明。

4.1 启发式问答

如前文描述，虽然京东言犀拥有一整套完善的意图体系及线上识别框架，但如果在对话中任由用户的问题发散，还是会给识别带来非常大的挑战。通过对用户咨询前、中、后全流程的启发式应答策略，让用户实现“点、点、点”即可完成咨询。在收敛用户问法、降低识别难度的同时，大幅降低用户费力度，提升用户体验。当前京东智能客服言犀中有1/3的消息是通过用户点击实现咨询，能够有效提升用户的操作便利性和整体服务满意度。

启发式问答的设计方式使得用户点击的问题皆为标准问法，从而在用户点击之后不需要再进行对应的意图识别。因此，整套启发式问答的详细介绍在本文中不做介绍，感兴趣的读者可以参考团队前期发表于公众号【京东科技开发者】上的文章《京东智能客服言犀启发式问答技术揭秘》。

4.2高频问题识别

针对非点击的用户输入问题，系统需要通过意图识别算法理解用户意图。如目前行业主流技术，文本分类、文本匹配一直是识别高频意图/问法的基础模式，而这些标准NLP任务一直有相对成熟的算法。如图3所示，京东智能客服言犀中的分类、匹配算法也紧跟领域前沿，经历了从传统机器学习+人工特征抽取模式，到深度模型，再到基于大规模预训练模型的阶段。整个发展过程，识别效果在持续提升，但模型复杂度也在逐步增加，而且模型对硬件资源的要求也相应地越来越高。因此，我们通过领域预训练模型结合蒸馏、模型压缩等手段，在保持识别效果的前提下大幅降低对硬件资源的要求，同时提升模型的运行速度。

图3：京东智能客服言犀基础识别算法演进

4.3长尾问题识别

由于业务复杂性以及对话本身的特性，有相当一部分会话中存在长尾问题。这些长尾问题往往代表了用户的个性化需求，如果不能正确识别、应答，会给用户一种机械化的服务感觉，大幅影响用户体验及机器人的解决能力提升。

很大一部分长尾问题的解决方案为非标准化流程，因此对其识别难度较大。系统需要抽象出一套完备的框架，同时保证每一部分的识别效果。京东智能客服言犀将长尾问题抽象为：1）单句明确的长难句识别问题；2）单句不明但结合上下文意图明确的上下文识别问题；以及3）用户表述不明的模糊问题引导。三种策略保持漏斗形识别，将不同流量分而治之，用于综合解决长尾问题。下面对每一种类型的识别方案进行说明。

4.3.1长难句识别

在对话过程中，会存在一定量的长句问题，通用意图模型对该部分识别效果偏差。主要原因是在长句描述中，用户偏向于复杂表达，如何提取其中的关键信息是保证识别效果的关键。

图4：一种基于多任务学习的二阶段用户复杂问句意图识别模型

基于上述分析，我们希望通过在意图模型中增加摘要辅助任务来提升意图模型对关键信息的提取能力。具体方案如图4所示，摘要任务上我们并没有采用一般的生成任务，而是参考了google提出的用于序列标注的LaserTagger模型，并进一步对其进行简化，去除之前模型的ADD标签，而只保留DELETE和KEEP两种标签，用于学习用户表述中哪些词语需要保留，哪些词语需要删除。在意图识别任务上，将词语表征（token embedding）与标签表征（label embedding）相加，然后使用SWEM（Simple Word Embedding base Model）方式抽取语义特征进行意图识别任务。

对比直接使用通用意图模型，新模型在长句识别准确率上有大幅提升，成为业务的一大亮点。

4.3.2上下文识别

上下文多轮识别一直是对话系统中的难点问题，由于京东智能客服言犀意图体系的复杂程度（3000+意图），多轮识别难度进一步增大，针对多轮识别言犀也落地了一系列工作，本节先重点对多轮匹配工作进行说明。

图5：一种用于多轮回复选择的对齐对比模型

随着BERT等大规模预训练模型的成熟，模型特征提取能力有了大幅提升，多轮匹配算法与单句文本匹配算法的效果差别也越来越小。例如最近被提出的BERT-DPT模型，其架构可同时支持多轮、单轮匹配，并且在多个开源测试集上达到了相当高的准召率。但是在实际落地应用中会发现，直接利用这些模型的效果往往差强人意。直接的原因就是在实际应用场景中，上下文语境复杂，中间夹杂着很多无效甚至干扰信息，即使利用BERT等大规模预训练模型也很难抽取出其中的关键信息。针对这一问题，如图5所示，京东言犀结合对比学习探索了一套多轮匹配模型训练方案，在实际业务中准确率取得大幅提升。

这里对模型训练方式做一个简单说明。为了让模型能够从上下文中提取关键信息，我们将用户上下文与候选问题基于attention机制进行对齐。经过处理后我们有用户的原始上下文输入，经过对齐后的上下文，以及候选问题。分别将以及输入模型，经过模型特征抽取后分别得到表征以及。最终通过对比损失让两个表征更加接近，从而让模型关键信息提取能力增强。

4.3.3模糊问题引导

图6：一种用于补全用户问题的多因子分类框架

由于断句、省略、倒述、错别字等情况，实际对话中用户经常会表述一些模糊问法。盲目的反问甚至应答，都会打断对话的流畅性，影响用户体验。如何能像真人一样做到有针对性的精准反问一直是业界难题，系统需要定位到合适的反问时机，以及正确的反问内容。如图6所示，京东智能客服言犀基于多因子识别设计了一套模糊意图识别、反问的策略。

不同于一般情况下将用户问题识别到一个明确意图，我们梳理发现，一个完备的意图一般由动作（退/换/修等等）、业务（发票/订单等等d）、状态（已下单/未收货等等）、问法（时间/地点/方式等等）四个维度组成。因此在识别用户问题主意图的同时，我们还进一步识别当前问题的因子式。并基于主意图与因子式内部的信息判断用户意图是否模糊，以及模糊情况下如何进行精准反问。

如果要训练因子识别模型需要一定量的标注数据。由于识别维度多，标注难度大，如何获取大量高质量标注数据直接影响了方案落地。我们采用了半自动标注的方式基于少量标注数据自动生成大量训练数据。如上文意图体系建立模块描述，通过整套意图梳理流程产出的标注数据自动存在代表问、相似问层级结构，同一个代表问下的相似问句式基本相同。基于这一特性，人工只需要针对代表问进行梳理，产出每一个意图下的因子式，以及每个因子的关键词有哪些即可。通过这些信息自动对相似问进行标注，判断相似问是否含有相应的因子以及关键词，针对不合法的问法由人工进行补充校验。在这套机制下，只不到10%的数据需要人工标注，保证了方案的可行性。

经过离线梳理、训练后。我们能够获取到一个因子识别模型，以及每个意图下的合法因子式有哪些。在线上识别模块，系统识别到用户问题的意图以及因子式。基于被识别到的因子式是否有效、因子式与意图是否匹配等情况，可以判断用户意图是否模糊，以及在模糊情况下如何针对性的反问。整套方案上线后，模糊引导策略在触发率、点击率、准确率指标都有大幅提升。

05 数据回流

即使有了一整套线上识别策略，在实际咨询场景中还是会有一部分用户意图、问法无法识别。这部分数据我们也希望能够不断回流到意图体系中，持续优化线上识别效果。为了提升回流质量及效率，我们将线上未识别的问题进行自动聚类，并且向AI训练师推荐每一个簇最接近的知识点。方便AI训练师快速回流。

可以看到整个回流都是基于文本聚类进行的，聚类效果的好坏会直接影响回流效果。影响聚类的效果主要有两个因素：一个是原始问题的表征是否能够有效表征问题的语义信息。另一个是聚类算法在聚类性能和效果上是否能够满足系统对算法性能的要求。在聚类算法上的相关学术界探索已有多年积累，有包括基于划分、基于密度、基于层次等类信息的算法模型可供选择。因此，我们将工作的重点放在探索如何获取适合聚类任务的文本语义信息表征。

聚类任务对文本表征的一个基础要求就是不同簇的文本表征之间相关性应该很低，聚类算法只是基于文本表征对数据进行划分。如果不同簇的文本表征在表示空间中存在重叠，那么聚类算法也无法将其划分开。而对比学习正是具有这一特性，能够将语义相似的表征拉近，将语义不同的表征推远。很自然的，如图7所示，我们考虑将对比学习引入文本表征任务中。同时，常规基于样本的对比学习往往只能从语义层面将表征拉近/推远，导致调整后的表征倾向于将问法相似的问题（语义相似）聚类到一个簇，却无法将问法不同但意图相同的问题聚类到一个簇。针对这一问题，我们同步引入了聚类任务，以及基于类簇的对比学习，使得模型表征同步学习到类别信息。优化后的模型在多个开源测试集上均取得了SOTA效果。

图7：SimCTC:一种简单的用于短文本聚类的对比学习方法

06 领域预训练模型

以上模块是对京东智能客服言犀中具体的识别模块介绍。各模块中涉及的大量模型都是基于大规模预训练模型进行二次调优生成，因此所有识别效果很大程度上决定于基础预训练模型的效果。当前通用预训练模型在智能客服领域无法充分发挥效果，主要有以下几方面因素：

1、没有融入智能客服相关领域数据集。

2、NSP（Next Sentence Prediction）任务无法充分学习到智能客服潜在语义关联性。

3、如何将多种任务类型很好的融合到预训练中，也将是预训练模型效果提升的关键。

基于上述问题，我们提出了 IcsBERT （BERT for Intelligent Customer Service Domain），专门针对智能对话领域进行预训练效果提升。除了针对性使用了对话领域数据集外，基于我们提出的提示性多任务并发训练方式，将多个对话领域的关键任务融入到模型预训练当中，提升了预训练模型的效果。

在训练数据集上，我们使用智能客服领域多种业务的人人对话、人机对话为基础数据。基于这些数据，结合不同的数据生成策略，构建了海量训练集。针对构建的数据及智能对话领域的核心任务，我们设计了三种训练任务：

SOP任务：采用SOP（Sentence Order Prediction）扩展任务代替原始BERT中的NSP任务，预测当前文本是两句连续文本中的前一句、后一句还是随机句。

QA任务：将用户连续问题和客服连续问题进行合并，整理出标准QA（Question-Answer Matching）数据集。QA都来自同一会话中的连续消息为正样本，否则为负例。

QQ任务：将线上用户问题识别意图作为标签，通过lucene检索，同意图下的检索结果为正例，不同意图下的检索结果为负例。同时通过多种策略保证抽取各种识别难度的正负例数据。（Question-Question Matching）

最后，训练方式如图8所示。我们提出了提示性多任务并发训练方式，采用不同的first token标签，引导不同任务预训练。具体的，[CLS] token预训练学习SOP扩展任务、[QQ] token预训练学习相似度匹配相关任务、[QA] token预训练学习问答相关任务。基于以上方法产出的预训练模型，在京东智能客服言犀的多个业务线，以及各类任务上对比多种开源模型，均取得了最优效果。

图8：京东言犀领域预训练模型架构图

07 未来展望

以上内容为京东智能客服言犀在意图识别体系搭建以及识别技术方面工作的介绍。在未来，我们将持续探索这一工作的优化方向，同时尝试将意图识别与方案生成进行联动优化，进一步提升当前对话系统的效果体验，实现更加类人的智能客服系统。

文丨俞晓光、王超、宋双永

-End-

▶►更多了解◄◀

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
Leetcode 148. 排序链表
文章目录前引题目代码（首刷看题解）代码（8.9二刷部分看解析）代码（9.15三刷部分看解析）前引综合性比较强的一道题，要求时间复杂度必须O(logn)才能通过，最适合链表的排序算法就是归并。这里采用自顶向下的方法步骤：找到链表中点（双指针）对两个子链表排序(递归，直到只有一个结点，记得将子链表最后指向nullptr）归并（引入dummy结点）题目Leetcode148.排序链表代码（首刷看题解）c
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
全面触摸屏输入法设计与实现长野君
本文还有配套的精品资源，点击获取简介：触摸屏输入法是针对触摸设备优化的文字输入方案，包括虚拟键盘、手写、语音识别和手势等多种输入方式。本方案通过提供主程序文件、用户手册、界面截图、示例图、说明文本和音效文件，旨在为用户提供一个完整的、多样的文字输入体验。开发者通过持续优化算法和用户界面，使用户在无物理键盘环境下也能高效准确地进行文字输入。1.触摸屏输入法概述简介在现代信息技术飞速发展的今天，触摸屏
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）阿牛的药铺算法移植部署 fpga开发 verilog
FPGA小白到项目实战：Verilog+Vivado全流程通关指南（附光学类岗位技能映射）引言：为什么这个FPGA入门路线能帮你快速上岗？本文设计了一条**"Verilog语法→工具链操作→光学项目实战→岗位技能对标"的阶梯式学习路径。不同于泛泛而谈的FPGA教程，我们聚焦光学类产品开发**核心能力（时序接口设计、图像处理算法移植、高速接口应用），通过3个递进式项目（从LED闪烁到图像边缘检测），
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
LeetCode算法题：电话号码的字母组合吱屋猪_ 算法 leetcode java
题目描述：给定一个仅包含数字2-9的字符串，返回所有它能表示的字母组合。答案可以按任意顺序返回。给出数字到字母的映射如下（与电话按键相同）。注意1不对应任何字母。2->"abc"3->"def"4->"ghi"5->"jkl"6->"mno"7->"pqrs"8->"tuv"9->"wxyz"例如，给定digits="23"，返回["ad","ae","af","bd","be","bf","cd
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
霍夫变换（Hough Transform）算法原来详解和纯C++代码实现以及OpenCV中的使用示例点云SLAM 算法图形图像处理算法 opencv 图像处理与计算机视觉算法直线提取检测目标检测霍夫变换算法
霍夫变换（HoughTransform）是一种经典的图像处理与计算机视觉算法，广泛用于检测图像中的几何形状，例如直线、圆、椭圆等。其核心思想是将图像空间中的“点”映射到参数空间中的“曲线”，从而将形状检测问题转化为参数空间中的峰值检测问题。一、霍夫变换基本思想输入：边缘图像（如经过Canny边缘检测）输出：一组满足几何模型的形状（如直线、圆）关键思想：图像空间中的一个点→参数空间中的一个曲线参数空
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
数字孪生技术为UI前端注入新活力：实现产品设计的沉浸式体验 ui设计前端开发老司机 ui
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：从“平面交互”到“沉浸体验”的UI革命当用户在电商APP中翻看3D家具模型却无法感知其与自家客厅的匹配度，当设计师在2D屏幕上绘制汽车内饰却难以预判实际乘坐体验——传统UI设计的“平面化、静态化、割裂感”
js动画html标签（持续更新中） 843977358 html js 动画 media opacity
1.jQuery 效果 - animate() 方法改变 "div" 元素的高度： $(".btn1").click(function(){ $("#box").animate({height:"300px
springMVC学习笔记 caoyong springMVC
1、搭建开发环境 a>、添加jar文件，在ioc所需jar包的基础上添加spring-web.jar,spring-webmvc.jar b>、在web.xml中配置前端控制器 <servlet> &nbs
POI中设置Excel单元格格式 107x poi style 列宽合并单元格自动换行
引用：http://apps.hi.baidu.com/share/detail/17249059 POI中可能会用到一些需要设置EXCEL单元格格式的操作小结：先获取工作薄对象: HSSFWorkbook wb = new HSSFWorkbook(); HSSFSheet sheet = wb.createSheet(); HSSFCellStyle setBorder = wb.
jquery 获取A href 触发js方法的this参数无效的情况一炮送你回车库 jquery
html如下： <td class=\"bord-r-n bord-l-n c-333\"> <a class=\"table-icon edit\" onclick=\"editTrValues(this);\">修改</a> </td>" j
md5 3213213333332132 MD5
import java.security.MessageDigest; import java.security.NoSuchAlgorithmException; public class MDFive { public static void main(String[] args) { String md5Str = "cq
完全卸载干净Oracle11g sophia天雪 orale数据库卸载干净清理注册表
完全卸载干净Oracle11g A、存在OUI卸载工具的情况下：第一步：停用所有Oracle相关的已启动的服务；第二步：找到OUI卸载工具：在“开始”菜单中找到“oracle_OraDb11g_home”文件夹中 &
apache 的access.log 日志文件太大如何解决 darkranger apache
CustomLog logs/access.log common 此写法导致日志数据一致自增变大。直接注释上面的语法 #CustomLog logs/access.log common 增加： CustomLog "|bin/rotatelogs.exe -l logs/access-%Y-%m-d.log
Hadoop单机模式环境搭建关键步骤 aijuans 分布式
Hadoop环境需要sshd服务一直开启，故，在服务器上需要按照ssh服务，以Ubuntu Linux为例，按照ssh服务如下： sudo apt-get install ssh sudo apt-get install rsync 编辑HADOOP_HOME/conf/hadoop-env.sh文件，将JAVA_HOME设置为Java
PL/SQL DEVELOPER 使用的一些技巧 atongyeye java sql
1 记住密码这是个有争议的功能，因为记住密码会给带来数据安全的问题。但假如是开发用的库，密码甚至可以和用户名相同，每次输入密码实在没什么意义，可以考虑让PLSQL Developer记住密码。位置：Tools菜单－－Preferences－－Oracle－－Logon HIstory－－Store with password 2 特殊Copy 在SQL Window
PHP：在对象上动态添加一个新的方法 bardo 方法动态添加闭包
有关在一个对象上动态添加方法，如果你来自Ruby语言或您熟悉这门语言，你已经知道它是什么...... Ruby提供给你一种方式来获得一个instancied对象，并给这个对象添加一个额外的方法。好！不说Ruby了，让我们来谈谈PHP PHP未提供一个“标准的方式”做这样的事情，这也是没有核心的一部分... 但无论如何，它并没有说我们不能做这样
ThreadLocal与线程安全 bijian1013 java java多线程 threadLocal
首先来看一下线程安全问题产生的两个前提条件： 1.数据共享，多个线程访问同样的数据。 2.共享数据是可变的，多个线程对访问的共享数据作出了修改。实例：定义一个共享数据： public static int a = 0;
Tomcat 架包冲突解决征客丶 tomcat Web
环境： Tomcat 7.0.6 win7 x64 错误表象：【我的冲突的架包是：catalina.jar 与 tomcat-catalina-7.0.61.jar 冲突，不知道其他架包冲突时是不是也报这个错误】严重: End event threw exception java.lang.NoSuchMethodException: org.apache.catalina.dep
【Scala三】分析Spark源代码总结的Scala语法一 bit1129 scala
Scala语法 1. classOf运算符 Scala中的classOf[T]是一个class对象，等价于Java的T.class,比如classOf[TextInputFormat]等价于TextInputFormat.class 2. 方法默认值 defaultMinPartitions就是一个默认值，类似C++的方法默认值
java 线程池管理机制 BlueSkator java线程池管理机制
编辑 Add Tools jdk线程池一、引言第一：降低资源消耗。通过重复利用已创建的线程降低线程创建和销毁造成的消耗。第二：提高响应速度。当任务到达时，任务可以不需要等到线程创建就能立即执行。第三：提高线程的可管理性。线程是稀缺资源，如果无限制的创建，不仅会消耗系统资源，还会降低系统的稳定性，使用线程池可以进行统一的分配，调优和监控。
关于hql中使用本地sql函数的问题（问-答） BreakingBad HQL 存储函数
转自于：http://www.iteye.com/problems/23775 问：我在开发过程中，使用hql进行查询（mysql5）使用到了mysql自带的函数find_in_set()这个函数作为匹配字符串的来讲效率非常好，但是我直接把它写在hql语句里面（from ForumMemberInfo fm,ForumArea fa where find_in_set(fm.userId,f
读《研磨设计模式》-代码笔记-迭代器模式-Iterator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.Arrays; import java.util.List; /** * Iterator模式提供一种方法顺序访问一个聚合对象中各个元素，而又不暴露该对象内部表示 * * 个人觉得，为了不暴露该
常用SQL chenjunt3 oracle sql C++c C#
--NC建库 CREATE TABLESPACE NNC_DATA01 DATAFILE 'E:\oracle\product\10.2.0\oradata\orcl\nnc_data01.dbf' SIZE 500M AUTOEXTEND ON NEXT 50M EXTENT MANAGEMENT LOCAL UNIFORM SIZE 256K ; CREATE TABLESPA
数学是科学技术的语言 comsci 工作活动领域模型
从小学到大学都在学习数学，从小学开始了解数字的概念和背诵九九表到大学学习复变函数和离散数学，看起来好像掌握了这些数学知识，但是在工作中却很少真正用到这些知识，为什么？最近在研究一种开源软件-CARROT2的源代码的时候，又一次感觉到数学在计算机技术中的不可动摇的基础作用，CARROT2是一种用于自动语言分类（聚类）的工具性软件，用JAVA语言编写，它
Linux系统手动安装rzsz 软件包 daizj linux sz rz
1、下载软件 rzsz-3.34.tar.gz。登录linux，用命令 wget http://freeware.sgi.com/source/rzsz/rzsz-3.48.tar.gz下载。 2、解压 tar zxvf rzsz-3.34.tar.gz 3、安装 cd rzsz-3.34 ; make posix 。注意：这个软件安装与常规的GNU软件不
读源码之:ArrayBlockingQueue dieslrae java
ArrayBlockingQueue是concurrent包提供的一个线程安全的队列,由一个数组来保存队列元素.通过 takeIndex和 putIndex来分别记录出队列和入队列的下标,以保证在出队列时不进行元素移动. //在出队列或者入队列的时候对takeIndex或者putIndex进行累加,如果已经到了数组末尾就又从0开始,保证数
C语言学习九枚举的定义和应用 dcj3sjt126com c
枚举的定义 # include <stdio.h> enum WeekDay { MonDay, TuesDay, WednesDay, ThursDay, FriDay, SaturDay, SunDay }; int main(void) { //int day; //day定义成int类型不合适 enum WeekDay day = Wedne
Vagrant 三种网络配置详解 dcj3sjt126com vagrant
Forwarded port Private network Public network Vagrant 中一共有三种网络配置，下面我们将会详解三种网络配置各自优缺点。端口映射(Forwarded port)，顾名思义是指把宿主计算机的端口映射到虚拟机的某一个端口上，访问宿主计算机端口时，请求实际是被转发到虚拟机上指定端口的。Vagrantfile中设定语法为： c
16.性能优化-完结 frank1234 性能优化
性能调优是一个宏大的工程，需要从宏观架构(比如拆分，冗余，读写分离，集群，缓存等)，软件设计（比如多线程并行化，选择合适的数据结构），数据库设计层面（合理的表设计，汇总表，索引，分区，拆分，冗余等）以及微观（软件的配置，SQL语句的编写，操作系统配置等）根据软件的应用场景做综合的考虑和权衡，并经验实际测试验证才能达到最优。性能水很深，笔者经验尚浅，赶脚也就了解了点皮毛而已，我觉得
Word Search hcx2013 search
Given a 2D board and a word, find if the word exists in the grid. The word can be constructed from letters of sequentially adjacent cell, where "adjacent" cells are those horizontally or ve
Spring4新特性——Web开发的增强 jinnianshilongnian spring spring mvc spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
CentOS安装配置tengine并设置开机启动 liuxingguome centos
yum install gcc-c++ yum install pcre pcre-devel yum install zlib zlib-devel yum install openssl openssl-devel Ubuntu上可以这样安装 sudo aptitude install libdmalloc-dev libcurl4-opens
第14章工具函数（上） onestopweb 函数
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Xelsius 2008 and SAP BW at a glance blueoxygen BO Xelsius
Xelsius提供了丰富多样的数据连接方式，其中为SAP BW专属提供的是BICS。那么Xelsius的各种连接的优缺点比较以及Xelsius是如何直接连接到BEx Query的呢？以下Wiki文章应该提供了全面的概览。 http://wiki.sdn.sap.com/wiki/display/BOBJ/Xcelsius+2008+and+SAP+NetWeaver+BW+Co
oracle表空间相关 tongsh6 oracle
在oracle数据库中，一个用户对应一个表空间，当表空间不足时，可以采用增加表空间的数据文件容量，也可以增加数据文件，方法有如下几种： 1.给表空间增加数据文件 ALTER TABLESPACE "表空间的名字" ADD DATAFILE '表空间的数据文件路径' SIZE 50M; &nb
.Net framework4.0安装失败 yangjuanjava .net windows
上午的.net framework 4.0，各种失败，查了好多答案，各种不靠谱，最后终于找到答案了和Windows Update有关系，给目录名重命名一下再次安装，即安装成功了！下载地址：http://www.microsoft.com/en-us/download/details.aspx?id=17113 方法： 1.运行cmd，输入net stop WuAuServ 2.点击开