CoreJT

对话系统 | (3) 阿里云小蜜对话机器人背后的核心算法

原文地址

分享嘉宾：唐呈光阿里巴巴算法专家
编辑整理：刘汝洲
内容来源：阿里小蜜 & DataFun AI Talk
出品社区：DataFun

阿里小蜜智能对话开发平台是智能服务事业部推出的面向各行各业的对话构建平台，此次分享将结合平台，对小样本下的语言理解、用户模拟器和基于模型的对话管理的算法研究和落地进行介绍。

文章目录

对话系统简介
自然语言理解
平台视角下的对话管理

对话管理成功的三要素：
基于 TaskFlow 的业务建模
具备鲁棒性
可持续学习
Dialog State Tracking（DST）
Policy: A2C-ER with TaskFlow bootstrapping

用户模拟器

Simulation System
User Simulator - 对话诊断

总结

对话系统简介

对话系统的一般架构如图：

这是我们所熟知的对话系统框架，这里面主要有：NLU 自然语言理解，DM 对话管理，NLG 自然语言生成3个主要模块，DM 里面有 dialog state tracking 用于对话状态追踪，policy 用于对话策略管理。

当我们在执行一个对话任务时，例如“开发票”，系统不仅要识别用户的需求，还需要与外部系统对接，进行订单号的合法性校验，调用开发票接口等，这时候 DM 不仅要完成与用户的交互、管理槽位信息，还需要访问外部接口，管理调用的结果。

当构建好一个机器人后，还需要进行对话的诊断，效果评测，才能发布上线，如果这些工作全都让人来完成，整个过程会非常费力，于是我们引入了用户模拟器来提高整体交付效率。

云小蜜对话机器人核心算法主要包括三部分：1. 自然语言理解；2. 对话管理；3. 用户模拟器。

自然语言理解

由于云小蜜对话机器人需要满足各行各业各种场景下的对话服务需求，所以我们的自然语言理解是平台视角下的自然语言理解。根据训练样本的多少，我们把它分为3种不同的情况：无样本、小样本、多样本。在没有样本的情况下，我们提供了一套简单易懂的规则表示语法，帮助用户实现快速冷启动。以查天气为例，用户只需写1条规则，就能表示100多个句子。

在小样本的情况下，比如共10个类别的意图，每个意图下有十多个样本，这种情况下还不足以训练一个有监督模型，但我们可以借助平台数据积累的优势，当只有少量样本的情况下，也可以做出比较好的结果。

实现思路：我们先整理出一个大数量级的数据（十万级别），每一个类目几十条数据，为它建立 meta-learning 任务。对于一个具体任务来说：构建支撑集和预测集，通过 few-shot learning 的方法训练出 model，同时与预测集的 query 进行比较，计算 loss 并更新参数，然后不断迭代让其收敛。这只是一个 meta-learning 任务，我们可以反复抽样获得一系列这样的任务，不断优化同一个模型。在线预测阶段，用户标注的少量样本就是支撑集，将 query 输入模型获得分类结果。实验表明，few-shot learning 的效果优于无监督相似度匹配的方法。

具体是怎么实现的呢？我们借鉴了图像领域的工作，图像领域大多数工作都只考虑了样本的信息，但是在 NLP 领域样本的信息可能会存在噪声或冗余，比如说“开发票”场景，用户在表述开发票这个事情，除了常见的“我要开发票“、”帮忙开一张发票“以外，他还可能会说：“你好，我前两天在你们店里买了一条裙子，请问现在能帮我开下发票吗？”而这样的句子是普遍存在的，我们需要对这些句子进行归纳，得到类别的信息，然后再与要预测的 query 比较语义相似度。它的神经网络结构分为3部分，首先是 Encoder 将句子变成句子向量，然后再通过 Induction Network 变成类向量，最后通过 Relation Network 计算向量距离，输出最终的结果。

Memory-based Induction Network 是我们在 Induction Network 的基础上引入了 memory 机制，目的是模仿人类的记忆和类比能力，在效果上又有进一步提升。

Induction Network 很关键的一部分就是怎么把样本向量抽象到类向量，我们采用的是 matrix transformation 的方法，下图显示的是1个 5-way 10-shot 的数据，转换前，几个类很难区分，类中心不够内聚，转换后，类边界更清晰，更利于下游 relation 的计算。

当业务方有一定标注数据的情况下，我们就考虑上监督模型了。在云小蜜实际业务场景中，企业相关的标注数据的获取成本是比较高的，因此有监督模型的目标是希望让业务方能够在标注数据量不是很大的情况下达到很好的效果，因此我们构建了一个三层的模型，最底层是具有较强迁移能力的通用模型 BERT，在此基础上构建不同行业的模型，最后用相对较少的企业数据来训练模型。这样构建出来的企业的 NLU 分类模型，F1 基本都在90%+。

这种模型也有缺点，就是它的结构比较复杂，在线预测的时候延时会比较长，在真实生成环境中应用落地有困难，所以我们通过知识蒸馏的方法来进行模型压缩，在效果相当的同时预测效率更快了。

在实际业务场景的多数情况下，任务型对话和 FAQ 型问答一般都是同时存在的，我们也引入了多任务学习（multi-task learning），能让任务共享底层的信息并互相增强，使得模型具有更强的泛化能力。在政务场景里，我们通过多任务学习， acc 提升两个点以上。

简单小结一下，这是 NLU 的整体能力输出的能力版图：

平台视角下的对话管理

对话管理成功的三要素：

业务建模：能够对不同行业不同场景的业务进行抽象，能够用一套统一的表示体系建模，保证业务逻辑的正常运行；
具备鲁棒性：能够很好的处理业务未定义的通用对话需求和各种异常情况；
持续学习的能力：能够在与用户交互的过程中，不断的学习，不断适应新场景，根据用户的反馈调整系统的对话策略。

基于 TaskFlow 的业务建模

我们以“火车票”场景为例，一个有经验的卖火车票的售票员在指导一个新售票员的时候，他会把常见的对话样例描述出来，让新售票员知道用户怎么问，我该怎么答，同时他还会告诉新售票员需要查询哪些系统才能获得票务信息，以及有票和无票的情况下分别怎么回复用户。

基于对上述真实场景的观察，我们对整个交互过程进行抽象，我们认为对话的基本单元是一个 turn ( 一轮 )，它可以拆解为3部分：用户说、机器人思考和机器人回复，分别对应三个基础节点：触发节点、函数节点和回复节点。上面说的是单轮的情形，如果把所有的后一轮的触发节点接到前一轮的回复节点后面，就构成了一个多轮交互 ( multi-turn ) 的对话。

为了让 TaskFlow 在平台上执行，我们设计了一种双层状态机的方案，上层是对话逻辑，底层是一套通用的对话引擎，通过这种解耦的设计，不论上层的业务逻辑如何变化，下层都用一套统一的引擎在支撑，如果想赋能上层业务，只需要不断升级底层的能力，上层的所有业务都会受益。

具备鲁棒性

如果对话管理只能保证用户已定义的业务逻辑正确运行，它的鲁棒性还不够，还需要考虑更多情形，包括：通用对话能力和异常处理能力，如图：

总体的实现思路是，通过系统内置 TaskFlow 实现对话鲁棒性。以“流量包业务”的对话中模糊澄清为例，我们采用插件化的方式实现，在用户定义的 TaskFlow 基础上，增加澄清 TaskFlow，它的功能包括：

判定是否需要触发澄清；
选择澄清的策略：是隐式澄清还是显示澄清，是单意图澄清还是多意图澄清；
澄清话术的生成

在上线之前，系统会把这两部分的 Taskflow 进行编译和链接，变成一个可执行的 Taskflow，然后放进执行引擎提供在线服务。其他的功能，比如重听，个性化拒识等都是采用同样的方法实现。

可持续学习

以上的两部分能力都是解决对话中高频、确定的部分问题。如果希望用户在实际对话中越聊越好，仅有以上部分是不够的，需要利用好对话数据，建立对话模型，去 cover 中长尾对话行为，并且基于反馈快速调整对话策略，从而获得更好高价值的智能。

持续学习：

总体分为3步：

构建 DM 模型，保证它是可学习的；
让模型可交互学习；
支持在线学习。

训练模型得先有数据，我们构建了一个用户模拟器，让它与机器人对话，从而获得大量的带标注的数据，然后分别训练 DST 模型和 Policy 模型，这一步完成了机器人知识的蒸馏，可以获得一个与规则系统效果上等价的 DM 模型。接下来，对 User Goals 进行采样，通过用户模拟器对 DM 模型进行交互，利用 Reward Evaluator 模型进行 Reward 打分，从而获得大量的 Transition 四元组：

利用增强学习 A2C 算法训练，直至收敛。然后发布到线上，进行在线学习。

Dialog State Tracking（DST）

真实场景下，我们的 DST 与学术界相比，有以下几点主要差异

多智能体建模：DM 不仅跟用户交互，还跟多个外部服务交互，这些服务都可以看做是一个个智能体；
追踪变量：外部返回的结果会存储在变量中，我们的 DST 扩展了数据形式；
slot-value 假设：学术界假设 slot value 都是离散可枚举的，哪怕是“时间”类型的值，会通过静态化处理进行简化，这显然和实际情况不符，我们不做这样的假设；
追踪次数：我们对每轮对话中 tracking 的次数不做约束。

如上图所示，一共有两轮对话，每一轮有两次对话追踪。

DST 模型的输入是上一轮对话的状态、上一轮系统行为、当前轮用户 utterance、API 返回，输出是当前轮的对话状态。

这个模型的核心是 operator。在“约会议”场景中，工号的 slot value 一直在变化，开会时间也是不可枚举，如果把 slot value 加入到模型中训练，在预测的时候就会遇到未知的 slot value，此时模型效果就变差。operator 的操作对象是 slot 本身，它只关心信息的流转，而不关心具体 value 是什么，它摆脱了对 value 具体值的依赖，因此具备更强的适应能力。

Policy: A2C-ER with TaskFlow bootstrapping

下图表示的是增强学习的数据收集和训练的过程。首先，用户输入 user act(t)，进入一个对话状态 state(t)，经过 feature generator 模块，得到 b(t)，接着把它输入到 policy 网络获得 act(t)，这个 act 会和对话状态一起输入到一个 Reward Evaluator 模型进行打分，得到 reward(t)，然后进入下一个对话状态 state(t+1)，这时候会得到一个 experience，它包括：

四元组，然后通过 off-policy 的方式进行训练，而这里收集到的样本分布和 policy 真正输出的样本分布存在偏差，可以利用重要性采样 ( Importance Sampling ) 的方法进行修正，这样能训出一个比较好的 policy 模型。

用户模拟器

Simulation System

从上面所说的 DM 模型的训练过程，我们可以看到用户模拟器起到非常重要的作用，这里我们介绍一下用户模拟器的实现原理。

我们的用户模拟器是以 Taskflow 为根基构建的，触发节点展开后形成的抽样树对应用户策略，函数节点+回复节点的串联对应用户状态管理，这是实现用户模拟器的基础。

它由3部分组成：User State Tracker、User Policy 和 User Model。其中 User Model 可以针对不同的任务设定不同的参数，比如：生成对话数据，对话评测，它们的 Goal 和 Profile 都可以不一样，这样既保证是一套统一的建模框架，同时又保证了系统的灵活性。

具体的应用场景如下：

User Simulator - 对话诊断

这是一个公积金查询的对话流，它一共有175条路径，如果要去覆盖需要输入1000次以上，这个过程耗时耗力。

为了解决这个问题，我们提出了利用一个机器人诊断另外一个机器人的想法，具体的实现架构如下图所示：

它的基本逻辑是，首先有一个对话系统，它加载的是 Taskflow，对话系统与用户模拟器交互，产生对话日志，这里面有成功的 session 也有失败的 session，如果是失败的，会把它送到一个诊断分析的模块，进行错误分析和路径统计，得到错误详情及问题产生原因，反馈给业务人员，业务人员根据提示修正 Taskflow，然后重新诊断，以此往复直到所有的问题都解决。

总结

vLLM（Virtual Large Language Model）框架：一个开源的高性能推理和服务的框架彬彬侠大模型 vLLM 高性能推理 PagedAttention python 大模型
vLLM（VirtualLargeLanguageModel）是一个开源的高性能推理和服务的框架，专为大语言模型（LLM）设计，旨在优化推理速度、内存效率和吞吐量。它通过创新的内存管理和调度技术（如PagedAttention）解决了传统LLM推理中的内存瓶颈和性能问题，广泛应用于对话系统、文本生成、实时翻译等场景。以下是对vLLM框架的详细介绍，包括其核心特性、工作原理、架构、优势、局限性以及使
15.5 情感识别准确率86.2%！LanguageMentor实时动态对话系统让学习效率飙升15% 少林码僧学习 langchain llama 人工智能语言模型
情感识别准确率86.2%！LanguageMentor实时动态对话系统让学习效率飙升15%LanguageMentorAgent高级对话功能：情感识别与动态调整关键词：情感分析集成、动态难度调节、多模态上下文感知、实时反馈机制、对话状态管理1.情感识别架构设计通过三层处理实现智能对话调节：
100个AI大模型基础概念（收藏版）程序员鑫港人工智能大模型 ai 开发语言 java 大语言模型 LLM
在人工智能技术快速发展的时代背景下，大模型作为核心驱动力，正深刻改变着各行业的发展模式与应用场景。从自然语言处理到计算机视觉，从智能对话系统到科学研究辅助，大模型展现出强大的通用性和适应性。本文将从基础概念、核心技术、数据处理、训练方法、评估体系、应用场景、伦理安全等多个维度，系统阐述100个AI大模型的关键基础知识，帮助读者全面理解这一前沿技术领域。前排提示，文末有大模型AGI-CSDN独家资料
15.2 LLaMA 3面试模拟神器：动态难度调节+实时反馈，大厂通过率提升90% 少林码僧 llama 面试职场和发展 langchain 人工智能语言模型
LLaMA3面试模拟神器：动态难度调节+实时反馈，大厂通过率提升90%关键词：对话系统设计、场景化提示工程、LLaMA3微调、多轮对话管理、面试模拟Agent技术面试场景Agent设计核心逻辑通过多阶段对话流程控制和动态难度调节实现真实面试模拟，技术架构包含：
程序代码篇---ESP32-S3小智固件 Atticus-Orion 深度学习篇程序代码篇上位机知识篇 AI Esp32-S3 小智
Q1：ESP32-S3小智语音对话系统的整体架构是怎样的？A1：该系统采用“语音采集→唤醒词检测→ASR→NLP→TTS→语音播放”的流水线架构：硬件层：ESP32-S3芯片+麦克风阵列（如INMP441）+扬声器（如MAX98357A）。驱动层：ESP-IDF或Arduino框架提供的I2S、ADC、DAC驱动。算法层：唤醒词检测：基于MicroML（如TensorFlowLiteMicro）。
Spring Boot + LangChain 构建 RAG 应用程序员丸子 langchain AI大模型语言模型自然语言处理人工智能大语言模型 RAG
使用LangChain构建RAG应用程序什么是RAG？检索增强生成（Retrieval-AugmentedGeneration,RAG）是一种结合了检索和生成两种关键技术的机器学习方法。这种方法在自然语言处理任务中特别有效，例如对话系统和问答系统。RAG的关键组件检索：•RAG首先从大型数据集或知识库中检索与用户查询相关的文档或数据。•通常使用信息检索技术，如向量搜索或关键词匹配。生成：•在检索到
Spring AI 对话记忆持久化实战-MySQL方案、BeYourself springAI spring mysql java
让AI对话拥有"长期记忆"的能力，告别金鱼般的7秒记忆！在构建智能对话系统时，记忆管理是决定用户体验的关键因素。SpringAI提供了强大的记忆管理功能，本文将手把手教你如何配置Redis和MySQL两种不同的记忆存储方案，让你的AI应用拥有持久的对话记忆能力！一、SpringAI中对话记忆的实现方式SpringAI提供了多种实现对话记忆的方式，以满足不同应用场景的需求。其中，常见的方式包括数据库
自然语言处理分类要奋斗呀自然语言处理
NLP学习Nlp基本分类NLP领域的任务分为两个类别:第一类是人工智能NLP。包括词性标注，分词，语法解析，语言模型，信息检索，信息抽取，语义表示，文本分类。这些任务发展较为成熟，各种相关工作的主要目的是提高当前模型的性能。第二类是人工智障NLP。包括机器翻译，对话系统，问答系统。目前模型的性能尚不尽如人意，有些任务上甚至没有足够多的，真正有影响力的工作。一、文本分类--情感分类1.定义情感分类是
【AI大模型应用开发】3.2 RAG实战 - RAG应用+UI实现加载本地文件并对话同学小张大模型 python 人工智能 ui 笔记经验分享 python chatgpt agi
大家好，我是【同学小张】。持续学习，持续干货输出，关注我，跟我一起学AI大模型技能。前面我们实现了RAG基本流程，今天我们在此基础上给它加个UI界面，在浏览器打开，实现上传本地文件、解析，并用大模型实现与该文档的对话。也就是一个阉割版demo版的ChatPDF或知识库对话系统。界面采用Python的gradio库，这个库在机器学习和大模型界很火，它运行后会启动一个Web服务器，并在默认浏览器中打开
LLM输出优化秘籍：Dify参数调节技巧大揭秘！ AI大模型-大飞人工智能机器学习大模型 AI大模型程序员语言模型大模型教程
引言随着大语言模型（LLM）在文本生成、对话系统等领域的广泛应用，参数调节已成为开发者必须掌握的核心技能。本文深入解析温度（Temperature）、TopP、TopK等关键参数的作用机制，并提供面向不同场景的配置策略，帮助开发者实现生成质量与多样性的精准控制。一、核心参数详解1.温度（Temperature）作用机制：通过softmax函数调整预测分布调节范围：0-1效果对比：温度值生成质量多样
智能引擎驱动产业跃迁：人工智能产业化浪潮中的机遇与挑战
个人主页：慌ZHANG-CSDN博客期待您的关注一、前言：从“智能技术”到“智能产业”过去十年，人工智能从实验室技术走向产业应用，经历了三个关键阶段：感知智能（PerceptionAI）：如图像识别、语音识别；认知智能（CognitiveAI）：如自然语言处理、对话系统、搜索与推荐；决策智能（DecisionAI）：如自动驾驶、智能制造、企业决策支持。当前，生成式AI和大模型进一步推动人工智能深度
PyTorch深度学习框架60天进阶学习计划 - 第58天端到端对话系统（二）：流式优化与生产部署凡人的AI工具箱深度学习 pytorch 学习人工智能自动化 python
PyTorch深度学习框架60天进阶学习计划-第58天端到端对话系统（二）：流式优化与生产部署欢迎回来，我的AI工程师朋友们！经过第一部分的学习，我们已经搭建了一个基础的端到端对话系统。但是，就像一辆刚下生产线的汽车还需要精心调校才能上路一样，我们的对话系统也需要进一步优化才能在真实场景中发挥最大价值！今天我们要做的事情更加激动人心——我们要让系统变得更快、更稳定、更智能！想象一下，当用户和你的A
PyTorch深度学习框架60天进阶学习计划 - 第58天端到端对话系统（三）凡人的AI工具箱深度学习 pytorch 学习 llama 人工智能 python
PyTorch深度学习框架60天进阶学习计划-第58天端到端对话系统（三）6.生产级流式对话系统集成现在到了最激动人心的部分——将所有流式组件整合成一个完整的生产级系统！这就像指挥一个交响乐团，每个乐器都要在正确的时间演奏正确的音符，最终奏出美妙的和谐乐章。#production_dialog_system.py-生产级流式对话系统importasyncioimporttimeimportthre
基于 LLM + 向量库的文档对话实战：从技术到落地的全攻略 charles666666 人工智能自然语言处理数据库语言模型产品经理
在当今数字化转型浪潮中，企业文档管理与知识利用效率一直是IT行业的痛点所在。大量文档堆积，员工查询低效，不仅浪费人力成本，更可能导致关键信息的延迟获取。今天，本文将深入探讨如何结合LLM（大语言模型）与向量库，打造一款高效、精准的文档对话系统，助力企业实现知识管理的智能化升级，为各位IT管理决策者提供一份具有实操价值的参考指南。一、技术背景随着人工智能技术的飞速发展，LLM在自然语言处理领域展现出
揭秘文心一言在AI人工智能领域的智能游戏开发 AI智能探索者 AI Agent 智能体开发实战文心一言人工智能 ai
揭秘文心一言在AI人工智能领域的智能游戏开发关键词：文心一言、AI游戏开发、智能NPC、自然语言处理、游戏设计、机器学习、AIGC摘要：本文深入探讨了百度文心一言大模型在智能游戏开发领域的创新应用。我们将从技术原理、实现方法到实际案例，全面解析如何利用文心一言打造更智能、更沉浸的游戏体验。文章将涵盖智能NPC对话系统、动态剧情生成、游戏关卡设计、玩家行为分析等核心应用场景，并提供具体的代码实现和项
13.10 LangGraph多轮对话系统实战：Ollama私有部署+情感识别优化全解析少林码僧人工智能 langchain 语言模型
LangGraph多轮对话系统实战：Ollama私有部署+情感识别优化全解析LanguageMentor对话式训练系统架构与实现关键词：多轮对话系统设计、场景化提示工程、情感识别优化、LangGraph状态管理、Ollama私有化部署1.对话训练系统技术架构采用四层架构实现高扩展性的对话训练系统：
对比分析：Rasa、Dialogflow等主流意图识别框架 AI原生应用开发 ai
对比分析：Rasa、Dialogflow等主流意图识别框架——从“翻译官”到“定制师”的对话系统实战指南关键词：意图识别、对话系统、Rasa、Dialogflow、自然语言理解（NLU）摘要：在智能客服、语音助手等AI产品中，“听懂人话”是核心能力。本文将以“意图识别框架”为切入点，用“翻译官”“定制厨房”等生活化比喻，对比分析Rasa（开源派代表）与Dialogflow（商业云服务代表）的技术原
自然语言处理助力AI人工智能实现智能交互
自然语言处理助力AI人工智能实现智能交互关键词：自然语言处理（NLP）、智能交互、人工智能（AI）、深度学习、预训练模型、对话系统、多模态交互摘要：本文深入探讨自然语言处理（NLP）如何成为AI实现智能交互的核心技术支撑。从基础概念到前沿应用，系统解析NLP的核心原理（如句法分析、语义理解、生成模型）、关键算法（如Transformer、预训练模型）及数学基础（统计语言模型、神经概率模型）。通过实
RAG基础知识概述原味奶茶_三分甜人工智能
RAG（Retrieval-AugmentedGeneration）是一种自然语言处理模型架构，旨在结合检索和生成两个关键的NLP（NaturalLanguageProcessing）任务。RAG模型可以应用于诸如问答系统、文本摘要、对话系统等多个领域。1.1RAG模型概述检索增强生成（RetrievalAugmentedGeneration），简称RAG，已经成为当前最火热的LLM应用方案。RA
大模型模型推理的成本过高，如何进行量化或蒸馏优化大模型大数据攻城狮大模型量化知识蒸馏 python面试 BERT 量化感知 prompt
在人工智能的浪潮中，大模型已经成为推动技术革新的核心引擎。从自然语言处理到图像生成，再到复杂的多模态任务，像GPT、BERT、T5这样的庞大模型展现出了惊人的能力。它们在翻译、对话系统、内容生成等领域大放异彩，甚至在医疗、金融等行业中也开始扮演重要角色。可以说，这些模型正在重塑我们对智能的理解，也为无数应用场景注入了新的可能性。然而，伴随着强大性能而来的，是令人咋舌的推理成本。想象一下，运行一个拥
大数据最新大模型学习路线与建议：掌握大模型学习路径大模型教程大数据学习人工智能大模型 AI大模型程序员 AI
1既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新第一章深度学习基础第二章智能对话系统基础第三章大模型基础第四章大模型应用实践第五章大模型实战项目第一章深度学习基础深度学习基础深度学习经典模型解
【LlamaIndex】基于 Qwen + LlamaIndex 构建多轮记忆式情感对话系统1.0版一叶千舟 AI大模型应用【项目实例】人工智能 LLM Llamaindex qwen
目录一、项目简介二、核心技术栈三、环境准备四、自定义洛溪：提示词是灵魂五、一步步搭建AI洛溪1️⃣初始化模型&Prompt2️⃣构建有记忆的聊天引擎3️⃣加入“初始剧情”，增加沉浸感六、实时对话体验七、后续优化八、完整运行代码九、总结：不仅仅是“女朋友”在大语言模型飞速发展的今天，聊天机器人不仅能答题解惑、写代码、写文案，还能成为“情感陪伴”的载体。今天，我们将带你用不到100行代码，打造一个**
智能对话系统的短期记忆管理：LangGraph 实战指南小何慢行 LangGraph langchain python AI编程
在构建智能对话系统时，短期记忆管理是实现流畅、连贯对话的关键。LangGraph提供了强大的工具来管理智能体的短期记忆，帮助开发者轻松实现这一目标。本文将通过实际代码示例，详细讲解如何在LangGraph中使用短期记忆来跟踪对话历史，并通过总结和修剪消息历史记录来优化对话管理。基本信息模型调用通义千问（阿里Tongyi大模型）短期记忆：通过维护会话中的消息的历史记录，来跟踪正在进行的对话。短期记忆
深度学习实战108-基于通义千问Qwen2.5-Omni的智能数字人实时对话系统实现微学AI 深度学习实战(进阶)大模型的实践应用深度学习人工智能 Qwen LLM Omni
大家好，我是微学AI，今天给大家介绍一下深度学习实战108-基于通义千问Qwen2.5-Omni的智能数字人实时对话系统实现。通义千问Qwen2.5-Omni作为全球首个端到端全模态大模型，实现了多模态输入与实时输出的完美结合，为构建智能数字人实时对话系统提供了强大技术支持。本报告将详细阐述基于该模型的智能数字人对话系统开发流程，包括项目背景、技术架构、实现代码及测试优化策略，帮助开发者快速构建具
基于WebRTC的实时语音对话系统：从语音识别到AI回复今天也想MK代码持续学习持续总结人工智能 webrtc 语音识别
基于WebRTC的实时语音对话系统：从语音识别到AI回复在当今数字化时代，实时语音交互已成为人机界面的重要组成部分。本文将深入探讨一个基于WebRTC技术的实时语音对话系统，该系统集成了语音识别(ASR)、大语言模型(LLM)和语音合成(TTS)技术，实现了完整的语音到语音的交互体验。源码系统架构概览我们的系统采用了前后端分离的架构，主要包含以下核心组件：前端WebRTC客户端：负责音频采集和播放
利用Neo4j实现强大的向量存储与对话历史管理 bhawfgrcbtwny neo4j python
引言在多模态对话系统中，结合向量检索和图数据库的能力，可以显著提高用户交互体验和数据分析能力。这篇文章将探讨如何使用Neo4j作为向量存储，并利用其图形功能存储和检索用户会话的对话历史。主要内容环境配置在开始之前，需要配置以下环境变量：exportOPENAI_API_KEY=exportNEO4J_URI=exportNEO4J_USERNAME=<YOUR_NEO4J_USE
【LangChain】langchain_core.prompts.ChatPromptTemplate 类：为聊天模型设计的提示模板类彬彬侠 LangChain langchain langchain_core prompts ChatPromptTempl 提示模板
langchain_core.prompts.ChatPromptTemplate是LangChain框架中专为聊天模型设计的提示模板类，用于创建结构化、动态的消息序列。它支持定义系统消息、用户消息和助手消息，并允许在消息中插入变量，广泛应用于对话系统、问答链和代理应用。本文将从定义、核心功能、创建方法、应用场景、示例代码和注意事项等方面，系统讲解ChatPromptTemplate的功能与使用方
大语言模型应用指南：Prompt高效微调 AI大模型应用实战 java python javascript kotlin golang 架构人工智能
大语言模型应用指南：Prompt高效微调关键词：大语言模型,Prompt,微调,参数高效,自然语言处理(NLP),对话系统,知识图谱,数据增强1.背景介绍1.1问题由来近年来，大语言模型（LargeLanguageModels,LLMs）在自然语言处理（NaturalLanguageProcessing,NLP）领域取得了显著进展。预训练模型通过在大规模无标签文本数据上进行训练，学习了丰富的语言知
大语言模型应用指南：交互格式 AI天才研究院 AI大模型企业级应用开发实战 LLM Agent 应用开发计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
大语言模型应用指南：交互格式关键词：大语言模型、交互格式、提示工程、上下文管理、对话系统、人机交互、自然语言处理1.背景介绍随着人工智能技术的快速发展，大语言模型（LargeLanguageModels，LLMs）已经成为了自然语言处理领域的重要突破。这些模型能够理解和生成人类语言，为各种应用场景提供了强大的支持。然而，要充分发挥大语言模型的潜力，我们需要深入理解并掌握与之交互的最佳实践。本文将重
神经网络开发实战：从零基础到企业级应用（含CNN、RNN、BP网络代码详解） Android洋芋神经网络 cnn rnn 深度学习激活函数与损失函数神经网络分层架构反向传播与参数优化
简介神经网络作为深度学习的核心，正在成为现代AI应用的基石。从基础的感知机到复杂的Transformer架构，从图像识别到自然语言处理，神经网络技术的演进推动了人工智能的快速发展。本文将系统介绍神经网络的核心概念、主流模型及其实现原理，并通过三个企业级实战案例（医学图像分类、对话系统开发和光伏预测）展示如何从零开始构建神经网络应用。每个案例都包含完整的Python代码实现、详细解释和部署策略，确保
安装数据库首次应用 Array_06 java oracle sql
可是为什么再一次失败之后就变成直接跳过那个要求 enter full pathname of java.exe的界面这个java.exe是你的Oracle 11g安装目录中例如：【F:\app\chen\product\11.2.0\dbhome_1\jdk\jre\bin】下的java.exe 。不是你的电脑安装的java jdk下的java.exe！注意第一次，使用SQL D
Weblogic Server Console密码修改和遗忘解决方法 bijian1013 Welogic
在工作中一同事将Weblogic的console的密码忘记了，通过网上查询资料解决，实践整理了一下。一.修改Console密码打开weblogic控制台，安全领域 --> myrealm -->&n
IllegalStateException: Cannot forward a response that is already committed Cwind java Servlets
对于初学者来说，一个常见的误解是：当调用 forward() 或者 sendRedirect() 时控制流将会自动跳出原函数。标题所示错误通常是基于此误解而引起的。示例代码： protected void doPost() { if (someCondition) { sendRedirect(); } forward(); // Thi
基于流的装饰设计模式木zi_鸣设计模式
当想要对已有类的对象进行功能增强时，可以定义一个类，将已有对象传入，基于已有的功能，并提供加强功能。自定义的类成为装饰类模仿BufferedReader，对Reader进行包装，体现装饰设计模式装饰类通常会通过构造方法接受被装饰的对象，并基于被装饰的对象功能，提供更强的功能。装饰模式比继承灵活，避免继承臃肿，降低了类与类之间的关系装饰类因为增强已有对象，具备的功能该
Linux中的uniq命令被触发 linux
Linux命令uniq的作用是过滤重复部分显示文件内容，这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个及以后更多个重复行将被删去，行比较是根据所用字符集的排序序列进行的。该命令加工后的结果写到输出文件中。输入文件和输出文件必须不同。如果输入文件用“- ”表示，则从标准输入读取。 AD： uniq [选项] 文件说明：这个命令读取输入文件，并比较相邻的行。在正常情况下，第二个
正则表达式Pattern 肆无忌惮_ Pattern
正则表达式是符合一定规则的表达式，用来专门操作字符串，对字符创进行匹配，切割，替换，获取。例如，我们需要对QQ号码格式进行检验规则是长度6~12位不能0开头只能是数字，我们可以一位一位进行比较，利用parseLong进行判断，或者是用正则表达式来匹配[1-9][0-9]{4,14} 或者 [1-9]\d{4,14} &nbs
Oracle高级查询之OVER (PARTITION BY ..) 知了ing oracle sql
一、rank()/dense_rank() over(partition by ...order by ...) 现在客户有这样一个需求，查询每个部门工资最高的雇员的信息，相信有一定oracle应用知识的同学都能写出下面的SQL语句： select e.ename, e.job, e.sal, e.deptno from scott.emp e, (se
Python调试矮蛋蛋 python pdb
原文地址： http://blog.csdn.net/xuyuefei1988/article/details/19399137 1、下面网上收罗的资料初学者应该够用了，但对比IBM的Python 代码调试技巧： IBM：包括 pdb 模块、利用 PyDev 和 Eclipse 集成进行调试、PyCharm 以及 Debug 日志进行调试： http://www.ibm.com/d
webservice传递自定义对象时函数为空，以及boolean不对应的问题 alleni123 webservice
今天在客户端调用方法 NodeStatus status=iservice.getNodeStatus(). 结果NodeStatus的属性都是null。进行debug之后，发现服务器端返回的确实是有值的对象。后来发现原来是因为在客户端，NodeStatus的setter全部被我删除了。本来是因为逻辑上不需要在客户端使用setter，结果改了之后竟然不能获取带属性值的
java如何干掉指针，又如何巧妙的通过引用来操作指针————>说的就是java指针百合不是茶
C语言的强大在于可以直接操作指针的地址，通过改变指针的地址指向来达到更改地址的目的,又是由于c语言的指针过于强大，初学者很难掌握， java的出现解决了c，c++中指针的问题 java将指针封装在底层，开发人员是不能够去操作指针的地址，但是可以通过引用来间接的操作：定义一个指针p来指向a的地址（&是地址符号）：
Eclipse打不开，提示“An error has occurred.See the log file ***/.log” bijian1013 eclipse
打开eclipse工作目录的\.metadata\.log文件，发现如下错误： !ENTRY org.eclipse.osgi 4 0 2012-09-10 09:28:57.139 !MESSAGE Application error !STACK 1 java.lang.NoClassDefFoundError: org/eclipse/core/resources/IContai
spring aop实例annotation方法实现 bijian1013 java spring AOP annotation
在spring aop实例中我们通过配置xml文件来实现AOP，这里学习使用annotation来实现，使用annotation其实就是指明具体的aspect,pointcut和advice。1.申明一个切面(用一个类来实现)在这个切面里,包括了advice和pointcut AdviceMethods.jav
[Velocity一]Velocity语法基础入门 bit1129 velocity
用户和开发人员参考文档 http://velocity.apache.org/engine/releases/velocity-1.7/developer-guide.html 注释 1.行级注释## 2.多行注释#* *# 变量定义使用$开头的字符串是变量定义，例如$var1, $var2, 赋值使用#set为变量赋值，例
【Kafka十一】关于Kafka的副本管理 bit1129 kafka
1. 关于request.required.acks request.required.acks控制者Producer写请求的什么时候可以确认写成功，默认是0， 0表示即不进行确认即返回。 1表示Leader写成功即返回，此时还没有进行写数据同步到其它Follower Partition中 -1表示根据指定的最少Partition确认后才返回，这个在 Th
lua统计nginx内部变量数据 ronin47 lua nginx　统计
server { listen 80; server_name photo.domain.com; location /{set $str $uri; content_by_lua ' local url = ngx.var.uri local res = ngx.location.capture(
java-11.二叉树中节点的最大距离 bylijinnan java
import java.util.ArrayList; import java.util.List; public class MaxLenInBinTree { /* a. 1 / \ 2 3 / \ / \ 4 5 6 7 max=4 pass "root"
Netty源码学习-ReadTimeoutHandler bylijinnan java netty
ReadTimeoutHandler的实现思路：开启一个定时任务，如果在指定时间内没有接收到消息，则抛出ReadTimeoutException 这个异常的捕获，在开发中，交给跟在ReadTimeoutHandler后面的ChannelHandler，例如 private final ChannelHandler timeoutHandler = new ReadTim
jquery验证上传文件样式及大小(好用) cngolon 文件上传 jquery验证
<!DOCTYPE html> <html> <head> <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> <script src="jquery1.8/jquery-1.8.0.
浏览器兼容【转】 cuishikuan css 浏览器 IE
浏览器兼容问题一：不同浏览器的标签默认的外补丁和内补丁不同问题症状：随便写几个标签，不加样式控制的情况下，各自的margin 和padding差异较大。碰到频率:100% 解决方案：CSS里 *{margin:0;padding:0;} 备注：这个是最常见的也是最易解决的一个浏览器兼容性问题，几乎所有的CSS文件开头都会用通配符*来设
Shell特殊变量：Shell $0, $#, $*, $@, $?, $$和命令行参数 daizj shell $#$?特殊变量
前面已经讲到，变量名只能包含数字、字母和下划线，因为某些包含其他字符的变量有特殊含义，这样的变量被称为特殊变量。例如，$ 表示当前Shell进程的ID，即pid，看下面的代码： $echo $$ 运行结果 29949 特殊变量列表变量含义 $0 当前脚本的文件名 $n 传递给脚本或函数的参数。n 是一个数字，表示第几个参数。例如，第一个
程序设计KISS 原则-------KEEP IT SIMPLE, STUPID! dcj3sjt126com unix
翻到一本书，讲到编程一般原则是kiss：Keep It Simple, Stupid.对这个原则深有体会，其实不仅编程如此，而且系统架构也是如此。 KEEP IT SIMPLE, STUPID! 编写只做一件事情，并且要做好的程序；编写可以在一起工作的程序，编写处理文本流的程序，因为这是通用的接口。这就是UNIX哲学.所有的哲学真正的浓缩为一个铁一样的定律，高明的工程师的神圣的“KISS 原
android Activity间List传值 dcj3sjt126com Activity
第一个Activity： import java.util.ArrayList;import java.util.HashMap;import java.util.List;import java.util.Map;import android.app.Activity;import android.content.Intent;import android.os.Bundle;import a
tomcat 设置java虚拟机内存 eksliang tomcat 内存设置
转载请出自出处：http://eksliang.iteye.com/blog/2117772 http://eksliang.iteye.com/ 常见的内存溢出有以下两种: java.lang.OutOfMemoryError: PermGen space java.lang.OutOfMemoryError: Java heap space ------------
Android 数据库事务处理 gqdy365 android
使用SQLiteDatabase的beginTransaction()方法可以开启一个事务，程序执行到endTransaction() 方法时会检查事务的标志是否为成功，如果程序执行到endTransaction()之前调用了setTransactionSuccessful() 方法设置事务的标志为成功则提交事务，如果没有调用setTransactionSuccessful() 方法则回滚事务。事
Java 打开浏览器 hw1287789687 打开网址 open浏览器 open browser 打开url 打开浏览器
使用java 语言如何打开浏览器呢? 我们先研究下在cmd窗口中,如何打开网址使用IE 打开 D:\software\bin>cmd /c start iexplore http://hw1287789687.iteye.com/blog/2153709 使用火狐打开 D:\software\bin>cmd /c start firefox http://hw1287789
ReplaceGoogleCDN：将 Google CDN 替换为国内的 Chrome 插件 justjavac chrome Google google api chrome插件
Chrome Web Store 安装地址： https://chrome.google.com/webstore/detail/replace-google-cdn/kpampjmfiopfpkkepbllemkibefkiice 由于众所周知的原因，只需替换一个域名就可以继续使用Google提供的前端公共库了。同样，通过script标记引用这些资源，让网站访问速度瞬间提速吧
进程VS.线程 m635674608 线程
资料来源： http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/001397567993007df355a3394da48f0bf14960f0c78753f000 1、Apache最早就是采用多进程模式 2、IIS服务器默认采用多线程模式 3、多进程优缺点优点：多进程模式最大
Linux下安装MemCached 字符串 memcached
前提准备：1. MemCached目前最新版本为：1.4.22，可以从官网下载到。2. MemCached依赖libevent，因此在安装MemCached之前需要先安装libevent。2.1 运行下面命令，查看系统是否已安装libevent。[root@SecurityCheck ~]# rpm -qa|grep libevent libevent-headers-1.4.13-4.el6.n
java设计模式之--jdk动态代理（实现aop编程） Supanccy2013 java DAO 设计模式 AOP
与静态代理类对照的是动态代理类，动态代理类的字节码在程序运行时由Java反射机制动态生成，无需程序员手工编写它的源代码。动态代理类不仅简化了编程工作，而且提高了软件系统的可扩展性，因为Java 反射机制可以生成任意类型的动态代理类。java.lang.reflect 包中的Proxy类和InvocationHandler 接口提供了生成动态代理类的能力。 &
Spring 4.2新特性-对java8默认方法(default method)定义Bean的支持 wiselyman spring 4
2.1 默认方法(default method) java8引入了一个default medthod; 用来扩展已有的接口,在对已有接口的使用不产生任何影响的情况下,添加扩展使用default关键字 Spring 4.2支持加载在默认方法里声明的bean 2.2 将要被声明成bean的类 public class DemoService {