王小小小草

对话系统文献综述

一、简介

论文：https://arxiv.org/pdf/1711.01731.pdf
该论文对对话系统进行了综述，并讨论了今后可能的研究方向。

目前的对话系统大致被分成两类：

1 任务导向的对话系统

任务为导向的对话系统是帮助用户去完成特定任务，比如找商品，订住宿，订餐厅等。实现任务为导向的对话系统，主要有两类方式：

1) Pipeline method

通过4个步骤去完成对话任务

2)End-to-End method。

端到端地完成对话任务

2 非任务导向的对话系统

非任务导向的对话系统是与用户进行互动并提供回答，简单的说，就是在开放领域的闲聊。实现非任务导向对话系统也主要可分为两类：

1) generative method

生成式对话

2)retrived-based method

答案选择式对话

文章就以上两类对话系统，以及各自的实现方法进行详细综述与讲解。

二、任务导向的对话系统

1 Pipeline method

Pipeline method的步骤可以分为4个，过程如下图所示，分别是自然语言理解–>对话状态跟踪–>策略学习–>自然语言生成

1.自然语言理解 Natrual Language Understanding（NLU）

目标：将用户的输入语句转化为预先设定好的语义槽（semantic slot)

先来个例子：
在任务型对话系统中用户想要查酒店信息，于是说出一个句子：“show restaurant at New York tomorrow.”
理解这个句子需要两个步骤：
（1）首先要判断用户是需要订酒店，而不是订机票，买东西，查快递，那么这属于一个分类问题，即识别用户意图类别
（2）查酒店类别会有与之相对应的预先设定好语义槽(semantic slot),如New York是location的slot value.填充槽值的过程即在句中做词信息的抽取。

以上两步也可分别称作意图识别(intent detection)与槽填充(slot filling):

意图识别: 是分类问题，将用户发出的语句分类到预先设定好的意图类别中。简而言之，其实就是短文本的分类，最近一般都使用深度学习来做分类。

深度学习在意图识别中的应用：
“Use of kernel deep convex networks and end-to-end learning for spoken language understanding.(2012)”
“Towards deeper understanding: Deep convex networks for se- mantic utterance classification.(2012)”
“Zero- shot learning and clustering for semantic utterance classification using deep learning(2014)”
其中，使用卷积神经网络来抽取查询语句的向量表征(vector representations)：
“Query intent detection using convolutional neural networks(2016)”

**槽填充：**是序列标注问题，为句子中的每个词打上语义标签。输入是由一组序列的词组成的句子，输出是该组序列的词及词对应的语义类别（slot/concept ID)。可以类比中文分词，词性标注等问题。因此传统的做法有HMM，CRF等。最近效果较好的是DBN，RNN去做序列标注

使用了deep belief networ(DBNs)，取得优于CRF baseline的效果：
“Use of kernel deep convex networks and end-to-end learning for spoken language understanding.(2012)”
“Deep belief network based semantic taggers for spoken language understanding.(2013)”
[17]和[15]使用了deep belief networ(DBNs),
使用了RNN
“Investigation of recurrent-neural-network architectures and learning methods for spoken language understanding.(2013)”
“Recurrent neural networks for language understanding.(2013)”
“Spoken language understanding using long short-term memory neural networks.(2014)”

2.Dialogue State Tracking

根据对话历史管理每一轮对话的输入，并且预测当前对话的状态。对话状态Ht表示到时间t为止对话的表征（也叫做slot或semantic frame)。对话状态的跟踪主要有3个方面：the user’s goal, the user’s action, the dialogue history.

传统的方式：是使用手工做的规则来选择最可能的结果。但是错误率高。
基于统计的方式：
- 会对每轮对话都计算对每个state的概率分布。
  “The hidden information state model: A practical framework for pomdp- based spoken dialogue management（2010)”
- 对每轮对话的每个slot都计算概率分布
  “A belief tracking challenge task for spoken dialog systems.(2012)”
  “The dialog state tracking challenge.(2013)”
- 也有用手工规则的
  “A simple and generic belief tracking mechanism for the dialog state tracking chal- lenge: On the believability of observed information（2013）”
- 用CRF
  “Recipe for building robust spoken dialog state trackers: Dialog state tracking challenge system description(2013)”
  “Structured discriminative model for dialog state tracking（2013）”
  “Dialog state tracking using conditional random fields（2013）”
- 用最大熵模型
  “Multi-domain learning and generalization in dialog state tracking.（2013）”
- 用基于网络的排序
  “Web-style ranking and slu combina- tion for dialog state tracking（2014）”
基于深度学习：
- 深度学习在信念跟踪上的应用（可以跨领域应用）。
  “Deep neu- ral network approach for the dialog state tracking challenge（2013）”
- 多领域RNN对话跟踪
  “Multi-domain dialog state tracking using recurrent neural networks（2015）”
- 利用神经信念跟踪NBT检测每个slot pair
  “Neural belief tracker: Data-driven dialogue state tracking.（2017）”

3.Policay learning

根据当前对话状态做出下一步的反应。举个例子，在线上购物的场景中，若上一步识别出来的对话状态是“Recommendation",那么这一步骤就会给出对应推荐的action,即从数据库中获取商品。

监督学习：
- 首先一个rule-based agent用来做热启动，然后监督学习会在根据rule生成的action上进行：
  “Building task-oriented dialogue systems for on- line shopping”
强化学习：
- “Strategic dialogue management via deep reinforcement learning.(2015)”

4.Natural language generation（NLG）

将Policy learning给出的反应转换成相应的自然语言形式的回答提供给用户。一个好的回答生成器应具备4个特点：adequacy, fluent,readability and variation[78].

传统的方法[90;79]：使用sentence planning,将输入的语义特征转换成中间形式（比如树状或模版形式），然后再通过surface realization将中间形式转换成最终的回答。
深度学习的方法：[94;95]介绍了NN于LSTM结合的结构，类似于RNNLM；[94]使用前向RNN生成器，以及CNN和backwards RNN的reranker，所有子模型进行联合优化；[95;83]新增一个control celll来gate the dialogue act;[96]将前者在multiple-domain上改进于应用；[123]使用encode-decode LSTM-based,并结合了attention machanism;[20]使用sequence-to-sequence 方法。

2 end-to-end methods

特点：使用单个模型；可于外部的结构数据库进行交互

使用基于网络的端到端的可训练的对话系统。将对话系统的问题转换为学习一个映射（从历史对话–>回答）。但是，其需要大量训练数据并且缺少鲁棒性。
- *"A network-based end-to-end trainable task-oriented dialogue system(2017)”
- “end-to-end goal-oriented dialog(2017)”*
使用end-to-end 强化学习方法，联合训练对话跟踪于策略学习,但是也存在缺陷：不可微+无法获取语义不确定性。
- “Towards end-to-end learn- ing for dialog state tracking and management us- ing deep reinforcement learning.(2016)”
基于memory network,使用RNN+可微分attention
“Key-value retrieval networks for task-oriented dialogue(2017)”

三、非任务型对话

非任务型对话主流有两类：生成式对话和抽取式对话。

1 Neural generative models

Neural generative models主要是依赖于sequence to sequence的模型。但光建立一个序列模型还远远不够，一个好的对话系统还需要考虑：
（1）历史对话对当前对话的影响
（2）回答的多样性
（3）针对不同领域与用户个性提供不同的回答
（4）基于外部的知识库去做回答
（5）内部学习与评估(两个对话机器人互相对话作为训练）

1.Dialogue context

将历史对话的内容转换成词或短语向量的表征作为序列模型的特征
建立一个层级结构的attention机制去找出重要的历史语句
根据相关性去找出与问句最相关的context作为特征

2.Reponse Diversity

调整目标函数：使用maximum mutual information作为最优化目标
使用IDF去评估回答的多样性
调整beam search，使得输出多样回答
加入re-ranking步骤
增加输入信息的多样性
加入latent variable

3.Topic and personality

先用主题模型LDA去生成主题，将主题信息作为特征输入对话模型
将用户对话做领域的分类
加入emotional embedding到生成模型中
加入profile的信息
强化学习

4.Outside knowledge base

使用memory network使对话系统与知识库做交互
将知识库中的词语模型生成的词做结合

5.Evaluation

如何评价产生对话的好坏呢？

word overlap metrics:BLEU,METEOR,ROUGE
利用两个RNN来做评估
将context,the true response and candidate response表征成向量计算向量之间的相似性来评估
图灵测试
adversarial evaluation model

2 Retrieval-based method

Retrieval-based method是从候选答案中选出一个答案作为回答。主要有两个应用领域：
（1）单轮对话
（2）多轮对话

3 Hybrid methods

将以上生成式对话和抽取式对话结合起来，先从通过抽取模型抽取出答案，再将答案放到RNN中去生成回答。

其他很赞的博文： https://blog.csdn.net/Irving_zhang/article/details/78865708

对话系统是一个很大的领域，涉及了不限于NLP的方方面面，让机器拥有人类的对话能力姑且任重道远，探索之路也辛且艰，因此这方面的学习也需要从面到点，单个击破，之后我会将对话系统的学习和实践做好博客的记录，欢迎大家一起讨论。

你可能感兴趣的:(聊天机器人)

Rasa Webchat：开源聊天机器人组件乌昱有Melanie
RasaWebchat：开源聊天机器人组件rasa-webchatAfeature-richchatwidgetforRasaandBotfront项目地址:https://gitcode.com/gh_mirrors/ra/rasa-webchatRasaWebchat是一个开源项目，旨在为Rasa或Botfront开发的虚拟助手提供在任意网站上部署的聊天窗口组件。该项目主要使用JavaScri
使用 MistralAI 平台进行开源模型托管与调用 VYSAHF python
MistralAI是一个提供开放源码模型托管的平台，致力于帮助开发者更轻松地使用和管理开源模型。通过该平台，你可以方便地调用强大的深度学习模型，并将其集成到你的应用中。本文将带你了解如何利用MistralAI提供的服务来进行模型的托管和调用。技术背景介绍MistralAI的服务包括了如聊天模型和嵌入模型等，这些模型适用于聊天机器人、文本嵌入等各种场景。使用这些模型需要注册并获取一个有效的API密钥
使用LangChain与Amazon Bedrock构建JCVD风格的Chatbot scaFHIO langchain python
技术背景介绍在人工智能时代，构建一个智能化的聊天机器人不仅是一个趋势，更是提升与用户互动体验的关键之一。本文将向你展示如何使用LangChain和AmazonBedrock构建一个仿效让·克劳德·范·达美（JCVD）风格的聊天机器人。我们将借助于Anthropic提供的Claude模型，通过AmazonBedrock强大的基础设施来实现这一目标。核心原理解析LangChain作为一个强大的框架，简
LangChain入门：使用Python和通义千问打造免费的Qwen大模型聊天机器人南七小僧人工智能网站开发 AI技术产品经理服务器数据库 windows
前言LangChain是一个用于开发由大型语言模型（LargeLanguageModels，简称LLMs）驱动的应用程序的框架。它提供了一个灵活的框架，使得开发者可以构建具有上下文感知能力和推理能力的应用程序，这些应用程序可以利用公司的数据和APIs。这个框架由几个部分组成。LangChain库：Python和JavaScript库。包含了各种组件的接口和集成，一个基本的运行时，用于将这些组件组合
向量数据库 PieCloudVector 进阶系列丨打造以 LLM 为基础的聊天机器人
本系列前两篇文章深入探讨了PieCloudVector在图片和音频数据上的应用之后，本文将聚焦于文本数据，探索PieCloudVector对于文本数据的向量化处理、存储以及检索，并最终结合LLM打造聊天机器人的全流程。在自然语言处理任务中涉及到大量对文本数据的处理、分析和理解，而向量数据库在其中发挥了重要的作用。本文为《PieCloudVector进阶系列》的第三篇，将为大家介绍如何利用PieCl
使用MarkdownHeaderTextSplitter拆分Markdown文档 scaFHIO python 前端开发语言
在AI驱动的应用中，如聊天机器人或问答系统，处理大型文档时，通过分片技术将文档拆分为更小的单元是必要的步骤。尤其是对于Markdown格式的文件，它们通常由各种层级的标题结构化组织。通过按标题拆分，有利于保留文档的上下文语义一致性。本篇文章将讲解如何使用MarkdownHeaderTextSplitter来实现这一目标。技术背景介绍在将完整的段落或文档进行嵌入时，嵌入过程会考虑文本的整体上下文以及
AI：对比ChatGPT这类聊天机器人，人形机器人对人类有哪些不一样的影响？ InnoLink_1024 AGI 人工智能机器学习 chatgpt 人工智能机器人
人形机器人与像ChatGPT这样的聊天机器人相比，虽然都属于人工智能技术的应用，但由于其具备的物理形态和与环境的互动能力，它们对人类的影响会有很大的不同。下面从多个角度进行对比，阐述它们各自对人类的不同影响：1.物理交互与虚拟交互人形机器人：具有物理形态，能够在物理世界中与人类进行直接交互。例如，搬运物品、进行日常家务、提供身体上的帮助（如扶持老人、帮助走路等），以及进行非语言的沟通（如手势、面部
ChatGPT智能聊天机器人实现云端源想 chatgpt 机器人
以下是一个从零实现类ChatGPT智能聊天机器人的完整开发指南，包含技术选型、核心代码逻辑和推荐学习资源：—云端平台整理一、技术架构与工具核心模型基座模型：HuggingFaceTransformers库（如GPT-2/GPT-3.5TurboAPI/LLaMA2）轻量化方案：微软DeepSpeed或MetaFairScale（降低显存占用）训练框架PyTorchLightning+Acceler
精选AI大模型读物：《从ChatGPT到AIGC：智能创作与应用赋能》——探索智能时代的创作力量 AGI大模型老王人工智能 chatgpt AIGC AI大模型大模型
自2023年以来，AI聊天机器人ChatGPT火爆互联网，其颠覆性的使用体验重塑了人们对于AI的认知。而ChatGPT背后的技术―AIGC也引起了互联网圈的关注，打开了人们对AI应用的想象空间。本书从ChatGPT入手，以AIGC为中心，对AIGC的理论知识、应用场景、未来发展等内容进行了全面的梳理。首先，本书对AIGC的概念、技术构成、产业生态、市场现状等进行了讲解，以便读者对AIGC形成一个清
深入解析两大AI模型的架构与功能草莓屁屁我不吃人工智能 chatgpt
在人工智能（AI）领域，自然语言处理（NLP）一直是研究的热点之一。随着技术的不断进步，我们见证了从简单的聊天机器人到复杂语言模型的演变。其中，Google的Gemini和OpenAI的ChatGPT作为两大代表性模型，各自在技术和应用上展现出了卓越的性能。本文将详细解析Gemini和ChatGPT的系统架构、功能特性及其背后的技术原理。Gemini模型详解技术背景与架构Gemini，顾名思义，意
大语言模型微调和大语言模型应用区别 AI Echoes 深度学习人工智能自然语言处理
大语言模型微调和大语言模型应用区别微调与应用LLM的区别微调大语言模型（LLM）是指取一个已经预训练好的模型，进一步用特定数据集训练，使其更好地适应某个任务或领域，比如为医疗聊天机器人优化医疗术语理解。应用LLM则是直接使用这些预训练模型来完成任务，如通过提示生成文本或回答问题，无需更改模型本身。研究表明，微调适合需要领域专精的任务，而应用更适合通用任务，效果因模型和任务复杂性而异。学习所需技术栈
大模型火爆 2025：LLaMA、Qwen、DeepSeek 核心原理+就业秘籍，快速入门 AI 工程师 weixin_40941102 llama 人工智能
1.大模型核心原理：从零开始理解AI模型这些是大型语言模型（LLMs）的核心技术，适合初学者逐步深入学习。以下是详细拆解，让小白也能掌握：LLaMA系列模型核心原理详解：什么是LLaMA？：LLaMA是一个基于人工智能的语言模型，像一个超级聪明的聊天机器人，能理解和生成人类语言。它由Meta公司开发，类似ChatGPT，但更开源、灵活。核心原理：Transformer架构：想象一个工厂流水线，LL
科技创新：改变生活的力量与未来趋势 jiemidashi 科技生活人工智能经验分享
人工智能在智能客服中的应用越来越普遍。它改变了传统的客服模式。AI可以快速回答用户的问题，提高了客服效率和服务质量。首先，人工智能能够处理大量信息。智能客服可以在几秒钟内回应客户的请求。这比人工客服快得多。客户不需要等待很久就能得到答案。举个例子，某电商平台使用AI聊天机器人来处理用户咨询。这个机器人能够24小时工作，随时解决问题。这样，顾客体验得到了显著提升。其次，人工智能能提供个性化服务。通过
Python API接口君王的羔羊 Python AI python
人工智能机器人EverydayWechat老李API图灵机器人：http://www.turingapi.com/（需求实名制认证，并每天免费数量只有100条）青云客智能聊天机器人：http://api.qingyunke.com/（无须申请，无数量限制，但有点智障，分手神器。分手神器，慎用）智能闲聊（腾讯）：https://ai.qq.com/product/nlpchat.shtml(申请使用
聊天模型集成指南三月七꧁ ꧂ langchain+llm microsoft 语言模型 prompt 人工智能自然语言处理开发语言 llama
文章目录聊天模型集成指南Anthropic聊天模型集成PaLM2聊天模型集成OpenAl聊天模型集成聊天模型集成指南随着GPT-4等大语言模型的突破，聊天机器人已经不仅仅是简单的问答工具，它们现在广泛应用于客服、企业咨询、电子商务等多种场景，为用户提供准确、快速的反馈。在这样的背景下，开发者们急需一套可以轻松切换、集成不同平台的工具。正是基于这样的需求，Anthropic、PaLM2和Op
手把手教你搭建微信聊天机器人系列（一）：文心一言（百度千帆ERNIE-Bot大模型）API测试 AGI学习社微信机器人文心一言面试自然语言处理职场和发展人工智能
今年年初chatgpt大火，国产gpt文心一言也提供了内测服务，大家可以去访问官网申请体验。文心一言APP上的功能更加强大，可以看这个测评文章。作为程序猿的我们，想接入文心一言的能力，比如开发一个聊天机器人，要怎么做呢？百度在其开发者平台开放了大模型服务，下面就跟我一起来对接API吧。下面我先放出几张图，是我对接完的效果图，一个智能回复机器人。接下来几章，我会逐步教大家如何对接。全系列链接如下：手
NLP常见任务专题介绍（3）-垂直领域的聊天机器人搭建详细教程 AI专题精讲大模型专题系列自然语言处理机器人人工智能
一、整体流程构建垂直领域的聊天机器人需要结合特定行业的需求，采用自然语言处理和机器学习等技术。以下是一个典型的构建流程及相关技术实现：需求分析：明确机器人需要解决的问题范围和功能，例如客户服务、信息查询等。数据收集与预处理：数据收集：从行业相关的网站、论坛、数据库等渠道获取大量专业领域的文本数据。数据清洗：去除广告、无意义回复等噪声数据，确保数据质量。数据标注：对文本进行意图识别和实体识别的标注，
人工智能AI通用分级标准方法魔王阿卡纳兹 IT杂谈人工智能通用分级分类标准
人工智能（AI）的通用分级标准在近年来得到了广泛关注和研究，不同的机构和组织提出了多种分级框架，以帮助理解和评估AI的发展水平。以下是对人工智能通用分级标准的详细分析：1.OpenAI的五级分级标准OpenAI于2024年7月发布了通用人工智能（AGI）的五级分级标准，旨在追踪大型语言模型在AGI方面的进展。具体分级如下：第一级：聊天机器人具备语言对话能力的人工智能，如ChatGPT，能够进行基本
使用OpenAI API实现自然语言处理应用 shuoac 自然语言处理人工智能 python
使用OpenAIAPI实现自然语言处理应用技术背景介绍随着人工智能技术的不断发展，自然语言处理（NLP）在各种应用中的地位越来越重要。从自动文本生成、聊天机器人到智能搜索引擎，NLP技术的应用场景非常广泛。而OpenAI提供的API使得开发者可以轻松地将先进的NLP模型集成到他们的应用中。核心原理解析OpenAI的API基于强大的GPT（GenerativePre-trainedTransform
【花雕动手做】基于ESP32S3和通义千问大模型AI语音聊天机器人驴友花雕人工智能机器人嵌入式硬件单片机 c++基于ESP32S3 通义千问AI语音聊天机器人
开源项目1、核心功能：该项目利用ESP32S3开发板，结合通义千问大模型，实现了一个AI语音聊天机器人。用户可以通过语音与机器人进行交互，机器人能够理解用户的语音指令并给出相应的语音回答。2、技术架构：（1）语音识别：使用语音转文字大模型，将用户的语音输入转换为文本信息。（2）文本理解：将转换后的文本发送到通义千问大模型进行处理，模型会根据文本内容生成相应的回答。（3）语音合成：将模型生成的文本答
基于vue3实现的聊天机器人前端（附代码） P7进阶路前端
跟它说说话吧！一个活泼的伙伴，为你提供情感支持！??发送消息！import{ref,onMounted}from'vue';import{v4asuuidv4}from'uuid';//引入UUID生成库//响应式数据constmessage=ref('');//用户输入的消息constchatbox=ref(null);//聊天记录显示区的引用constchatId=ref(uuidv4());
Poe AI推出Previews预览功能！对标Claude Artifacts！ AI信息Gap 人工智能 ai gpt OpenAI chatgpt
Anthropic在发布最新模型Claude3.5Sonnet时，同时官宣了一个针对ClaudeAI重要的更新，那就是Artifacts。新功能Artifacts允许Claude用户在与聊天机器人的对话之外，通过一个专门的窗口分享、编辑和构建重要的独立内容。这些内容通常是超过15行的文本、代码片段、HTML网页、SVG图像、图表和交互式React组件等。用户可以在专用窗口中查看、复制和编辑这些内容
多平台 + 多模型 + 可扩展：轻松打造你的 All-in-One AI 聊天机器人 xiaoqiangclub 开源精选人工智能机器人 ai 聊天机器人开源项目
文章目录介绍开发环境打造你的专属AI聊天机器人✨项目亮点获取/使用⚓️相关链接⚓️介绍最近想搞一个能同时在多个平台和不同的大模型对话的工具，最好还能自己扩展功能。找了一圈，发现一个开源项目，它支持多种消息平台，像QQ、微信、飞书、钉钉、Discord、Telegram这些常用的都有，而且还支持ChatGPT、DeepSeek、Dify、Claude、Gemini等等一堆大模型，感觉很强大，今天就来
ManusAl引发全球关注：通用AI代理新篇章耶耶Norsea 网络杂烩人工智能
摘要近日，ManusAl合伙人张涛针对邀请码价格问题作出紧急回应。ManusAl作为首个通用AI代理，在全球范围内引起轰动，其性能超越了OpenAI的产品。ManusAl不仅是一个聊天机器人或工作流工具，它作为一个真正自主的主体，能够弥合概念与执行之间的差距。当其他AI还在生成想法时，ManusAl已经开始交付实际成果，代表了人机协作的新一代范式，让用户提前体验接近通用人工智能（AGI）的能力。关
使用LangChain构建大语言模型(LLM)应用程序: 基础入门 bavDHAUO langchain 语言模型服务器 python
使用LangChain构建大语言模型(LLM)应用程序:基础入门在这个教程中，我们将了解如何使用LangChain快速上手并构建一个基本的大语言模型(LLM)应用。我们将涵盖核心概念、基本实现和应用场景分析。技术背景介绍LangChain是一个强大的框架，旨在帮助开发人员构建涉及LLM的应用程序。从简单的聊天机器人到复杂的数据分析系统，LangChain提供了一整套工具来实现这一目标。核心原理解析
Manus VS DeepSeek：一文看懂两大AI平台核心差异 AI悦读社人工智能
一.Manus是什么？Manus是由中国创业公司Monica开发的全球首款通用型AIAgent产品。它不同于传统的聊天机器人如ChatGPT，后者只能回答问题或提供建议，而Manus、还能够独立思考，能像人类一样主动规划任务、操作电脑软件，最终直接把成果交到你手上。通俗来说，Manus就像是一个“会动脑还会动手的智能实习生”二.Manus与DeepSeek的鲜明对比？Manus：你的“全能数字同事
AstrBot：多平台 LLM 聊天机器人框架，让 AI 触手可及！ Hello server 机器人人工智能
产品概述AstrBot是一款多平台大型语言模型（LLM）聊天机器人及开发框架，提供松耦合、异步的AI机器人解决方案。它支持多种消息平台接入，拥有强大的插件系统和Agent执行能力，让AI具备更高的可扩展性和适应性。无论是个人开发者、企业客服、社区管理者，还是希望集成AI赋能业务的团队，AstrBot都是一个理想的选择！核心功能智能对话助手（AI聊天机器人）✅支持多种LLM（大语言模型）：OpenA
grok 3官网入口_grok 3国内使用指南人工智能
Grok是xAI于2023年11月推出的创新型语言模型。与市面上众多聊天机器人相比，Grok不只是一个简单的工具，它的推出标志着AI领域的一次重要突破。Grok被设计为一个具有独特个性和多重功能的智能助手，让它在人们的日常生活中扮演更加有趣和实用的角色。GrokAI的独特特性1.幽默感与个性化的“叛逆精神”Grok最与众不同的地方之一就是它被赋予了极具幽默感的个性。它不像传统的聊天机器人那样严肃、
spaCy 入门：自然语言处理的高效工具 zru_9602 人工智能自然语言处理人工智能
spaCy入门：自然语言处理的高效工具引言spaCy是一个功能强大的开源Python库，专注于工业级的自然语言处理（NLP）。它以其高效的性能、简洁的API和对多种语言的支持而闻名。无论是进行文本分析、信息提取还是构建智能聊天机器人，spaCy都是一个不可或缺的工具。本文将从零开始，介绍spaCy的基本功能和使用方法，并通过示例代码帮助你快速上手。1.安装spaCy在开始之前，首先需要安装spaC
grok 3官网入口_grok 3国内使用指南人工智能
Grok是xAI于2023年11月推出的创新型语言模型。与市面上众多聊天机器人相比，Grok不只是一个简单的工具，它的推出标志着AI领域的一次重要突破。Grok被设计为一个具有独特个性和多重功能的智能助手，让它在人们的日常生活中扮演更加有趣和实用的角色。GrokAI的独特特性1.幽默感与个性化的“叛逆精神”Grok最与众不同的地方之一就是它被赋予了极具幽默感的个性。它不像传统的聊天机器人那样严肃、
Spring的注解积累 yijiesuifeng spring 注解
用注解来向Spring容器注册Bean。需要在applicationContext.xml中注册： <context:component-scan base-package=”pagkage1[,pagkage2,…,pagkageN]”/>。如：在base-package指明一个包 <context:component-sc
传感器百合不是茶 android 传感器
android传感器的作用主要就是来获取数据,根据得到的数据来触发某种事件下面就以重力传感器为例; 1,在onCreate中获得传感器服务 private SensorManager sm;// 获得系统的服务 private Sensor sensor;// 创建传感器实例 @Override protected void
[光磁与探测]金吕玉衣的意义 comsci
这是一个古代人的秘密:现在告诉大家信不信由你们: 穿上金律玉衣的人,如果处于灵魂出窍的状态,可以飞到宇宙中去看星星这就是为什么古代
精简的反序打印某个数沐刃青蛟打印
以前看到一些让求反序打印某个数的程序。比如：输入123，输出321。记得以前是告诉你是几位数的，当时就抓耳挠腮，完全没有思路。似乎最后是用到%和/方法解决的。而今突然想到一个简短的方法，就可以实现任意位数的反序打印（但是如果是首位数或者尾位数为0时就没有打印出来了）代码如下： long num, num1=0;
PHP：6种方法获取文件的扩展名 IT独行者 PHP 扩展名
PHP：6种方法获取文件的扩展名 1、字符串查找和截取的方法 1 $extension = substr ( strrchr ( $file , '.' ), 1); 2、字符串查找和截取的方法二 1 $extension = substr
面试111 文强chu 面试
1事务隔离级别有那些，事务特性是什么（问到一次） 2 spring aop 如何管理事务的，如何实现的。动态代理如何实现，jdk怎么实现动态代理的，ioc是怎么实现的，spring是单例还是多例，有那些初始化bean的方式，各有什么区别（经常问） 3 struts默认提供了那些拦截器（一次） 4 过滤器和拦截器的区别（频率也挺高） 5 final，finally final
XML的四种解析方式小桔子 dom jdom dom4j sax
在平时工作中，难免会遇到把 XML 作为数据存储格式。面对目前种类繁多的解决方案，哪个最适合我们呢？在这篇文章中，我对这四种主流方案做一个不完全评测，仅仅针对遍历 XML 这块来测试，因为遍历 XML 是工作中使用最多的（至少我认为）。　　预备　　测试环境：　　AMD 毒龙1.4G OC 1.5G、256M DDR333、Windows2000 Server
wordpress中常见的操作 aichenglong 中文注册 wordpress 移除菜单
1 wordpress中使用中文名注册解决办法 1)使用插件 2)修改wp源代码进入到wp-include/formatting.php文件中找到 function sanitize_user( $username, $strict = false
小飞飞学管理-1 alafqq 管理
项目管理的下午题，其实就在提出问题（挑刺），分析问题，解决问题。今天我随意看下10年上半年的第一题。主要就是项目经理的提拨和培养。结合我自己经历写下心得对于公司选拔和培养项目经理的制度有什么毛病呢？ 1，公司考察，选拔项目经理，只关注技术能力，而很少或没有关注管理方面的经验，能力。 2，公司对项目经理缺乏必要的项目管理知识和技能方面的培训。 3，公司对项目经理的工作缺乏进行指
IO输入输出部分探讨百合不是茶 IO
//文件处理在处理文件输入输出时要引入java.IO这个包； /* 1，运用File类对文件目录和属性进行操作 2，理解流，理解输入输出流的概念 3，使用字节/符流对文件进行读/写操作 4，了解标准的I/O 5，了解对象序列化 */ //1，运用File类对文件目录和属性进行操作 //在工程中线创建一个text.txt
getElementById的用法 bijian1013 element
getElementById是通过Id来设置/返回HTML标签的属性及调用其事件与方法。用这个方法基本上可以控制页面所有标签，条件很简单，就是给每个标签分配一个ID号。返回具有指定ID属性值的第一个对象的一个引用。语法： &n
励志经典语录 bijian1013 励志人生
经典语录1: 哈佛有一个著名的理论：人的差别在于业余时间，而一个人的命运决定于晚上8点到10点之间。每晚抽出2个小时的时间用来阅读、进修、思考或参加有意的演讲、讨论，你会发现，你的人生正在发生改变，坚持数年之后，成功会向你招手。不要每天抱着QQ/MSN/游戏/电影/肥皂剧……奋斗到12点都舍不得休息，看就看一些励志的影视或者文章，不要当作消遣；学会思考人生，学会感悟人生
[MongoDB学习笔记三]MongoDB分片 bit1129 mongodb
MongoDB的副本集(Replica Set)一方面解决了数据的备份和数据的可靠性问题，另一方面也提升了数据的读写性能。MongoDB分片(Sharding)则解决了数据的扩容问题，MongoDB作为云计算时代的分布式数据库，大容量数据存储，高效并发的数据存取，自动容错等是MongoDB的关键指标。本篇介绍MongoDB的切片(Sharding) 1.何时需要分片 &nbs
【Spark八十三】BlockManager在Spark中的使用场景 bit1129 manager
1. Broadcast变量的存储，在HttpBroadcast类中可以知道 2. RDD通过CacheManager存储RDD中的数据，CacheManager也是通过BlockManager进行存储的 3. ShuffleMapTask得到的结果数据，是通过FileShuffleBlockManager进行管理的，而FileShuffleBlockManager最终也是使用BlockMan
yum方式部署zabbix ronin47 yum方式部署zabbix
安装网络yum库#rpm -ivh http://repo.zabbix.com/zabbix/2.4/rhel/6/x86_64/zabbix-release-2.4-1.el6.noarch.rpm 通过yum装mysql和zabbix调用的插件还有agent代理#yum install zabbix-server-mysql zabbix-web-mysql mysql-
Hibernate4和MySQL5.5自动创建表失败问题解决方法 byalias J2EE Hibernate4
今天初学Hibernate4，了解了使用Hibernate的过程。大体分为4个步骤： ①创建hibernate.cfg.xml文件 ②创建持久化对象 ③创建*.hbm.xml映射文件 ④编写hibernate相应代码在第四步中，进行了单元测试，测试预期结果是hibernate自动帮助在数据库中创建数据表，结果JUnit单元测试没有问题，在控制台打印了创建数据表的SQL语句，但在数据库中
Netty源码学习-FrameDecoder bylijinnan java netty
Netty 3.x的user guide里FrameDecoder的例子，有几个疑问： 1.文档说：FrameDecoder calls decode method with an internally maintained cumulative buffer whenever new data is received. 为什么每次有新数据到达时，都会调用decode方法？ 2.Dec
SQL行列转换方法 chicony 行列转换
create table tb(终端名称 varchar(10) , CEI分值 varchar(10) , 终端数量 int) insert into tb values('三星' , '0-5' , 74) insert into tb values('三星' , '10-15' , 83) insert into tb values('苹果' , '0-5' , 93)
中文编码测试 ctrain 编码
循环打印转换编码 String[] codes = { "iso-8859-1", "utf-8", "gbk", "unicode" }; for (int i = 0; i < codes.length; i++) { for (int j
hive 客户端查询报堆内存溢出解决方法 daizj hive 堆内存溢出
hive> select * from t_test where ds=20150323 limit 2; OK Exception in thread "main" java.lang.OutOfMemoryError: Java heap space 问题原因： hive堆内存默认为256M 这个问题的解决方法为：修改/us
人有多大懒，才有多大闲 (评论『卓有成效的程序员』) dcj3sjt126com 程序员
卓有成效的程序员给我的震撼很大，程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得做着重复单调的工作。在看这本书之前，我属于勤奋的人，而看完这本书以后，我要努力变成懒惰的人。不要在去庞大的开始菜单里面一项一项搜索自己的应用程序，也不要在自己的桌面上放置眼花缭乱的快捷图标
Eclipse简单有用的配置 dcj3sjt126com eclipse
1、显示行号 Window -- Prefences -- General -- Editors -- Text Editors -- show line numbers 2、代码提示字符 Window ->Perferences，并依次展开 Java -> Editor -> Content Assist，最下面一栏 auto-Activation
在tomcat上面安装solr4.8.0全过程 eksliang Solr solr4.0后的版本安装 solr4.8.0安装
转载请出自出处： http://eksliang.iteye.com/blog/2096478 首先solr是一个基于java的web的应用，所以安装solr之前必须先安装JDK和tomcat，我这里就先省略安装tomcat和jdk了第一步：当然是下载去官网上下载最新的solr版本，下载地址
Android APP通用型拒绝服务、漏洞分析报告 gg163 漏洞 android APP 分析
点评：记得曾经有段时间很多SRC平台被刷了大量APP本地拒绝服务漏洞，移动安全团队爱内测（ineice.com）发现了一个安卓客户端的通用型拒绝服务漏洞，来看看他们的详细分析吧。 0xr0ot和Xbalien交流所有可能导致应用拒绝服务的异常类型时，发现了一处通用的本地拒绝服务漏洞。该通用型本地拒绝服务可以造成大面积的app拒绝服务。针对序列化对象而出现的拒绝服务主要
HoverTree项目已经实现分层 hvt 编程 .net Web C#ASP.ENT
HoverTree项目已经初步实现分层，源代码已经上传到 http://hovertree.codeplex.com请到SOURCE CODE查看。在本地用SQL Server 2008 数据库测试成功。数据库和表请参考：http://keleyi.com/a/bjae/ue6stb42.htmHoverTree是一个ASP.NET 开源项目，希望对你学习ASP.NET或者C#语言有帮助，如果你对
Google Maps API v3: Remove Markers 移除标记天梯梦 google maps api
Simply do the following: I. Declare a global variable: var markersArray = []; II. Define a function: function clearOverlays() { for (var i = 0; i < markersArray.length; i++ )
jQuery选择器总结 lq38366 jquery 选择器
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40
基础数据结构和算法六：Quick sort sunwinner Algorithm Quicksort
Quick sort is probably used more widely than any other. It is popular because it is not difficult to implement, works well for a variety of different kinds of input data, and is substantially faster t
如何让Flash不遮挡HTML div元素的技巧_HTML/Xhtml_网页制作刘星宇 html Web
今天在写一个flash广告代码的时候，因为flash自带的链接，容易被当成弹出广告，所以做了一个div层放到flash上面，这样链接都是a触发的不会被拦截，但发现flash一直处于div层上面，原来flash需要加个参数才可以。让flash置于DIV层之下的方法，让flash不挡住飘浮层或下拉菜单，让Flash不档住浮动对象或层的关键参数：wmode=opaque。方法如下：
Mybatis实用Mapper SQL汇总示例 wdmcygah sql mysql mybatis 实用
Mybatis作为一个非常好用的持久层框架，相关资料真的是少得可怜，所幸的是官方文档还算详细。本博文主要列举一些个人感觉比较常用的场景及相应的Mapper SQL写法，希望能够对大家有所帮助。不少持久层框架对动态SQL的支持不足，在SQL需要动态拼接时非常苦恼，而Mybatis很好地解决了这个问题，算是框架的一大亮点。对于常见的场景，例如：批量插入/更新/删除，模糊查询，多条件查询，联表查询，

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他