IM 产品设计思考(4)- 问答机器人

这几年一直在做智能客服,过程中也参与了IM产品的部分功能设计,这里简单的谈谈自己对IM产品设计的一些思考。

前面几篇聊完了IM、客服 IM和呼叫中心产品,今天来聊了聊,这几年一直比较火热的智能客服问答机器人。

一、背景

国内的客服系统厂商的官网上,一般都会有这样的产品解决方案宣传:全渠道智能客服产品或平台。今天我就来说说这里的几个关键词:全渠道、智能、平台。

1.1 全渠道

传统的客服渠道是电话,后来伴随着互联网的发展,出现了邮件、网页、各种社交产品、各家的APP,客户反应问题的渠道也跟随变多。

渠道变多,客服系统需要支撑的功能也就变多,每一个渠道都有各自的特点,而座席工作台、问答机器人需要提供统一的交互和相同的服务,因此客服产品需要在渠道接入层提供更多的中间适配。

比如邮件客服的邮件服务器如何支撑多个客服,微信公众号如何支持富文本,电话如何实现复杂的信息收集、在线客服和电话客服如何混合工作等。

因此全渠道的意思有两层:

  1. 具有多个渠道接入客户咨询的能力
  2. 具有整合多个渠道,提供统一交互和客服服务的能力。

第二层含义在产品实现上有很多的挑战需要面对,最大的难点就是电话和文字的统一。

1.2 智能

一般的客户咨询都是来源与类C端的用户和客户,其咨询的特点是:

  1. 量大,我想这也是网上一直传腾讯没有人工客服的原因。
  2. 问题相似度比较集中,80%的客户咨询的问题集中在问题中的20%,符合二八原则。

基于这个背景才有了智能客服的需求。

智能客服的智能体现在智能回复,也就是利用AI技术和NLP算法,实现自动回复客户问题的能力。

这里不管是通过电话渠道还是在线渠道,都能通过渠道适配和转换实现自动回复,从而大量减轻客服的工作量,让客服更多聚焦在机器人不能解决的复杂问题上。

1.3 平台

科技企业和软件企业喜欢谈平台,客服产品的厂商也不例外,喜欢用平台来阐述自家产品的通用性、普世性和强大。

那智能客服的产品,其平台的特点是怎么体现的呢?

我个人理解主要是集成度高,将客服系统的各个子系统、子产品整合在一套产品中,给企业提供一站式的系统和服务,省去企业集成多家产品和系统的痛点。

比如智能客服平台实现了全渠道的接入能力,那这里就需要提供:

  1. 电话客服:交换机或软交换
  2. 在线客服:多种社交和IM平台的接入
  3. 智能客服:文本机器人和电话机器人
  4. AI平台:实现模型的训练和更新。

这里面的任何一个子产品和系统的工作量都很大,能够融合在一起,其难度自然不小,因而对真正需要客服系统的企业来说,也是很大的一个吸引点。

另外,一般需要客服的企业,在很早之前都已经有了自己的呼叫中心(Cisco、Genesys、Avaya、华为、中国电信、中国联通、中国移动),如果需要做智能化改造,原有系统的迁移和适配,也是产品需要考虑的点。

二、智能客服

因为交互方式的不同,也带来了技术实现的不同,对客服的要求也有很多不同,从前面几篇介绍中,我们可以知道,客服系统按照沟通方式,分为电话客服(语音)在线客服(文字)

2.1 智能在线客服(文字)

随着AI和NLP技术的发展,这些年智能客服产品就变的越来越普通了。我们生活中基本上随处可见:导航、购物、智能家居等等都有它的影子。

从智能客服出现的背景也能看出,它对传统客服产品的能力补充,是通过AI技术和NLP能力来提升客服工作效率和减轻客服压力的一种工具。

在线客服的发展要比电话机器人要早一些,主要还是所依赖技术的成熟程度。

一个智能在线客服的产品结构如下:

2.1.2 机器人配置

机器人的配置,分为几个方面:

  • 企业信息配置:这一部分主要用在网页聊天窗上

  • 基础配置:包括核心配置项和特定场景的话术配置

  • 渠道对接配置:这里是完成和业务系统对接

2.1.2.1 企业信息管理

企业信息管理主要设置企业名称,Logo,邮箱,官网地址,企业简介。

  • 企业名称和Logo会影响管理后台的左上角的Logo和名称。
  • 企业名称和Logo、官网地址、企业简介会影响网页聊天窗中的头部信息。
2.1.2.2 机器人配置

基础配置主要用来管理机器人各种参数和场景话术。所有的配置点和话术都给出了默认值,初始化阶段,在不做设置和修改的情况下即可使用机器人问答。

  • 基本设置

包括的内容有:

  1. 机器人名称:主要用来做为渠道中机器人默认名称
  2. 机器人头像:主要用来做为渠道中机器人默认名称
  3. 机器人语音:这里的语言主要是用来建立机器人的问答引擎可以支撑的语音,一个服务实例智能支持一种语音
  4. 使用词向量:开启后会在基于检索和相似度计算后得到的待排答案中通过词向量再次精排,提升问答准确率。
  5. 启用寒暄库:启用后,机器人在问答过程中会使用寒暄语料作为问答的兜底处理,比如可以回答:你好等问题
  6. 直接回复置信度:这里设定的值影响机器人直接回复的分数判断,相似度大于这个数值的答案直接回复。
  7. 未知回复置信度:这里设定的值影响机器人未知回复的分数判断,相似度小于这个数值时,机器人给出回复,在未知回复和直接回复之间,机器人给出反问引导。
  8. 访客下线时间:是指用户在多少时间没有和机器人交互后,会话会自动下线
  9. 启用答案满意度评价:开启后,在机器人给出访客提问问题的回复时,会带上对该答案是否满意的引导,引导用户对答案作出评价
  10. 会话满意度评价:开启后,在会话结束的时候,会推出会话满意度评价邀请,要求用户对当前会话给出评价。
  • 话术设置

话术设置主要是为了在各种固定场景中,能帮助机器人完成回复,比如在无法识别问题的情况下,如何回复等。

每一种固定的话术可以设置多条,在机器人使用话术时,按照具体的场景可以选择随即选择和全部使用两种方式

所有机器人相关的话术如下:

  1. 欢迎语推荐问题前置话术:猜你想问这些问题哦:
  2. 未知问题话术:哎呀,这个太难了,我还没有学习过,能换一个问题吗
  3. 敏感词话术:您的话中含有敏感信息哦,请注意用词哈
  4. 反问引导话术:我猜你想问:
  5. 答案满意度点赞话术:谢谢你的鼓励,我会加倍努力更好的回答问题哦
  6. 答案满意度点踩话术:呜呜,没能解决您的问题,我很伤心,呜呜
  7. 答案满意度不满意原因收集邀请话术:请指出我错在哪里了哦,以便我能及时改正哈
  8. 答案满意度不满意原因收集后话术:呜呜,我会知错就改的,期待我的改变哦
  9. 会话满意度邀评话术:给我的服务打个分哦
  10. 会话满意度评价后话术:谢谢你的使用,我会加倍努力,提供更好的服务哦
  11. 会话满意度评价其他原因收集邀请话术:还有其他想对我说的吗
  12. 访客下线提示话术:我已经下线了,感谢您的陪伴,如需继续咨询,请重新发送问题
  13. 答案评价不满意原因:答非所问、未解决问题
  14. 会话评价不满意原因:未解决问题、匹配不准、不智能
  15. 转人工技能组选择引导话术:为了更好的为您服务,请选择一个技能组:
  16. 转人工发起提示话术:正在为您转接人工服务
  17. 转人工排队引导话术:你可以继续向我提问哦
2.1.2.3 渠道对接

渠道管理主要用来管理业务系统与智能客服问答界面的对接,比如业务系统嵌入的网页聊天窗链接如何管理,社交平台的服务器配置参数等。

2.1.2 知识管理

在完成了机器人的配置后,我们进入到知识管理部分。知识管理分为三部分:语义、语料、标签

2.1.2.1 语义管理

语义管理主要负责管理在机器人问答分词引擎所需要的各类专业词、敏感词、停止词。

  • 专业词:是指具体的业务领域中约定俗成的词汇,比如外汇、订单、外卖、快递等,机器人内置的分词引擎只能处理通用领域中的常见词库,对于特定业务领域的词库,模型吸纳的较少,通过专业词的补充,可以有效提升分词引擎的准确率,进而提升问答的准确率。
  • 敏感词:在问答过程中,不希望客服提及的词汇,比如骂人的词、涉黄、涉暴等。
  • 停止词:这一部分是为了保证机器人在问答过程中更加关注核心词库,因此把常见的一些助词,介词等作为停止词,还有在特定行业中,经常出现的词,其对语义理解作用不大的词,也可以添加到这里。

除开词类型外,还有两种关系:

  • 同义词:这里记录的是两个词具有相同的含义,在机器人理解和识别时,可等价替换。
  • 枚举词:这里是记录两个词具有上下位关系,比如植物和水果,水果和苹果,在遇到这个词时,机器人可以做向上追溯和向下钻取,提升语义泛化能力。

管理功能在管理后台->语义管理->词库管理,在界面上所做的任何修改,15秒钟后机器人问答界面即可生效。

2.2.1.2 知识管理

知识管理主要管理机器人所需要的知识库,知识分为两部分:业务知识和寒暄知识,对知识提供新增、修改、删除功能。

这里非常重要的一点功能是沙盒管理,考虑对知识是机器人非常核心的数据,所以提供了对知识的管理,默认提供了沙盒机制,知识分类线上知识和沙盒知识。

  1. 新增和编辑的知识默认在沙盒中,状态为待生效,通过上线功能,将状态调整为生效中,此时机器人才能使用。

  2. 对知识的敏感操作,提供了审核机制,对不是管理员身份的用户,在编辑知识后发起上线时,需要管理员审核后才能变成上线,对下线和删除线上知识时也需要审核才能生效。

  • 业务知识

业务知识主要是特定行业中积累的FAQ,一般都是和业务相关的问题,比如如何兑换积分等。

知识的构成分为:标准问、相似问、答案、知识标签、答案标签。

  • 标准问和相似问是用来与用户的问题做匹配
  • 答案是匹配成功后推出到聊天界面的回复。
  • 知识标签和答案标签是用来实现知识隔离,对不同的渠道,不同的用户,可以问到不同的知识和不同的答案。这里的标签数据来源标签管理

相似问管理提供新增、修改、删除相似问,变动后需要上线才能生效。

  • 寒暄知识

寒暄知识与业务知识的区别是,寒暄知识不涉及业务,知识内容是关于业务以外的所有问题,比如机器人的形象相关、八卦等等。

知识管理功能与业务知识管理相同,这里多了一个功能,就是内置了机器人形象的语料,可以在初始化阶段,加载内置寒暄语料,快速构建机器人形象相关的知识。

另外,机器人能使用寒暄知识,还需要在机器人设置中启用寒暄库。

2.3.3 标签管理

标签管理功能主要是用来处理知识的隔离,可以实现一下场景:

  1. 实现不同的人可以问答不同的知识:通过知识标签完成。
  2. 不同的渠道可以应对不同的业务场景:通过知识标签完成
  3. 不同的人问到相同的知识,可以给出不同的答案:通过答案标签完成。
2.3.3.1 标签管理

标签按照树形结构管理,不同层级的标签具有向上兼容的能力,比如江苏的标签,可以涵盖南京的标签,从而实现绑定知识的向上兼容和向下细化。

一个标签具有多个条件,多个条件间可以为且(同时满足)和为或(任意一个满足)

2.3.3.2 条件管理

这里的条件是指标签对应的过滤规则,通过设定标签绑定的用户身份携带的信息,从而过滤绑定了标签的知识。

目前支持绑定的用户身份信息有:用户名称、性别、区域、渠道信息。

过滤逻辑为:用户进入聊天窗时携带的个人信息,提问后,机器人得到的知识和答案携带的标签,基于标签关联的条件与用户身份信息进行比对,如果相同则认为用户可以问该知识和答案,不相同,在给出未知回复。

2.1.3 问答服务

在完成了机器人的一系列配置和知识的初始化后,我们可以在问答界面进行问答了。

基本功能如下:

  1. 支持寒暄和业务问答
  2. 支持反问引导
  3. 支持留言和满意度评价
  • 反问引导

对与访客的问题,如果机器人识别后发现存在多种可能的知识,则会给出反问引导。

比如提问员工,这里就无法明确访客真实的意图,此时机器人会给出和员工相关的问题列表供访客二次确认,访客点击具体问题后,再给出精确的答案。

  • 未知回复

在机器人无法识别用户的问题时,会给出未知回复,判断的依据是依据机器人配置中的未知回复置信度,给出的回复是在话术配置中的位置回复话术。

  • 留言

在机器人想转人工,但人工客服不在线时,可以通过留言功能完成问题收集。

收集到的留言,管理后台留言管理中可以查看和处理,在留言的时候,提供了联系方式,此时客服可以通过联系方式对处理后的结果进行告知。

  • 会话满意度评价

在访客长时间未与机器人交互达到超时时间后,机器人会推送会话满意度邀评。

2.1.4 接入人工客服

为了提供更好的客服服务,在智能客服的背后,一般都会保证Human-in-the-loop的机制,提供转人工服务。这里最重要的是转人工策略。

  1. 配置渠道转人工策略
  2. 2.5.1 技能组管理

技能组是为了区分客服的技能和经验而建立了一种虚拟组,正常的技能组可以分为售前、售中、售后等类型,如果企业的业务比较复杂,可以区分的更为细致。

在完成了客服相关的配置和维护后,接下来要配置特定渠道的机器人对应的转人工策略。

转人工策略分类转人工方式、绑定技能组等:

2.5.5.1 转人工方式

转人工的方式分为四种:

  1. 机器人优先:进入聊天窗后,先有机器人服务,访客可以发起转人工
  2. 人工优先:进入聊天窗后,自动转人工,如果人工忙或不在线,继续由机器人服务
  3. 仅机器人:进入聊天窗后只能由机器人提供服务,不提供转人工能力
  4. 仅客服:进入聊天窗后,自动转人工,如果人工不在线,则会话结束,机器人不提供服务
2.5.5.2 转人工策略

选择了转人工方式后,还需要配置被动转人工的策略,一般提供如下类型的策略:

  1. 答案点踩触发:在答案点踩达到配置的阈值后,自动转人工
  2. 未知问题触发:在多次触发未知回复达到配置的阈值后,自动转人工。
  3. 不满意情绪触发:在提问问题中识别了不满情绪后,自动转人工
  4. 转人工问题:设定哪一些问题会自动转人工
  5. 转人工按钮:在界面上提供转人工按钮。
2.5.5.3 渠道对应技能组

在每一个渠道都需要配置该渠道能接入的技能组。

  • 如果绑定多个技能组,在该渠道的访客转人工时,需要选择技能组
  • 如果只有一个技能组,则默认转到该技能组下的客服
  • 如果没有配置技能组,则有系统自动分配技能。

2.2 智能电话客服(语音)

智能电话,其核心本质还是通过问答机器人完成业务问题的自动回复,但是由于其交互方式的不同,使得产品所依赖的技术也一些区别。

2.5 ASR和TTS

首先智能电话需要依赖的技术,是解决文字和语音的转换,这里两套技术一般是配套使用,语言转文字和文字转语音,这里的语音是需要符合8K采样频率的语音文件,才能与SIP server通信。

前几年,科大讯飞的语音识别能力爆光度很高,可以识别多种方言,这里的语音识别能力就是ARS,将语音转换成文字,转为文字后,我们就可以在文本机器人的范畴内实现问答。通过文本机器人得到答案后,我们再通过文字转语音的技术,将文字播报给客户,从而实现了电话端的自动问答。

2.5 电话机器人

电话机器人是融合了问答机器人的IVR系统,通过SIP协议与呼叫中心进行通信,通过呼叫中心提供语音信息给电话机器人,电话机器人通过ASR转录成文字,再通过语义识别引擎解析意图,基于多轮会话引擎和知识库,给出回复,再通过TTS将回复转换成语音,回传给呼叫中心,完成一轮交互。

在这个过程中,需要处理的异常点很多:

  • 打断
  • 环境音
  • 插问
  • 方言
  • 口音
  • 语言表达差异
  • ......

所有这些问题都需要在对话管理中很好的处理,才能保证电话机器人的服务质量和体验。

解决这些问题,需要集成的能力很多,比如文本机器人,会话引擎,ASR,TTS,这些能力一般是在一个Pip line上,所以它们的准确率不是简单的累加,而是累乘,所以误差会被放大。

2.6 外呼机器人

这种功能更多的应用在营销、通知、信息传达等场景,比如快递送达、逾期提醒、防疫通知、新品发布通知等。

这里参考了呼叫中心厂商的智能电话客服架构,大部分厂家的智能电话客服架构都是如此。

三、问答机器人

不管是智能在线客服,还是智能电话客服,其内部的核心还是问答机器人,问答机器人实现了自然语言作为输入,得到自然语言输出,完成问题的解答。

3.1 阶段划分

它的发展有经历了几个阶段,广义上讲,搜索引擎也算是问答机器人的初级版。

问答机器人的级别,这里引用了星空智能问答机器人开发者-Gavin的定义

  • Level 1 基于命令交互模式,10年之前的产品形态,比如命令行的终端交互,需要输入非常准确的命令,才能得到准确的答案。
  • Level 2 问答机器人,基于FAQs检索和相似度计算,这也是目前大部分问答机器人厂家产品的实现形态
  • Level 3 上下文理解,在问答过程中,可以理解用户的上下文信息,自动关联识别,比较少的问答机器人厂商达到了这个阶段。
  • Level 4 顾问式机器人,可能在未来的2年到5年内实现,融合了推荐和知识图谱,基于沟通内容,实时调整机器人的状态
  • Level 5 适应性机器人,可以在任何领域中适配,提供通用性和受限域问答。

3.2 需要解决的问题

那么问答机器人需要解决哪一些问题呢?

问答机器人就是要:

从问题出发,获得问题的答案。

因此可以划分为四个阶段,获得问题、问题分析、知识匹配、返回答案。

3.2.1 获得答案

在获得问题的层面,主要处理的是多种渠道的接入,比如微信、小程序、钉钉等,身份认证,第三方业务系统的集成,也就是嵌入到特定的业务系统,比如OA、各种APP中,交互方式上,有可能是文字,也可能是语音,需要处理TTS和ASR,可能还会有富媒体图片处理,需要提供OCR和图片识别。

  • 渠道接入
  • 身份认证
  • 第三方集成
  • ASR
  • OCR
  • TTS
  • 图片视频

3.2.2 问题分析

我们日常人与人的对话习惯,打字习惯,确定了我们在问题分析阶段,需要处理好字词分词和泛化、需要考虑对话的上下文,做好补全改写,需要考虑输入错误,中文特有的拼音容错、字形容错、特定对话中的意图判别,思考用户想表达什么,哪一些信息是需要重点关注和记录,基于文明沟通的基调,我们还需要处理禁止词、敏感词的检测等等。

  • 语义分词
  • 敏感词检测
  • 指代消解
  • 意图识别
  • 实体识别(NER)
  • 补全改写
  • 容错处理

3.2.3 知识匹配

在经过问题分析,我们得到了分词、泛化、归一、表达正确、有明确意图的问句后,这个时候就是各个机器人引擎出马的时候了,面对各种不同的场景、知识表现的类型,机器人需要满足基于信息检索的FAQ引擎,基于任务达成的多轮对话、基于表格数据的表格机器人、基于文档的阅读理解机器人,基于知识图谱的机器人,同时为了保持机器人的趣味性和拟人化,我们也需要各种类型的寒暄,比如查天气、讲笑话、调侃等,在特定的业务领域,我们还需要集成业务系统,帮助用户实行私人化个性化的查询服务,比如查积分、查余额、查账单等等。

  • FAQ-Bot
  • Task-Bot
  • Table-Bot(Text2SQL)
  • ChitChat-Bot
  • MRC-Bot
  • KG-Bot
  • 业务集成(Action)

3.2.4 返回答案

通过多个引擎的发力,我们得到了最终的待选答案,可能是多轮,可能是FAQ,也可能是表格或者是寒暄,面对多个待选项,我们需要决定怎么推送答案,此时需要结合渠道、访客身份、知识领域对答案进行筛选、组装,以达到特定端的需要,比如微信端的文本、实体端的语音加文字等,最终将合适的答案以合适的方式呈现给用户。

  • 渠道隔离
  • 用户角色
  • 多端适配
  • 答案组装
  • 领域隔离

以上就是在智能客服产品中我的个人理解。

至此,整个关于IM产品的认识和思考就介绍完了,希望我的理解能够给大家启到抛砖引玉的作用。

你可能感兴趣的:(IM 产品设计思考(4)- 问答机器人)