干货| 聊天机器人对知识图谱有哪些特殊的需求?

今天,你AI了没?

关注:决策智能与机器学习,每天学点AI干货



1.聊天机器人需要更个性化的知识图谱

对聊天机器人来说,除了需要实体知识图谱和兴趣知识图谱等开放领域稀疏大图,还需要针对机器人和用户的个性化稠密小图。机器人或Agent需要相应的知识图谱来建模并展示自我认知能力,而用户知识图谱则可以被看作更精细化和个性化的用户画像知识表现。图1对比了开放领域稀疏大图和描述机器人属性及用户属性的个性化稠密小图的知识图谱。

干货| 聊天机器人对知识图谱有哪些特殊的需求?_第1张图片

图1  开放领域稀疏大图与个性化稠密小图的对比

机器人“琥珀·虚颜”,有自身的情感状态、喜好、技能等知识维度,而用户则需要表达其职业状态和生活轨迹等信息。需要强调的是,无论是个性化小图还是开放领域大图,都不是独立存在的,在实际工程应用时需要将它们融合在一起才能发挥更大的价值。例如,机器人喜欢的明星需要和实体知识图谱中的明星娱乐图谱关联;同样,机器人的爱好需要与兴趣图谱关联;机器人需要与用户形成亲人、好友、雇佣等社会关系。

2.聊天机器人不仅需要静态知识图谱,还需要动态知识图谱

若一个聊天机器人想要更像人,就需要从早到晚做不同的事情,也就是需要有自己的生活规律,研发时又该如何刻画这个聊天机器人的生活轨迹呢?例如,图2所示的聊天机器人自身的生活规律和用户的实时状态,应该如何刻画?

干货| 聊天机器人对知识图谱有哪些特殊的需求?_第2张图片

图2  聊天机器人自身的生活规律和用户的实时状态

显然,想让聊天机器人有生活规律,就需要在研发过程中在图谱中体现时态知识。另外,聊天机器人作为用户的个人助理,需要记住用户图谱——各种用户已经发生、正在发生或即将发生的事件。知识图谱中的用户行程不仅是一个关系或属性,还是一个由多元(N-ary)数据组成的事件。为了表示用户行程,研发过程中需要定义多种事件类型,并在时间和空间两个维度上对用户的各种动态进行刻画。

3.聊天机器人不仅需要表达客观知识的知识图谱,还需要可以刻画主观情感的知识图谱

聊天机器人不能只是冷冰冰地回答用户的问题或帮助用户完成特定功能,它需要感知用户的情感并在输出答案回复的同时体现出相应的情感,这样拟人化程度才更高。图3所示为聊天机器人在与用户交互的过程中,根据感知到的用户情感状态,与用户进行交互的示例。

已有的知识图谱大多是客观的,即用于描述一些客观的事实。如何使聊天机器人结合个性化图谱,尽量形成一些主观认知,进而刻画机器人或用户的情感元素呢?例如,用户说“我心情不好”这属于闲聊中的情感表达范畴,需要机器人将用户当前的心情状态更新到用户知识图谱的对应维度数值中。相应地,机器人也会有自己的心情、体力,甚至和用户之间的好感度关联。当机器人心情不错,同时和用户很亲密时,它就会主动关心用户。结合机器人和用户情感因素的动态回复会更加温馨且贴合场景。另外,在多轮对话时,当用户说“来一首快乐的歌吧”时,需要进一步结合音乐知识的知识图谱(快乐作为歌曲的曲风或风格标签)和用户知识图谱中的音乐偏好,推荐符合用户喜好的歌。

干货| 聊天机器人对知识图谱有哪些特殊的需求?_第3张图片

图3  聊天机器人与用户进行交互的示例

4.聊天机器人为了完成用户要求需要对接外部服务或开放API

此时,要将传统的关系型知识图谱(刻画二元关系)扩展到支持动态服务的动态图谱(刻画多元关系,事件属于服务图谱的一个特例)。同时,如何刻画服务之间的各种关系(如因果、时序依赖等)也是图谱扩展过程中需要考虑的。例如,完成订餐后,会有很多后续(follow-up)服务(订花或预约车等)可供消费。建立这些服务之间的关联对进行精准的多轮对话过程中的场景切换是非常必要的,图4所示为一个案例。

干货| 聊天机器人对知识图谱有哪些特殊的需求?_第4张图片

图4  聊天机器人需要对接外部服务或开放API

5.聊天机器人不仅需要纯文本的知识图谱,还需要包含多媒体知识的知识图谱

人类不仅把文字作为接触世界的手段,还会结合图像、语音和文字等多模态来了解外部世界。因此,在研发聊天机器人时所构建的知识图谱也应该从单纯文本自然扩展到多媒体知识图谱。斯坦福大学李飞飞教授创办的ImageNet和Visual Genome正是在这方面进行努力的典范。对于用户图谱这样更新频度非常高且很稠密的知识图谱,多媒体知识的引入能帮助聊天机器人从更多的维度了解用户,并提供诸如Visual QA等潜在的问答服务。例如,小明正在和聊天机器人进行交互,聊天机器人通过自身搭载的摄像头识别出当前交互的用户是小明,然后根据小明的图像与用户ID的关联,进一步得到自身保存的与小明相关的长短时记忆,了解到他将在4月20日~23日去南京出差,而4月24日要和小兰共进晚餐。此时,通过用户知识图谱中的社交关系了解到小兰是小明的女友。当聊天机器人需要进一步了解小兰长什么样时,或者当小兰出现在聊天机器人面前时,聊天机器人需要认出小兰,这时就需要用到包含多媒体知识的知识图谱。图5是对上述描述的可视化说明。

总而言之,聊天机器人需要基于多源、异构的数据构建包含多类别且体现动态和个性化的知识图谱。这其中包括基于来自互联网的数据刻画世界知识、基于用户数据刻画用户画像知识、针对机器人的各种基本属性、社会关系、情感状态、兴趣爱好、日常生活等静态和动态知识得到的融合图谱,它是时空坐标中针对特定交互场景和时间节点的一个镜像,图6所示为一个案例。

干货| 聊天机器人对知识图谱有哪些特殊的需求?_第5张图片

5  聊天机器人需要包含多媒体知识的知识图谱

干货| 聊天机器人对知识图谱有哪些特殊的需求?_第6张图片

6  聊天机器人需要基于多源、异构的数据构建包含多类别且体现动态和个性化的知识图谱

根据聊天机器人所属领域的自然语言理解具体技术的需要,建立知识图谱后,使用分词、实体识别与消歧等技术,将用户输入的自然语言中包含的实体与知识图谱中的实体进行链接,使机器人可以理解用户输入的自然语言中包含的意图,从而从知识图谱中抽取合适的内容对用户输入进行回复。

出品社区:DataFun

微信群&交流合作


  • 伙伴招募:寻找真正对AI技术感兴趣的伙伴,共同维护公众号,一起组织各种技术交流活动,请留言与我们联系。

  • 行业沙龙群:加入沙龙群,拓展行业人脉,对接需求,请在公众号留言:“微信号+名字+研究领域/专业/学校/公司”,我们将很快与您联系。

  • 各种合作:请发邮件至158354995@qq.com或在公众号留言联系。

640?wx_fmt=jpeg


你可能感兴趣的:(干货| 聊天机器人对知识图谱有哪些特殊的需求?)