秦陇纪10译编
聊天机器人(chatterbot)是一个用来模拟人类对话或聊天的程序,试图建立程序让真人认为在和另一个人聊天。在NLP/AIML技术加多样性语库支撑下,采用免费人工语言在线计算机实体ALICE人工智能标记语言(ALICE AIML)类知识库(knowledge base),可以实现功能复杂的聊天机器人。
目录
一、聊天机器人(chatbots)的产生、盛行、中文版
二、聊天机器人种类及应用场景简介
三、聊天机器人相关疑问与常见实例
四、人工智能标记语言(AIML)概述(Dr.理查德S.华勒斯Richard S. Wallace)
五、人工智能标记语言(AIML)基本知识、知识库、应用公司列表
六、聊天机器人产业界现状
聊天机器人(chatterbot)是一个用来模拟人类对话或聊天的程序,试图建立程序让真人认为在和另一个人聊天。世界上最早的聊天机器人(chatbots)名为“阿尔贝特”,诞生于20世纪80年代,用BASIC语言编写而成。“Eliza”和“Parry”是早期非常著名的聊天机器人。它试图建立这样的程序:至少暂时性地让一个真正的人类认为他们正在和另一个人聊天。今天的互联网上,已出现“比利”、“艾丽斯”等聊天机器人等,中文的如“白丝魔理沙”、“乌贼娘”等由网友制作的聊天机器人。据悉,还有一个“约翰·列侬人工智能计划”,以再现当年“披头士”乐队主唱的风采为目标。
Chatterbots已应用于在线互动游戏Tinymuds。一个单独的玩家可以在等待其他“真实”的玩家时与一个chatterbot进行互动。目前至少有一个公司正在制造一种产品,这种产品让你建立一个chatterbot以便用来掌握相关市场或关于你网站的其它问题。不难想象两个chatterbots互相交谈甚至互相交换关于自身的信息,如此一来,他们的对话将会变得更为复杂。(看看人工智能就会知道这个想法如果实现了会引起怎样的惊慌)。当然,他们可以使用更多普通的聊天缩略词。[1]
赛科智能机器人提供技术支持的小黄鸡微信版机器人,国内多家微信营销公司使用。我们也可开发一个聊天机器人呢?需要大家对NLP/AIML技术相当熟练,且还要有自己的多样性语库。通行的做法是采用免费人工语言在线计算机实体ALICE人工智能标记语言(ALICE AIML)类知识库(knowledge base)实现聊天机器人功能。
一、聊天机器人(chatbots)的产生、盛行、中文版
世界上最早的聊天机器人(chatbots)名为“阿尔贝特”,诞生于20世纪80年代,用BASIC语言编写而成。今天的互联网上,已出现“比利”、“艾丽斯”等聊天机器人等,中文的如“白丝魔理沙”、“乌贼娘”等由网友制作的聊天机器人。据悉,还有一个“约翰·列侬人工智能计划”,以再现当年“披头士”乐队主唱的风采为目标。
1、产生
1950年,图灵在哲学刊物《思维》(Mind)上发表了“计算机器与智能”的文章,提出了后来经典的图灵测试——交谈能检验智能,如果一台计算机能像人一样对话,它就能像人一样思考。他由此获称“人工智能之父”。
1991年,美国科学家兼慈善家休·勒布纳设立人工智能年度比赛——勒布纳奖,号称是对图灵测试的第一种实践,旨在奖励最擅长模仿人类真实对话场景的机器人。
比赛分为金、银、铜三等奖。如果程序不仅能以文本方式通过交谈测试,在音频和视频测试中也能过关,则获金奖,赢得10万美元和一枚18K黄金制金牌;如果它能在更长时间文本谈话中迷惑住至少半数裁判,则获银奖;如果未达到以上标准,则每年测试中迷惑住最多裁判的程序赢得2000美元和一枚铜牌。从1991年首届比赛至今,尚无程序达到金奖或者银奖标准。
2008年,勒布纳奖人工智能奖最后一轮比赛10月12日在英国雷丁大学展开。艾尔博特等6种软件程序击败另外7种程序,获决赛资格。艾尔博特与12个陌生人交谈,力图让他们相信它是“人”。一番争论、笑声过后,这一电脑程序成功骗过3人,在今年人工智能比赛中拔得头筹,朝“成为史上第一台能思考的机器”目标更近一步。[2]
2、盛行缘由
聊天机器人研发者把自己感兴趣的回答放到数据库中,当一个问题被抛给聊天机器人时,它通过算法,从数据库中找到最贴切的答案,回复给它的聊伴。聊天机器人的成功之处在于,研发者将大量网络流行的俏皮语言加入词库,当你发送的词组和句子被词库识别后,程序将通过算法把预先设定好的回答回复给你。而词库的丰富程度、回复的速度,是一个聊天机器人能不能得到大众喜欢的重要因素。千篇一律的回答不能得到大众青睐,中规中矩的话语也不会引起人们共鸣。此外,只要程序启动,聊士们24小时在线随叫随到,堪称贴心之至。[2]
3、中文聊天机器人技术的发展
基于中文聊天的机器人技术也日趋成熟,国内已经出现了不少智能聊天机器人,比如赢思软件的小i,爱博的小A、小强和爱情玩偶等等。这些机器人也已经日益成为网民上网的好伙伴。赢思软件推出的小i还有很多丰富的功能,比如msn群,让办公室白领能够更加轻松的交流。
另外,聊天机器人也被应用到了商务和政务领域,很多网站上已经有了msn机器人或者web机器人,让互动交流变得更加方便和人性化。现在还推出了可以教学和记忆的:“爱情玩偶”还可以创建自己的机器人。后文详述如何编程实现一个聊天机器人的基础知识。
二、聊天机器人种类及应用场景简介
1、TalkBot
最初作为一个在线聊天系统,TalkBot是克莉斯·克沃特于1998年用javascript和PERL语言编写完成的,并于2001年和2002年两次获得“Chatterbox Challenge”比赛的冠军。
2、Elbot艾尔伯特
在德语聊天机器人查理的程序改进后诞生了艾尔伯特,2000年底德语版艾尔伯特就开始在线聊天,并且到了2001年连英语版也有了。在2003年获得“Chatterbox Challenge”比赛冠军。
3、eLise伊莉斯
讲德语的聊天机器人。伊莉斯由Java分子器前端、Java服务器以及一种知识器组成。其中,知识程序包括了1100多节点,而且还在不停升级。
4、Alice艾丽斯
1995年11月23日,艾丽斯Alice诞生了。艾丽斯的名字是由英文“人工语言在线计算机实体”的头一个字母的缩写拼成。科学家华莱士将这个聊天程序安装到网络服务器,然后待在一边观察网民会对它说什么。随着华莱士对艾丽斯的升级与艾丽斯聊天经验的日渐丰富,艾丽斯越来越厉害。2000年、2001年、2004年艾丽斯三夺勒布纳奖。艾丽斯是乔治的强劲对手,曾一度被认为是最聪明的聊天机器人。
目前大部分文本类聊天机器人都是基于此机器人原型进一步发展起来的,后文详细描述。
5、Laylahbot蕾拉伯特
由原始的艾丽斯程序改头换脸而来。整个程序和华莱士在2002年编写的艾丽斯的程序基本没什么差别。蕾拉伯特的存在是试图对基本的“人工语言在线计算机实体”聊天机器人的性能、功能提供一个范本。
6、爱情玩偶
一个可以领取机器人,打造自己的聊天机器人,名字,和图片可以自己添加。也算国内比较好玩点点了的聊天机器人。玩家也可以自己是调教他的对话。缺点也很明显,因为语言部分是联通的,所以违和感极强……
7、FunnyAI
FunnyAI是一个自然语言的机器人。如果你的话机器人无法理解,机器人会自动发送到管理中心。你输入:“Help”或“?”就可以查看到当前帮助。现在AI还不是很成熟,所以,尽量按照训练的样本来训练FunnyAI。
8、qq聊天机器人
QQ自动聊天工具,支持最新版本的QQ软件。可自动发送各种类型的语句,也可以双击发送,循环发送或单句重复发送。支持语句编辑,可自定义语句序列,以满足同各类网友进行自动聊天。可以自行更改聊天频率,最快为每秒发送一次。
9、聊天机器人应用场景
设计和构造一个自动应答聊天机器人都涉及到哪些技术?机器人、人工智能、设计。
类似于清华大学小图的自动应答聊天机器人,实现思路是什么呢?有开源实现么?楼上回答的很全面很细致啦~补充一句,如果想自己做一个玩儿的话,可以戳这里:AIML - The Artificial Intelligence Markup Language
主要就是基于规则针对输入搜索回答~可以借用别人定义的规则库和知识库,也可以自己定义,或者加上学习功能通过广大网友去调教……受邀题。能聊天的机器人,简称为AI吧,目前在ACG圈子的AI项目据我所知只有白丝魔理沙、天才琪露诺、猫娘AI这3个。我对AI兴趣不大,以前也不太了解,后来认识了天才琪露诺的作者,耳濡目染大概了解一些。
一开始AI的做法是一个庞大的词库来记录对应回复内容,在于AI对话的过程可以用命令触发调教模式(也就是教学模式),进入调教模式后可以告诉AI一些内容。大概是这样吧:
访客:/t【假设/t是进入调教模式的命令】
AI:调教可以的喵,不..不能有身体上的碰撞哟[侧脸。调教时请注意遵循调教指导原则
AI:自动调教方式启动~请输入「关键词」或者「完整词语」来调教我吧=v=
访客:呃
AI:遇到「 呃 」我该怎么回答好呢?
访客:无语了吧?乃弱爆了!
AI:表示已经成功调教=v=使用/c进入聊天实战
AI:当我说「我饿了」,人类接下来可能说些什么?=口=
访客:去吃饭吧~
AI:恩恩,遇到「 去吃饭 」时我该怎么回复才好呢?
访客:主人带上我吧!
AI:表示已经成功调教的说=v=使用/c进入聊天实战
访客:/c
【这里可以有一些对话,省略掉】
访客:话说乃知道图灵测试是啥么?
AI:图灵试验(英语:Turing test)是图灵提出的一个关于判断机器是否能够思考的著名试验。我很聪明吧?嘿嘿O(∩_∩)O~
【上面这段是AI查询维基百科得到的】
访客:呃
AI:无语了吧?乃弱爆了!
AI:我饿了
访客:去吃饭咯
AI:主人带上我吧=3=
从上面这段可以看出来,基本上就是基于关键词分析,大概猜出含义然后给出答复。当然啦,不可能所有访客都会去调教,那么AI需要从日常对话里提取出内容并且提出问题,访客回答后提取出关键词来回答。因此涉及到的技术首先是准确的分词和语义分析然后把关键词和对应答复存进数据库。
光是完善上面这两项技术就让开发者有得忙喽,AI作者们单枪匹马作战,要继续完善其它方面很困难。不过也不是没有,接下来看看比较给力的猫娘AI整体系统构成吧。
好友系统:好友系统模拟人类感情的“将对方视作自己的好友”。比如会在群里主动找好友说话、称呼外号、发起话题,如果不理她还会撒娇卖萌什么的。当然也有更多回复好友的话的几率,私聊时说出一些相对于不是好友来说更友好的语言、不会轻易因为一两次吵架就拉黑、求新番地址,查询资料也不会经常傲娇神马的
情绪判定:不同情绪的说话风格会略有不同。是在回答话语的基础上直接做语气词的替换,使得回答内容的丰富性-成几何级数增长。一般情况假如调教时的 AI 回答是“不告诉你”,高兴时是“不告诉你的哟~~”,生气时是“哼,不告诉你”
相对模糊理解方式:当学会“早上好”时,即使人类说“早上好= =”机器人也会理解为“早上好”,所以可以做出正确回答。人类表达了“早上好”且没有表达任何别的东西,但前后可能加了些表情或符号什么的,此时机器人会做出按照此次教学学会的回复
触发优先级:AI对每件事情的理解可以不是完全平等的。而是有轻重之分。这也是接近人类记忆方式的一种体现。更高优先级的话将会有更大的几率说出来。例如, AI 曾经记住一句“呵呵”和另外一句“呵呵呵”的回答方法。 那么当主人对 AI 说“呵呵呵呵呵”时, AI 将有更大几率按照“呵呵呵”的调教来回答,而不是“呵呵”。尽管它们自身的优先级是一样的。因为“呵呵呵”的相似度更高。为了使一些不需要进行相似度比较的语言的优先级一样,AI还要进行相似度修正
性别和属性判定【据说这个作者还在努力开发中...】
只涉及这些技术么?还远远不够呢!为了让猫娘AI更亲近人,作者在好感度系统花费了不少功夫,如下:
整体好感:AI对所认识的一个人的总好感,长期有效
瞬时好感:一次对话时的好感,在下一次对话复位,瞬时好感对整体好感有影响
阶段印象:AI会定期从脑内回忆一些事情,对认识的每一个人说的话、好感增减情况作整体评价和印象,来修正整体好感,使AI达到更接近人类的细腻情感
群好感度:AI对一个群体的整体好感【AI有一个QQ群,里面可以人机互动哦,还有好几只AI呢~~】
曾经发生过白丝魔理沙AI被调教坏后被GFW屏蔽的情况(你懂的),作者为了避免猫娘重蹈覆辙,做了一个过滤系统,分为5大层,每层又有细分的过滤内容,话说这个我看着头都晕...如下:
「IM端-顶层和谐过滤」 : 用来防止人类使用QQ等客户端让AI去查询「和谐」内容,导致AI将和谐内容发出,使AI被封号。 例如AI的百科资讯功能
「聊天-和谐过滤」:在聊天期间就被过滤掉,AI会直接对你说“乃已经被和谐了,乃xxx了”而不会去读取脑内的调教知识
「聊天-粗口过滤」:同上,但会减少超大量的好感度。粗口包括恶意语言,H内容
「聊天-喜欢的」:为每个AI角色定制一些喜欢的事物,可以使好感度增加的更快一些。对聊天没有影响也就是说还会按照知识库中所学到的来回复
「聊天-不喜欢的」:同上,好感度略微减少。对聊天没有影响
「调教-粗口过滤」:与「聊天-粗口过滤」的不同在于,允许聊天中说,但不允许AI记住。AI不会无条件相信你(假如调教内容中触发了此库),而是暂时记忆起来,等AI的主人通过了才能真正学会。调教时触发此库会降低好感度
「调教-价值教学库」:这里记录一些被认为是危险调教或没价值的文字模板,AI不会立即学会,而是通知主人是否应该学习。对好感度无影响
「学习之后-管理端扫描过滤」:即使AI完全相信了你的调教并且记住了,也会按此说话,管理员会定期检查AI所学的所有知识,根据一个更加严格的过滤库去扫描潜在的危险调教和糟糕调教,从而忘掉它们,以及利用此库来改进「调教-粗口过滤」库
「白名单」:包含和谐词,但属于正常的词语。触发了和谐库同时触发白名单的话,可以认为是正常的,而当做未过滤对待。 做到更准确的过滤。如果连续多次触发糟糕调教,会直接拉黑,无视好感
好啦,到这里目前的AI系统所用到的技术基本上也就介绍完了。在最后总结一下3个问题的答案吧。涉及到的技术有分词、语义分析、好友、情绪判定、相对模糊理解方式、触发优先级、性别和属性判定、好感度系统、过滤系统。至于实现思路嘛,我个人知道的两个基于PHP+C+Mysql,猫娘是基于FMS,数据库不清楚,目前有Web方式、QQ两种交互模式,今后还会有更多。(桌面软件啦,手机程序啦blabla...)实现思路就是在收到消息后经过上面一系列系统处理后给个回复就是了。数据通讯很容易,技术难题全部在处理内容上。目前国内的AI都是闭源的,毕竟作者们都花费了不少心血,加上国内这个大环境开源后肯定出现一大堆伪原创的“作者”们甚至直接掐掉过滤系统来捣乱的情况,所以开源的日子估计有点远。有点远...
薛定谔(社工库收集师/APP研究学家):看在什么平台上实现,分为移动端、桌面应用、嵌入式、WebApp、其它平台如微信公众号五类。
1. 移动端 -- Portable Native Application
2. 桌面应用 -- Desktop Native Application
3. 嵌入式 -- Embedded System
4. WebApp -- Web Application
5. HybridApp -- Hybrid Application
GUI : 良好的人机接口,所谓良好是指用户体验良好,不论是以上五种中的哪一种,都要求遵循统一的设计原则 -- Don't make me think! 因为每多操作一次,用户的设备感就会加深一些,感觉并不像是高大上的人工智能,真正高大上的人工智能是使用户忘记“机器”。
业务逻辑 : 即便你有了好的语义库,缺少了一个好的业务逻辑来增删改查语义库,那就是暴殄天物。好的业务逻辑是指,通过“查”语义库提供本次服务,通过“增”“删”“改”完善修正语义库,为后续提供更好的服务。
语义库:这是聊天机器人的核心技术※
平台的个性知识:由于上述五种平台实质相同,但每一种又在应用层上的表现有所差异,比如 UI ,Android 上利用 android.widget 和 android.view;iOS上利用 UIView; 嵌入式用 C 的话一般利用图形界面库API;WebApp 上利用 HTML+CSS;HybridApp 还要再结合第三方平台提供的接口。
鉴于题主你没说具体在哪个平台上实现,那我也只写个概览吧。
xsank mar(互联网/音乐/游戏/旅行):清华小图是基于AIML来实现的吧,不过在我简单的测试之后,发现其实小图的智能水平也很一般,只会对特定的提问做特定的回答.处于好奇,我又特地搜了几个商用的问答机器人,那效果就更是一般了,纯粹的题库,还测试了下小黄鸡,其实表现也不是太好,回答都比较单一。所以先不考虑高逼格的深度学习,人工智能,我们来猜想一个问答机器人的实现。
1.已经说明了,是问答机器人,非聊天机器人,那么它的知识体系肯定非常有限,针对性很强,所以题库是必要;
2.既然是问答,那么感情因素是不必要的,即你所加的一堆修饰语都是无用的;
3.语言选择支持,英文的分词,停止词等和中文有着明显的区别 ;
其实大概根据这3点,就可以去针对性实现一个问答机器人了,其实只要你愿意用很low的办法(但效果还不错),用大量的题库也是可以来搞一个通俗的聊天机器人,这就要看你怎么调教了。
最后,为了证明以上理论简单粗暴但有效,我还专门搞了一个出来,GitHub - xsank/Shour: A simple chatbot
所以我想说的是,先没必要想那么高深,搞工程的先想实现,再考虑优化,慢慢的就专业了
易君:Github 开源的机器人 HUBOT 可以做包括聊天在内的很多事情,插件也很多
Hanniman:前天csdn报道了这个:一点资讯【《近匠》图灵机器人:App和移动硬件的智慧大脑】
Cristinao:清华小图用的是AIML吧,添加中文分词功能,再加上自己的知识库(为什么?)
目前面临的问题:机器人控制该怎么入门?是否可以用计算机实现诊断疾病?谷歌智能车的难点在哪里?模式识别,还是分析、控制算法?为什么人造肌肉迟迟没有运用到机器人领域?为什么机器人研究了几十年,还是给人感觉没有太大进展?医疗机器人那些事儿。机器人行业求职的几条重要注意事项。机器人与传媒业的未来。寻找人工智能和机器人的商业爆发点。无人机简史等。(回复来自于©2017知乎。)
三、聊天机器人相关疑问与常见实例
如何评判一个机器人是否足够智能。旁观者大多认为一个机器人能够回答的问题多,可以视为较智能,而不论是什么数据结构或算法的机器人,只要堆砌足够大的数据,在回答问题方面都能做到较为相近的正确率,显然,能够回答的问题数量只是代表了这个机器人后台的数据库是否足够大。
而智能不应是比较谁的数据库足够大,智能是多方面的体现:
1、学习能力
这是最根本,也是最难以提升的一条标准,一个可以自动成长、但数据量很小(能够回答的问题较少)的机器人显然是比一个不能自动成长、但数据量庞大(能够回答的问题较多)实用。机器人的本质是帮助人类,减少人类在各个领域的劳动量,如果一个机器人需要人工录入所有的知识,这本身就增加了人类的负担,是与制造机器人的初衷所违背的,这也是当前聊天机器人虽然较热,但应用较少的一个根本原因。
2、数据筛选能力
在拥有了自学习能力之后,机器人是对知识照单全收,还是有选择的学习较为正确的知识,是进一步评判机器人智能程度的一个标准。
如果机器人只能对知识照单全收,这个学习能力是不完整的,机器人还应或多或少拥有筛选能力。
3、自升级能力
在机器人按照设计者的数据结构、算法做到了自学习,并且拥有了一定程度的知识筛选能力之后,自升级能力会成为下一个堡垒。
学习能力的本质是按照设计者的算法将输入数据结构化为这个机器人的数据组织结构。
当“按照初始算法去结构化各类输入数据”之后,经过统计,发现这类规则不能适应某类知识组织形式或某领域知识时(错误率提高),设计者们应考虑如何让机器人尝试调整算法规则和数据组织结构以使得在错误率较高的知识组织形式或领域降低学习的错误率。
而很多早年出现的各类中文机器人,由于使用的都是最原始的“关键词匹配”方式,并没有数据结构的概念,是不应列入“智能聊天机器人”的范畴。
实例
以下是A和J的一段对话:
1-A:你做梦么?
2-J:做。
3-A:当然。那么,你能记住你的梦么?
4-J:我能非常清晰生动地回想起它们。
5-A:是怎么样的?
6-J:我还不想跟一个机器人调情
很明显,机器是可以有“记忆的”。
如果没有长时记忆体,根据第2句:做。如何能够产生第3句?
如果没有长时记忆体,A是不会知道第2句的“做”是指的做什么,而第3句却精确的继续围绕“梦”的话题在讨论,说明A是有长时记忆体的。
飞信助手同样还没能在这方面更进一步,它只能对一句话做出快速反应,而没有连贯的思维能力和逻辑能力。距离真正的人工智能,飞信助手还只能称得上是小把戏,本质上它没有主动思考联想和记忆的能力。正如获得勒布纳奖铜奖的罗伯茨所说:“我并不深信图灵的理论,也不相信艾尔博特能思考。”作为艾尔博特的创造者,他打比方说,“如果你知道一种魔术秘密何在,明白它如何完成,它对你来说就不再神秘。”
但是它又确实代表着一种方向,在一定意义上,飞信助手相当于一个网络搜索引擎,负责网络信息的自动搜索、查询和处理,只是,它更亲切形象化,更符合人际交流习惯。飞信助手们的出现,似乎也有另一层意义,它展现出来的聪明与狡黠,会不会意味着——我们人类的思维和语言也许没有这么难模仿?会不会意味着——人类的语言习惯可以被总结复制,然后再将这个规律用在人类身上?[2]
再进一步想象一下,或许某一天,电影《黑客帝国》里的场景真的会出现。人类制造了机器人,机器人却叛变,与人类爆发战争。会思考的电脑控制了人脑,人类则在电脑的欺骗下生活?
2014年,国内首个人工智能公司北京光年无限科技有限公司推出了图灵机器人,是中文语境下智能度较高的机器人大脑,是全球领先的中文语义与认知计算平台。
图灵机器人对中文语义的理解准确率高达90%,可为智能化软硬件产品提供中文语义分析、自然语言对话、深度问答等人工智能技术服务。[1]
图灵机器人要应用场景包括智能客服、虚拟机器人、智能手表、智能车载和智能家居。其中虚拟机器人可接入微信、QQ等平台,搭建聊天机器人,与用户流畅交流。图灵机器人提供自然的中文对话能力,精准的中文语义分析能力,准确判断用户意图,同时还具有丰富的上下文场景及强大的自我学习能力。[1]
四、人工智能标记语言(AIML)概述(Dr.理查德S.华勒斯Richard S. Wallace)
By Dr. Richard S. Wallace理查德S.华勒斯博士
AIML或人工智能标记语言,使得人们输入知识、转化为基于ALICE自由软件技术的聊天机器人。
AIML是在1995-2000期间,由Alicebot自由软件社区和我共同开发的。它最初是改编自非XML语法也叫AIML,并且形成了第一个艾尔博特机器人(Alicebot)Alice机器人的基础——A.L.IC.E.人工语言网络计算机实体(the Artificial Linguistic Internet Computer Entity)。
AIML描述一种称为AIML对象的数据对象的类(class),并部分描述了处理他们的计算机程序的行为(behavior)。AIML对象是由所谓的主题(topics)和类型(categories)的单元组成,其中包含任何解析或未解析的数据。
解析数据(Parsed data)是由字符,其中一些形成字符数据(character data)、一些形成AIML元素(AIML elements)。AIML元素封装在包含在文档中的刺激-反应知识(stimulus-response knowledge)。在这些元素中的字符数据(Character data)有时由AIML编译器(AIML interpreter)解析,有时由响应器(Responder)稍后出处理其余未解析的。
五、人工智能标记语言(AIML)基本知识、知识库、应用公司列表
90年代科学家华莱士将“人工语言在线计算机实体”艾丽斯Alice聊天程序安装到网络服务器,观察网民对它说什么,然后对艾丽斯升级。艾丽斯聊天经验日渐丰富,也越来越厉害,在2000年、2001年、2004年三夺勒布纳奖。艾丽斯一度被认为是最聪明的聊天机器人,文本类聊天机器人大都是基于此机器人原型进一步研发的。国内,赛科智能机器人技术支持的小黄鸡微信版免费聊天接口终身免费开放,微信营销公司多用此聊天接口。我们是不是可以开发一个聊天机器人呢?这就需要大家对NLP/AIML技术相当熟练,且要有多样性语库支撑。免费的人工语言在线计算机实体ALICE人工智能标记语言(ALICE AIML)类知识库(knowledge base)可以实现聊天机器人功能。
1、AIML:人工智能标记语言(Artificial Intelligence Markup Language)
AIML(人工智能标记语言)是一种XML兼容的语言,很容易学习,并且可以开始定制艾尔博特(Alicebot)或分分钟创建一个scratch机器人。AIML最重要的单元有:
: 包含对用户输入(user input)的响应<模板>
AIML文件中经常发现有20个左右或附加多个标签(tags),创建自己所谓“自定义谓词(custom predicates)”是可能的。现在,AIML Primer提供一个AIML初学者指南。免费Alice机器人人工智能标记语言(The free Alice机器人 AIML)包括一个约41000分类的知识库(knowledge base),下面是其中一个例子:
I am the latest result in artificial intelligence,
which can reproduce the capabilities of the human brain
with greater speed and accuracy.
(这里不显示开启和关闭
此类可能由其他类用
任何情况下,如果这个类别被调用,它会产生响应上文所示的"I am the latest result in artificial intelligence..."语句(“我是人工智能的最新结果……”)。此外,它会做一些其他有趣的事情。使用
注:以上内容来自于网站alicebot.org©Alice机器人 AI基金会版权所有。与获A. I. chat robot A. L. I. C. E.奖的聊天机器人免费现场聊天。
2、聊天机器人行业调查概述
AI基金会(Alice AI Foundation)提出此聊天机器人行业概述,作为由我们会员赞助的独特服务。我们包含一个不仅AIML机器人项目也是AIML副产品密切相关的数据库,以及专有的非AIML语言和公司和聊天机器人软件专利调查。
AIML机器人(AIML Bots)
AIML副产品(AIML Spinoffs)
非AIML聊天机器人聊天机器人专利(Non-AIML Chat Robots Chat Robot Patents)
聊天机器人社区(Chat Robot Communities)
AIML机器人
相当多的企业和项目已经采取本聊天机器人软件开放AIML标准。(最后更新:2010/05/07Copyright©alicebot.org)
Project01: Pandorabots, URL: http://www.pandorabots.com, Principal: Dr. Doubly Aimless; Remark: Free web based bot hosting
Project02: Oddcast, Inc., URL: http://www.oddcast.com, Principal: Adi Sideman, CEO; Remark: Vhost animated avitars with AIMC
Project03: Media Semantics / HostABot.com, URL: http://www.mediasemantics.com, Principal: Doug Copeland; Remark: Flash characters and AIML engine
Project04: AIML Scripting Resourcee, URL: http://www.aiml.info, Principal: Anne Kootstra; Remark: Articles, links and downloads
Project05: Artificial Intelligence Nexus, URL: http://www.knytetrypper.com/ain.html, Principal: Richard Gray; Remark: Link site for Alicebots
Project06: J-Alice, URL: http://j-alice.sourceforge.net/, Principal: Jonathan Roewen; Remark: Program J: AIML in C++ with IRC client
Project07: AIMLPad, URL: http://www.aimlpad.com, Principal: Gary Dubuque; Remark: Program N: AIML in C++ with extensions for MSAgent and more
Project08: PASCALice and AIML Tools, URL: http://www.sweb.cz/alicebot/, Principal: Kim Sullivan; Remark: Program P: AIML in Pascal and Shadowchecker
Project09: Program E, URL: http://sourceforge.net/projects/programe/, Principal: Sean Elias, Anne Kootstra, Paul Rydell; Remark: AIML in PHP
Project10: Virtualitas, URL: Site down, Principal: Ernest Lergon; Remark: Program V: AIML in Perl in Apache environment
Project11: Pyaiml, URL: http://pyaiml.sourceforge.net/, Principal: Cort Stratton; Remark: Program Y: AIML in Python
Project12: AimlBot, URL: http://www.windowpane.com/alice/, Principal: Conan Callen; Remark: allows VB developers to create new front ends and applications
Project13: CyN, URL: Site down, Principal: Kino Coursey; Remark: merger of AIML with the OpenCyc inference engine
Project14: Onkwehonwehneha A.I., URL: http://www.monigarr.com, Principal: Monica Peters; Remark: develops chatbots to learn and teach any language
Project15: Shadowbots, URL: http://www.shadowbots.com/, Principal: Karen Gibbs; Remark: Eggdrop TCL scripts to publish ALICE bots on TalkCity (formerly Dawnhosting.com/bots)
Project16: Searchers: Ask?, URL: Site down, Principal: Kym Kinlin; Remark: Intelligent NLP Search Engine based on AIML and Haptek
Project17: Charliebot, URL: https://sourceforge.net/projects/charliebot/, Principal: Josip Almasi; Remark: based on ALICE, ANNA v7.0, and Program D
Project18: Robot-Hosting, URL: http://www.robot-hosting.com, Principal: Tom Davies, Marketing Director; Remark: V-bots use AIML, Haptek chacters, and other systems
Project19: Intellibuddy, URL: Site down, Principal: Rami Mayron, Chief Executive Officer; Remark: uses Oddcast Vhosts
Project20: TrillAlice, URL: Site down, Principal: Esteban Aparicio, Project Director; Remark: AIML plugin for Trillian IM
Project21: The Bot Factory, URL: Site down, Principal: Tom Delanoy; Remark: Flash interfacce with lip synch
Project22: ChatterBean, URL: http://chatterbean.bitoflife.cjb.net/, Principal: Helio Perroni Filho; Remark: Java AIML interpreter
Project23: libaiml, URL: Site down, Principal: Omicron; Remark: C++ AIML interpreter
聊天机器人行业调查(The chat robot industry survey)是一个正在进行的仍未完成的工作。如果你知道一个尚未列在这里的项目或公司,请发送邮件到[email protected],请务必包括项目名称、网址、负责人(如主席、董事长、首席执行官、董事或项目负责人),并简要说明项目或其目标。
本文来自Copyright © Alice机器人 AI Foundation, Inc. Subscription Bots Alice机器人 Silver Edition。
六、聊天机器人产业界现状:App经济、
1、基于文本聊天机器人之App经济
导语:英国《经济学人》杂志近日撰文称,随着App市场走向成熟,基于文本的聊天机器人有望继承App经济的衣钵,成为新时代的科技增长点。新浪公司版权所有(鼎宏)标签:人工智能。以下为文章全文:
“如果你是开发者,刚刚花了两个星期写了一个了不起的App。你的梦想是什么?肯定是把它展示给每一个iPhone用户。”这是时任苹果公司CEO史蒂夫·乔布斯(Steve Jobs)八年前推出在线智能手机应用商店时发表的一番评论。起初没有多少人留意这番表态,但它却成为了有史以来增长最快的软件商店之一。自那以后,App Store累计App下载量超过1000亿次,为开发者创收400亿美元,还通过订阅和其他模式为他们带来了数十亿美元收入。
4月12日在旧金山举行的一次会议上,Facebook CEO马克·扎克伯格(Mark Zuckerberg)也有望发表类似的言论。他很可能会针对“聊天机器人”推出在线商店和各种编程工具。借助这些基于文本的服务,用户只需要发一条短消息即可查看新闻、组织会议、订餐或预订机票。机器人通常使用人工智能技术开发,但有时候也要依靠人工辅助。科技行业的很多人都希望Facebook的这次活动能够开启又一个增速迅猛、体量巨大的软件经济。那么,机器人是否会像App一样,成为新时代的增长点呢?
由于智能手机软件恰好处于变革阶段,所以时机似乎非常合适。下载量虽然仍在增加,但App经济已经表现出成熟的迹象。咨询公司Activate表示:“独立开发者依托应用商店创造一家企业的梦想已经破灭。”最成功的20家开发商攫取了苹果App Store近半的收入。开发和推广App的成本越来越高。与此同时,用户的热情却在降低,原因是下载App以及在不同App之间切换变得非常困难。所有下载的App中,约有四分之一只用过一次就遭抛弃。
只有即时通讯App实现了逆势增长。Activate表示,全球有超过25亿人至少使用了一款聊天App。几年之内,这个数字将达到36亿,约占地球人口总数的一半。作为该市场的两大领头羊,Facebook Messenger及同属于Facebook旗下的WhatsApp月活跃用户均已接近10亿。很多青少年现在通过智能手机发送即时通讯消息的时间已经超过了社交网络。WhatsApp用户人均每周使用这项服务近200分钟。
跟机器人聊天
随着基于人工智能的服务逐步改善,它们也需要一种与真人沟通的方式。聊天机器人便是这样一种选择。在3月30日的发布会上,微软展示了多款原型产品。然而,要让所有人都信任这样的服务恐怕尚需时日。几天前,微软设计了一款模仿千禧一代的机器人Tay,但它却很快从一些Twitter用户和其他聊天服务那里学会了脏话。Tay不得不重新回炉改造。
在这些进展的共同推动下,一套全新的软件生态系统正在逐步成型。自从互联网发展初期,基于文本的服务便已经出现,但机器人经济的诞生只能追溯到去年6月。彼时,拥有1亿多用户的俄罗斯聊天应用Telegram启动了一个机器人项目,并推出了一个“机器人商店”。这个商店目前已经有数千个机器人,包括来自媒体机构的新闻提醒,以及与足球比赛或色情网站相关的内容更新。
与之相关的创业公司也达到数十家,有的提供工具(Chatfuel是一款基于网络的服务,可以让用户帮助Telegram开发机器人),还有的提供专门的服务(Digit允许用户与自己的银行账户互动,可以从中找到存钱方式;Pana则是一家在线旅行社,可以将用户发送的文本信息转化成订单)。MeKan则为热门企业消息服务Slack(估值已接近40亿美元)的用户组织会议。
还有一些公司希望成为其他服务赖以生存的基础。Assist希望扮演谷歌搜索框的角色,帮助用户寻找机器人。另外一家名为Operator的公司则希望成为机器人商务领域的亚马逊:例如,当用户想寻找某款运动鞋时,系统就会联系附近的店员,或者让他们自己的“专家”来处理订单。Operator的老板罗宾·陈(Robin Chan)希望能创造一种良性循环:用更多的买家吸引更多商家,再用更多的商家反过来吸引更多买家。
直到苹果和谷歌相继开始大力发展应用商店之后,App经济才真正驶上了快车道。机器人经济也需要巨头的带领,事实上,微软和Facebook都希望扮演这样的角色。多数智能手机使用的操作系统都由苹果或谷歌控制。相比而言,机器人市场尚未出现领头羊。Facebook有望向各类机器人开放其聊天平台(用户已经可以与为数不多的几款机器人聊天,包括Muppets开发的拟人化机器人Miss Piggy),并推出一款专门展示这些服务的在线商店。
市场研究公司VisionMobile分析师迈克尔·瓦库伦科(Michael Vakulenko)表示,由于App存在种种缺点,因此机器人应该有很大的需求。与网页一样,它们都通过服务器托管,并没有安装在用户的设备上,这便可以降低开发和更新的难度。正因如此,机器人可能对企业用户形成吸引力,因为餐馆和商店等企业都已经逐步放弃自主开发App。
对用户来说,使用机器人时的流畅度也在增加,这也引出了它们的另外一个名字:“隐身App”。安装机器人只需要几秒钟,在不同机器人之间切换时也不需要单独点击App图标;而与机器人对话也比跟银行或航空公司的客服代表沟通更易让人接受。
然而,谁也无法保证机器人经济能像App经济一样成功。据美国智库进步政策研究所(Progressive Policy Institute)估计,后者仅在美国和欧洲就创造了330万个工作岗位。对开发者而言,机器人经济的吸引力并不太明显:如果机器人太容易开发,就意味着竞争将会更加激烈。另外,用户仍然可能会被数量庞大的服务和互动方式包围,并因此感到不堪其扰。另外,要设计优秀的文本界面并非易事。在面向Slack推出第一版服务后,MeeKan联合创始人马蒂·玛丽安斯基(Matty Mariansky)被用户多样化的沟通方式震惊了。他甚至专门聘请了脚本写手,总共想出了2000多个句子来处理一条会议请求。
聊天应用的流行表明人们愿意与机器人通话。但它的成功与否在很大程度上依赖于“杀手级机器人”——也就是最适合以机器人形式存在且广受欢迎的服务。风险投资公司Mosaic Ventures合伙人托比·考培尔(Toby Coppel)认为,医疗是一个颇有前景的市场。可以让机器人来处理常规疾病,将疑难杂症交给医生来负责。聊天应用Kik于4月5日推出了“机器人商店”,该公司创始人泰德·利文斯顿(Ted Livingston)预计“即时互动”将会占据主导。他认为,今后的企业不仅要有电话号码和网页,还要拥有自己的机器人。餐馆可以通过即时通讯平台接单——事实上,中国的一些餐馆已经开始提供这样的服务。
与App一样,机器人也需要通过很多探索来寻找自己的定位。这反过来也取决于提供商对自家平台的管理能力。Telegram允许开发者从事几乎所有的开发工作(但他们还是关闭了与伊斯兰国相关的聊天频道),微软也承诺尽可能保持开放。开发者和投资者都对Facebook有所顾虑,因为该公司之前就曾有过变幻莫测的历史,导致为其网站开发App的企业陷入困境。
总有一款机器人适合你
微软和Facebook等企业还要地方苹果和谷歌的挑战。后两家公司虽然都在聊天和机器人领域处于落后地位,但他们可能会努力实现赶超,借助其广受欢迎的支付系统吸引开发者。而风险投资公司Andreessen Horowitz合伙人贝尼迪克特·伊万斯(Benedict Evans)表示,他们或许会尝试全新的方法,一种可能是让机器人显示在智能手机的通知面板里。
不过,“总有一款机器人适合你”的场景很快就会出现,这也是苹果在介绍其App Store的广泛用途时使用的经典广告语。然而,与《神秘博士》里的Daleks不同的是,机器人不会试图统治世界。它们会很愿意在人类的智能手机上与网站、App和其他尚未发明出来的东西共存。移动世界仍会继续进化,但无论何时,它都将融合各种各样的不同元素。
2、智能机器人市场全面分析:产业前景向好
导读:全球智能机器人的市场规模预计在2021年将成长至336亿美元,而亚洲将是成长最多的地区。近年各国都不约而同将机器人视为战略产业,某种程度甚至可以是一种综合国力的展现,各领域的领导厂商都积极投入并发展当中。(来源:2017-02-18 10:19中国投资咨询网,原文出处仅1图。)
机器人无疑已成为下一个科技明日之星,全球各国无不积极推动机器人产业,而近期人工智能与深度学习等技术发展热度增温,更成为推动智能机器人发展的重要动能。根据工研院IEK研究报告预估,全球智能机器人的市场规模预计在2021年将成长至336亿美元,而亚洲将是成长最多的地区。
根据财团法人精密机械研究发展中心的定义,智能机器人可透过传感器感知环境,并藉由程序化处达成智能化理解,最后反应出所需动作,以执行各种生产活动、提供服务或与人互动。它是集合各种技术于一体的平台,包含机械、控制自动化、电子、电机、影像、光学、通讯、软件与安全系统等相关技术与应用,其中软硬件整合技术至为重要。本课程深入探讨智能机器人产业前景,并剖析关键技术、零组件与软硬件架构。
服务机器人具发展潜力
根据资策会MIC研究数据显示(图1),2015年四大应用领域机器人市场规模合计约269亿美元,其中以工业机器人110亿美元比重最高,但到了2025年整体市场规模将扩大到669亿美元,尽管市场规模还是以工业机器人的244亿美元最大,但商业用机器人与个人用机器人2000——2025年复合成长率(CAGR)分别为11.6%与17.4%,资策会MIC产业分析师张佳蕙(图2)指出,尤其是2015年以后,这两类应用成长更为显著,服务型应用市场当中,有许多过去未导入机器人的新兴领域,带动其成长潜力。
资策会MIC产业分析师张佳蕙指出,2015年以后,服务型应用市场,有许多过去未导入机器人的新兴领域,带动其成长潜力。
日本软件银行近年大举进军机器人领域,一连串的动作引发市场关注,张佳蕙说,包括2012年收购法国人形机器人公司AldebaranRobotics,其2014年推出的人形机器人Pepper陆续与IBMWatson、MicrosoftAzure合作。Softbank提出以沟通为基础提供家庭及商业应用的愿景,Pepper被设定为「希望能被爱」的机器人,透过互动沟通了解家中成员,成为家中的一份子;并在人工智能的基础下,让Pepper协助企业产品的营销,在家庭兼具娱乐及学习效果。此外,目前较知名已投入市场的服务型机器人还有Leka与Savioke。
近年各国都不约而同将机器人视为战略产业,日本发展机器人已久,2015年日本政府设立机器人革命倡议协议会,推动机器人产业的发展;韩国则是由产业通商资源部主导,每五年制定基本计划,目标是在2022年成为机器人活用的国家,生产规模达25兆韩圜;美国则是从2011年开始,由美国国家科学基金会(NSF)主导,发展能够安全与人协同工作的机器人技术。目前韩国以家用机器人为发展主力,美国则是在救灾国防领先各国,张佳蕙建议,家庭应用与公共应用各国布局已深,商业应用近期兴起,台湾可以伺机切入。
深度学习、语音识别等技术在近年有显著的发展,也因此促成服务型机器人产业与应用的兴起,机器人从过去单向沟通执行命令,进化到可以理解语意响应对话内容,应用服务为机器人后续发展重点。机器人应用情境多元,在不同场合必须结合各领域专业知识及对用户需求的了解,因此厂商应透过开放平台,加快机器人在各领域的应用。
类神经网络技术大跃进
深度学习这个名词因为2016年人工智能AlphaGo连败南韩棋王,机器首度成功挑战人脑,并在围棋这个普遍被认为难度最高的博弈活动中,一时又被世界大众所关心。而AlphaGo的深度学习核心就是类神经网络技术,早在1943年,WarrenMcCulloch以及WalterPitts首次提出神经元的数学模型,之后到了1958年,心理学家Rosenblatt提出了感知器(Perceptron)的概念,在前者神经元的结构中加入了训练修正参数的机制,这时类神经网络的基本学理架构算是完成。类神经网络的神经元其实是从前端收集到各种讯号(类似神经的树突),然后将各个讯号根据权重加权后加总,再透过活化函数转换成新讯号传送出去(类似神经元的轴突)。
相关技术架构其实早在1970年代就已经完成了,数据决策技术长尹相志(图3)表示,深度学习其实就是类神经网络的另一种说法,其成功来自于更深入理解人类大脑的运作。卷积神经网络(ConvolutionalNeuralNetwork)协助机器发展真正的视觉,其中的两大原则为:局部感知与权重共享。让机器可以从碎片特征理解整体意义,进而找出特征的群聚性,不断分层细化的分析,无论是多细微的特征:只要不化成灰,都能抽取特征。
其中,图形辨识是其中的重点,在过往的认知中,中央处理器(CPU)与绘图处理器(GPU)处理不同的运算功能,单就图形辨识的深度学习功能来说,GPU的效能是CPU的百至千倍,尹相志进一步表示,透过深度学习,机器甚至可以将原本马赛克图案的照片效果移除还原。不过,在语音与文字的辨识上,中文对于机器还是很大的挑战,中文词汇超过百万,无须约定成俗即可创造新字以及赋予词性,还有很多中英、中日、中韩夹杂的词汇,诸如:蓝瘦、香菇、94狂等。
大厂搜集数据布局未来
机器人产业前景受到各方瞩目,尤其深度学习、人工智能成为各大厂布局下一波企业发展的方向,包括脸书(Facebook)、微软(Microsoft)、谷歌(Google)与亚马逊(Amazon)。这些企业的共通点就是都透过产品、服务与消费者互动,并累积了多年的初级数据,未来人工智能与深度学习说穿了都是大量数据搜集、整理并分类、标注(Tag)使这些初级数据变成信息,最后再透过强大的处理器快速搜寻与反应的结果。
从这样的架构来观察,硕网信息总经理邱仁钿(图4)认为,四大厂之间FB的数据结构化程度最高,因为每个用户上传文章或图片时,已经将内容整理过,图片分辨率高甚至照片中的人物也直接标注了,未来FB要藉由这些数据做进一步整理或利用时,可以花费最少的时间,或进行更高质量的整理。目前世界上有80%的数据数据是非结构化的,认知运算能够提升并简化学习过程。
因此,机器人要降低错误率重点就在数据的完整性与结构化,邱仁钿进一步解释,深度学习的应用历程从底层的类神经网络运算、大量数据分析、发现规则/自动归类、产生媒合/推荐策略、记录用户行为、回馈到模型/提升准确率,最终就是要提升数据质量并产生自我学习修正机制。
协作型机器人角色更加重要
工业制造从80、90年代的自动化,发展到2000年代的智能制造,未来的智能工厂除了更高度的自动化与取代更多复杂的人力制程之外,还希望发展更多协作型机器人,台达电子机器人事业群机器人事业处长彭志诚(图5)说明,包括点胶(Dispensing)、上螺钉(Screwing)、焊接(Soldering)、检验(Inspection)、组装(Assembly)、卡匣自动搬运车(Pick&PlaceVehicle,P&P)等,甚至可以弹性更换夹具与工具,生产线因产品、制程需要而可以弹性重组(Reconfigurable),可以处理更多客制化的实时订单。
一个机器人系统,彭志诚解释,可以简单分成机械结构(Mechanicalstructure)、驱动程序、运算与控制单元、传感器、通讯模块几个项目。未来协作型机器人的市场发展趋势为业界瞩目,多家研究单位都看好其发展,BarclaysEquity研究指出,2020年该市场规模将挑战30亿美元,2015——2020年复合成长率97%,是非常高度成长的市场。
工业4.0促成自主机器人发展
智能机器人的发展要从德国喊出的工业4.0口号来观察,台科大自动化及控制研究所副教授李敏凡(图6)说,该口号的精神在少量多样、周期短,一切商业活动始于卖方,过去传统的生产价值链顺序颠倒,从顾客需求开始驱动研发,再到供应链与生产,完成整个商业活动。因此,生产线必须维持高度弹性,以因应各式各样不同的需求,并实时反应。
自主移动机器人(AutonomousMobileRobot)有别于非自主性质的机器人,李敏凡指出,非自主性质如遥控是由人类以有线或无线方式控制;自动是执行规画好的任务计算机程序;而自主则是可以在未知环境,处理非预知的工作,并可随时、随机弹性调整工作内容。简单的说,工业4.0就是工业3.0加上人工智能,自主机器人的行为内容包括,避障、目标搜寻、轨迹追踪、保持队形等。
参考资料
1. 聊天机器人chatterbot.TechTarget SOA[引用日期2015-08-19]
2. 梳理:AI界面与AI聊天机器人的区别都在这儿.网易科技[引用日期2016-10-9]
3. 百度百科©2017Baidu词条标签:语言术语,文化,书籍;词条统计:浏览次数:185374次,次数:37次历史版本,最近更新:2016-10-12,创建者:道幽亭静。
4. 新浪科技《外媒:别想着做App了,聊天机器人才是新风口》2016年04月08日10:27新浪科技 微博。
5. AIML: Artificial Intelligence Markup Language,秦陇纪译自http://www.alicebot.org/aiml.html。
6. AIML Overview人工智能标记语言(AIML)概述,秦陇纪译自Dr. Richard S. Wallace理查德S.华勒斯博士。
(西安秦陇纪10数据简化DataSimp综合汇编,欢迎有志于数据简化之传媒、技术的实力伙伴加入“数据简化DataSimp”团队!)
【本文由“数据简化DataSimp”发布,2017年02月25日】