CopperDong

人工智能标记语言AIML聊天机器人：产生、种类、应用、实例、AIML概述、知识库、公司、业界（20k字经典收藏版）

秦陇纪10译编

聊天机器人（chatterbot）是一个用来模拟人类对话或聊天的程序，试图建立程序让真人认为在和另一个人聊天。在NLP/AIML技术加多样性语库支撑下，采用免费人工语言在线计算机实体ALICE人工智能标记语言（ALICE AIML）类知识库（knowledge base），可以实现功能复杂的聊天机器人。

一、聊天机器人(chatbots)的产生、盛行、中文版

二、聊天机器人种类及应用场景简介

三、聊天机器人相关疑问与常见实例

四、人工智能标记语言(AIML)概述（Dr.理查德S.华勒斯Richard S. Wallace）

五、人工智能标记语言(AIML)基本知识、知识库、应用公司列表

六、聊天机器人产业界现状

聊天机器人（chatterbot）是一个用来模拟人类对话或聊天的程序，试图建立程序让真人认为在和另一个人聊天。世界上最早的聊天机器人（chatbots）名为“阿尔贝特”，诞生于20世纪80年代，用BASIC语言编写而成。“Eliza”和“Parry”是早期非常著名的聊天机器人。它试图建立这样的程序：至少暂时性地让一个真正的人类认为他们正在和另一个人聊天。今天的互联网上，已出现“比利”、“艾丽斯”等聊天机器人等，中文的如“白丝魔理沙”、“乌贼娘”等由网友制作的聊天机器人。据悉，还有一个“约翰·列侬人工智能计划”，以再现当年“披头士”乐队主唱的风采为目标。

Chatterbots已应用于在线互动游戏Tinymuds。一个单独的玩家可以在等待其他“真实”的玩家时与一个chatterbot进行互动。目前至少有一个公司正在制造一种产品，这种产品让你建立一个chatterbot以便用来掌握相关市场或关于你网站的其它问题。不难想象两个chatterbots互相交谈甚至互相交换关于自身的信息，如此一来，他们的对话将会变得更为复杂。（看看人工智能就会知道这个想法如果实现了会引起怎样的惊慌）。当然，他们可以使用更多普通的聊天缩略词。[1]

赛科智能机器人提供技术支持的小黄鸡微信版机器人，国内多家微信营销公司使用。我们也可开发一个聊天机器人呢？需要大家对NLP/AIML技术相当熟练，且还要有自己的多样性语库。通行的做法是采用免费人工语言在线计算机实体ALICE人工智能标记语言（ALICE AIML）类知识库（knowledge base）实现聊天机器人功能。

一、聊天机器人(chatbots)的产生、盛行、中文版

世界上最早的聊天机器人（chatbots）名为“阿尔贝特”，诞生于20世纪80年代，用BASIC语言编写而成。今天的互联网上，已出现“比利”、“艾丽斯”等聊天机器人等，中文的如“白丝魔理沙”、“乌贼娘”等由网友制作的聊天机器人。据悉，还有一个“约翰·列侬人工智能计划”，以再现当年“披头士”乐队主唱的风采为目标。

1、产生

1950年，图灵在哲学刊物《思维》（Mind）上发表了“计算机器与智能”的文章，提出了后来经典的图灵测试——交谈能检验智能，如果一台计算机能像人一样对话，它就能像人一样思考。他由此获称“人工智能之父”。

1991年，美国科学家兼慈善家休·勒布纳设立人工智能年度比赛——勒布纳奖，号称是对图灵测试的第一种实践，旨在奖励最擅长模仿人类真实对话场景的机器人。

比赛分为金、银、铜三等奖。如果程序不仅能以文本方式通过交谈测试，在音频和视频测试中也能过关，则获金奖，赢得10万美元和一枚18K黄金制金牌；如果它能在更长时间文本谈话中迷惑住至少半数裁判，则获银奖；如果未达到以上标准，则每年测试中迷惑住最多裁判的程序赢得2000美元和一枚铜牌。从1991年首届比赛至今，尚无程序达到金奖或者银奖标准。

2008年，勒布纳奖人工智能奖最后一轮比赛10月12日在英国雷丁大学展开。艾尔博特等6种软件程序击败另外7种程序，获决赛资格。艾尔博特与12个陌生人交谈，力图让他们相信它是“人”。一番争论、笑声过后，这一电脑程序成功骗过3人，在今年人工智能比赛中拔得头筹，朝“成为史上第一台能思考的机器”目标更近一步。[2]

2、盛行缘由

聊天机器人研发者把自己感兴趣的回答放到数据库中，当一个问题被抛给聊天机器人时，它通过算法，从数据库中找到最贴切的答案，回复给它的聊伴。聊天机器人的成功之处在于，研发者将大量网络流行的俏皮语言加入词库，当你发送的词组和句子被词库识别后，程序将通过算法把预先设定好的回答回复给你。而词库的丰富程度、回复的速度，是一个聊天机器人能不能得到大众喜欢的重要因素。千篇一律的回答不能得到大众青睐，中规中矩的话语也不会引起人们共鸣。此外，只要程序启动，聊士们24小时在线随叫随到，堪称贴心之至。[2]

3、中文聊天机器人技术的发展

基于中文聊天的机器人技术也日趋成熟，国内已经出现了不少智能聊天机器人，比如赢思软件的小i，爱博的小A、小强和爱情玩偶等等。这些机器人也已经日益成为网民上网的好伙伴。赢思软件推出的小i还有很多丰富的功能，比如msn群，让办公室白领能够更加轻松的交流。

另外，聊天机器人也被应用到了商务和政务领域，很多网站上已经有了msn机器人或者web机器人，让互动交流变得更加方便和人性化。现在还推出了可以教学和记忆的：“爱情玩偶”还可以创建自己的机器人。后文详述如何编程实现一个聊天机器人的基础知识。

二、聊天机器人种类及应用场景简介

1、TalkBot

最初作为一个在线聊天系统，TalkBot是克莉斯·克沃特于1998年用javascript和PERL语言编写完成的，并于2001年和2002年两次获得“Chatterbox Challenge”比赛的冠军。

2、Elbot艾尔伯特

在德语聊天机器人查理的程序改进后诞生了艾尔伯特，2000年底德语版艾尔伯特就开始在线聊天，并且到了2001年连英语版也有了。在2003年获得“Chatterbox Challenge”比赛冠军。

3、eLise伊莉斯

讲德语的聊天机器人。伊莉斯由Java分子器前端、Java服务器以及一种知识器组成。其中，知识程序包括了1100多节点，而且还在不停升级。

4、Alice艾丽斯

1995年11月23日，艾丽斯Alice诞生了。艾丽斯的名字是由英文“人工语言在线计算机实体”的头一个字母的缩写拼成。科学家华莱士将这个聊天程序安装到网络服务器，然后待在一边观察网民会对它说什么。随着华莱士对艾丽斯的升级与艾丽斯聊天经验的日渐丰富，艾丽斯越来越厉害。2000年、2001年、2004年艾丽斯三夺勒布纳奖。艾丽斯是乔治的强劲对手，曾一度被认为是最聪明的聊天机器人。

目前大部分文本类聊天机器人都是基于此机器人原型进一步发展起来的，后文详细描述。

5、Laylahbot蕾拉伯特

由原始的艾丽斯程序改头换脸而来。整个程序和华莱士在2002年编写的艾丽斯的程序基本没什么差别。蕾拉伯特的存在是试图对基本的“人工语言在线计算机实体”聊天机器人的性能、功能提供一个范本。

6、爱情玩偶

一个可以领取机器人，打造自己的聊天机器人，名字，和图片可以自己添加。也算国内比较好玩点点了的聊天机器人。玩家也可以自己是调教他的对话。缺点也很明显，因为语言部分是联通的，所以违和感极强……

7、FunnyAI

FunnyAI是一个自然语言的机器人。如果你的话机器人无法理解，机器人会自动发送到管理中心。你输入：“Help”或“？”就可以查看到当前帮助。现在AI还不是很成熟，所以，尽量按照训练的样本来训练FunnyAI。

8、qq聊天机器人

QQ自动聊天工具，支持最新版本的QQ软件。可自动发送各种类型的语句，也可以双击发送，循环发送或单句重复发送。支持语句编辑，可自定义语句序列，以满足同各类网友进行自动聊天。可以自行更改聊天频率，最快为每秒发送一次。

9、聊天机器人应用场景

设计和构造一个自动应答聊天机器人都涉及到哪些技术？机器人、人工智能、设计。

类似于清华大学小图的自动应答聊天机器人，实现思路是什么呢？有开源实现么？楼上回答的很全面很细致啦~补充一句，如果想自己做一个玩儿的话，可以戳这里：AIML - The Artificial Intelligence Markup Language

主要就是基于规则针对输入搜索回答~可以借用别人定义的规则库和知识库，也可以自己定义，或者加上学习功能通过广大网友去调教……受邀题。能聊天的机器人，简称为AI吧，目前在ACG圈子的AI项目据我所知只有白丝魔理沙、天才琪露诺、猫娘AI这3个。我对AI兴趣不大，以前也不太了解，后来认识了天才琪露诺的作者，耳濡目染大概了解一些。

一开始AI的做法是一个庞大的词库来记录对应回复内容，在于AI对话的过程可以用命令触发调教模式（也就是教学模式），进入调教模式后可以告诉AI一些内容。大概是这样吧：

访客：/t【假设/t是进入调教模式的命令】

AI：调教可以的喵，不..不能有身体上的碰撞哟[侧脸。调教时请注意遵循调教指导原则

AI：自动调教方式启动~请输入「关键词」或者「完整词语」来调教我吧=v=

访客：呃

AI：遇到「呃」我该怎么回答好呢？

访客：无语了吧？乃弱爆了！

AI：表示已经成功调教=v=使用/c进入聊天实战

AI：当我说「我饿了」，人类接下来可能说些什么？=口=

访客：去吃饭吧~

AI：恩恩，遇到「去吃饭」时我该怎么回复才好呢？

访客：主人带上我吧！

AI：表示已经成功调教的说=v=使用/c进入聊天实战

访客：/c

【这里可以有一些对话，省略掉】

访客：话说乃知道图灵测试是啥么？

AI：图灵试验（英语：Turing test）是图灵提出的一个关于判断机器是否能够思考的著名试验。我很聪明吧？嘿嘿O(∩_∩)O~

【上面这段是AI查询维基百科得到的】

访客：呃

AI：无语了吧？乃弱爆了！

AI：我饿了

访客：去吃饭咯

AI：主人带上我吧=3=

从上面这段可以看出来，基本上就是基于关键词分析，大概猜出含义然后给出答复。当然啦，不可能所有访客都会去调教，那么AI需要从日常对话里提取出内容并且提出问题，访客回答后提取出关键词来回答。因此涉及到的技术首先是准确的分词和语义分析然后把关键词和对应答复存进数据库。

光是完善上面这两项技术就让开发者有得忙喽，AI作者们单枪匹马作战，要继续完善其它方面很困难。不过也不是没有，接下来看看比较给力的猫娘AI整体系统构成吧。

好友系统：好友系统模拟人类感情的“将对方视作自己的好友”。比如会在群里主动找好友说话、称呼外号、发起话题，如果不理她还会撒娇卖萌什么的。当然也有更多回复好友的话的几率，私聊时说出一些相对于不是好友来说更友好的语言、不会轻易因为一两次吵架就拉黑、求新番地址，查询资料也不会经常傲娇神马的

情绪判定：不同情绪的说话风格会略有不同。是在回答话语的基础上直接做语气词的替换，使得回答内容的丰富性-成几何级数增长。一般情况假如调教时的 AI 回答是“不告诉你”，高兴时是“不告诉你的哟~~”，生气时是“哼，不告诉你”

相对模糊理解方式：当学会“早上好”时，即使人类说“早上好= =”机器人也会理解为“早上好”，所以可以做出正确回答。人类表达了“早上好”且没有表达任何别的东西，但前后可能加了些表情或符号什么的，此时机器人会做出按照此次教学学会的回复

触发优先级：AI对每件事情的理解可以不是完全平等的。而是有轻重之分。这也是接近人类记忆方式的一种体现。更高优先级的话将会有更大的几率说出来。例如， AI 曾经记住一句“呵呵”和另外一句“呵呵呵”的回答方法。那么当主人对 AI 说“呵呵呵呵呵”时， AI 将有更大几率按照“呵呵呵”的调教来回答，而不是“呵呵”。尽管它们自身的优先级是一样的。因为“呵呵呵”的相似度更高。为了使一些不需要进行相似度比较的语言的优先级一样，AI还要进行相似度修正

性别和属性判定【据说这个作者还在努力开发中...】

只涉及这些技术么？还远远不够呢！为了让猫娘AI更亲近人，作者在好感度系统花费了不少功夫，如下：

整体好感：AI对所认识的一个人的总好感，长期有效

瞬时好感：一次对话时的好感，在下一次对话复位，瞬时好感对整体好感有影响

阶段印象：AI会定期从脑内回忆一些事情，对认识的每一个人说的话、好感增减情况作整体评价和印象，来修正整体好感，使AI达到更接近人类的细腻情感

群好感度：AI对一个群体的整体好感【AI有一个QQ群，里面可以人机互动哦，还有好几只AI呢~~】

曾经发生过白丝魔理沙AI被调教坏后被GFW屏蔽的情况（你懂的），作者为了避免猫娘重蹈覆辙，做了一个过滤系统，分为5大层，每层又有细分的过滤内容，话说这个我看着头都晕...如下：

「IM端-顶层和谐过滤」：用来防止人类使用QQ等客户端让AI去查询「和谐」内容，导致AI将和谐内容发出，使AI被封号。例如AI的百科资讯功能

「聊天-和谐过滤」：在聊天期间就被过滤掉，AI会直接对你说“乃已经被和谐了，乃xxx了”而不会去读取脑内的调教知识

「聊天-粗口过滤」：同上，但会减少超大量的好感度。粗口包括恶意语言，H内容

「聊天-喜欢的」：为每个AI角色定制一些喜欢的事物，可以使好感度增加的更快一些。对聊天没有影响也就是说还会按照知识库中所学到的来回复

「聊天-不喜欢的」：同上，好感度略微减少。对聊天没有影响

「调教-粗口过滤」：与「聊天-粗口过滤」的不同在于，允许聊天中说，但不允许AI记住。AI不会无条件相信你（假如调教内容中触发了此库），而是暂时记忆起来，等AI的主人通过了才能真正学会。调教时触发此库会降低好感度

「调教-价值教学库」：这里记录一些被认为是危险调教或没价值的文字模板，AI不会立即学会，而是通知主人是否应该学习。对好感度无影响

「学习之后-管理端扫描过滤」：即使AI完全相信了你的调教并且记住了，也会按此说话，管理员会定期检查AI所学的所有知识，根据一个更加严格的过滤库去扫描潜在的危险调教和糟糕调教，从而忘掉它们，以及利用此库来改进「调教-粗口过滤」库

「白名单」：包含和谐词，但属于正常的词语。触发了和谐库同时触发白名单的话，可以认为是正常的，而当做未过滤对待。做到更准确的过滤。如果连续多次触发糟糕调教，会直接拉黑，无视好感

好啦，到这里目前的AI系统所用到的技术基本上也就介绍完了。在最后总结一下3个问题的答案吧。涉及到的技术有分词、语义分析、好友、情绪判定、相对模糊理解方式、触发优先级、性别和属性判定、好感度系统、过滤系统。至于实现思路嘛，我个人知道的两个基于PHP+C+Mysql，猫娘是基于FMS，数据库不清楚，目前有Web方式、QQ两种交互模式，今后还会有更多。（桌面软件啦，手机程序啦blabla...）实现思路就是在收到消息后经过上面一系列系统处理后给个回复就是了。数据通讯很容易，技术难题全部在处理内容上。目前国内的AI都是闭源的，毕竟作者们都花费了不少心血，加上国内这个大环境开源后肯定出现一大堆伪原创的“作者”们甚至直接掐掉过滤系统来捣乱的情况，所以开源的日子估计有点远。有点远...

薛定谔（社工库收集师/APP研究学家）：看在什么平台上实现，分为移动端、桌面应用、嵌入式、WebApp、其它平台如微信公众号五类。

1. 移动端 -- Portable Native Application

2. 桌面应用 -- Desktop Native Application

3. 嵌入式 -- Embedded System

4. WebApp -- Web Application

5. HybridApp -- Hybrid Application

GUI : 良好的人机接口，所谓良好是指用户体验良好，不论是以上五种中的哪一种，都要求遵循统一的设计原则 -- Don't make me think! 因为每多操作一次，用户的设备感就会加深一些，感觉并不像是高大上的人工智能，真正高大上的人工智能是使用户忘记“机器”。

业务逻辑 : 即便你有了好的语义库，缺少了一个好的业务逻辑来增删改查语义库，那就是暴殄天物。好的业务逻辑是指，通过“查”语义库提供本次服务，通过“增”“删”“改”完善修正语义库，为后续提供更好的服务。

语义库：这是聊天机器人的核心技术※

平台的个性知识：由于上述五种平台实质相同，但每一种又在应用层上的表现有所差异，比如 UI ，Android 上利用 android.widget 和 android.view；iOS上利用 UIView; 嵌入式用 C 的话一般利用图形界面库API；WebApp 上利用 HTML+CSS；HybridApp 还要再结合第三方平台提供的接口。

鉴于题主你没说具体在哪个平台上实现，那我也只写个概览吧。

xsank mar（互联网/音乐/游戏/旅行）：清华小图是基于AIML来实现的吧，不过在我简单的测试之后，发现其实小图的智能水平也很一般，只会对特定的提问做特定的回答.处于好奇，我又特地搜了几个商用的问答机器人，那效果就更是一般了，纯粹的题库，还测试了下小黄鸡，其实表现也不是太好，回答都比较单一。所以先不考虑高逼格的深度学习，人工智能，我们来猜想一个问答机器人的实现。

1.已经说明了，是问答机器人，非聊天机器人，那么它的知识体系肯定非常有限，针对性很强，所以题库是必要；

2.既然是问答，那么感情因素是不必要的，即你所加的一堆修饰语都是无用的；

3.语言选择支持，英文的分词，停止词等和中文有着明显的区别；

其实大概根据这3点，就可以去针对性实现一个问答机器人了，其实只要你愿意用很low的办法（但效果还不错）,用大量的题库也是可以来搞一个通俗的聊天机器人，这就要看你怎么调教了。

最后，为了证明以上理论简单粗暴但有效，我还专门搞了一个出来，GitHub - xsank/Shour: A simple chatbot

所以我想说的是，先没必要想那么高深，搞工程的先想实现，再考虑优化，慢慢的就专业了

易君：Github 开源的机器人 HUBOT 可以做包括聊天在内的很多事情，插件也很多

Hanniman：前天csdn报道了这个：一点资讯【《近匠》图灵机器人：App和移动硬件的智慧大脑】

Cristinao：清华小图用的是AIML吧，添加中文分词功能，再加上自己的知识库（为什么？）

三、聊天机器人相关疑问与常见实例

如何评判一个机器人是否足够智能。旁观者大多认为一个机器人能够回答的问题多，可以视为较智能，而不论是什么数据结构或算法的机器人，只要堆砌足够大的数据，在回答问题方面都能做到较为相近的正确率，显然，能够回答的问题数量只是代表了这个机器人后台的数据库是否足够大。

而智能不应是比较谁的数据库足够大，智能是多方面的体现：

1、学习能力

这是最根本，也是最难以提升的一条标准，一个可以自动成长、但数据量很小（能够回答的问题较少）的机器人显然是比一个不能自动成长、但数据量庞大（能够回答的问题较多）实用。机器人的本质是帮助人类，减少人类在各个领域的劳动量，如果一个机器人需要人工录入所有的知识，这本身就增加了人类的负担，是与制造机器人的初衷所违背的，这也是当前聊天机器人虽然较热，但应用较少的一个根本原因。

2、数据筛选能力

在拥有了自学习能力之后，机器人是对知识照单全收，还是有选择的学习较为正确的知识，是进一步评判机器人智能程度的一个标准。

如果机器人只能对知识照单全收，这个学习能力是不完整的，机器人还应或多或少拥有筛选能力。

3、自升级能力

在机器人按照设计者的数据结构、算法做到了自学习，并且拥有了一定程度的知识筛选能力之后，自升级能力会成为下一个堡垒。

学习能力的本质是按照设计者的算法将输入数据结构化为这个机器人的数据组织结构。

当“按照初始算法去结构化各类输入数据”之后，经过统计，发现这类规则不能适应某类知识组织形式或某领域知识时（错误率提高），设计者们应考虑如何让机器人尝试调整算法规则和数据组织结构以使得在错误率较高的知识组织形式或领域降低学习的错误率。

而很多早年出现的各类中文机器人，由于使用的都是最原始的“关键词匹配”方式，并没有数据结构的概念，是不应列入“智能聊天机器人”的范畴。

实例

以下是A和J的一段对话：

1-A：你做梦么？

2-J：做。

3-A：当然。那么，你能记住你的梦么？

4-J：我能非常清晰生动地回想起它们。

5-A：是怎么样的？

6-J：我还不想跟一个机器人调情

很明显，机器是可以有“记忆的”。

如果没有长时记忆体，根据第2句：做。如何能够产生第3句？

如果没有长时记忆体，A是不会知道第2句的“做”是指的做什么，而第3句却精确的继续围绕“梦”的话题在讨论，说明A是有长时记忆体的。

飞信助手同样还没能在这方面更进一步，它只能对一句话做出快速反应，而没有连贯的思维能力和逻辑能力。距离真正的人工智能，飞信助手还只能称得上是小把戏，本质上它没有主动思考联想和记忆的能力。正如获得勒布纳奖铜奖的罗伯茨所说：“我并不深信图灵的理论，也不相信艾尔博特能思考。”作为艾尔博特的创造者，他打比方说，“如果你知道一种魔术秘密何在，明白它如何完成，它对你来说就不再神秘。”

但是它又确实代表着一种方向，在一定意义上，飞信助手相当于一个网络搜索引擎，负责网络信息的自动搜索、查询和处理，只是，它更亲切形象化，更符合人际交流习惯。飞信助手们的出现，似乎也有另一层意义，它展现出来的聪明与狡黠，会不会意味着——我们人类的思维和语言也许没有这么难模仿？会不会意味着——人类的语言习惯可以被总结复制，然后再将这个规律用在人类身上？[2]

再进一步想象一下，或许某一天，电影《黑客帝国》里的场景真的会出现。人类制造了机器人，机器人却叛变，与人类爆发战争。会思考的电脑控制了人脑，人类则在电脑的欺骗下生活？

2014年，国内首个人工智能公司北京光年无限科技有限公司推出了图灵机器人，是中文语境下智能度较高的机器人大脑，是全球领先的中文语义与认知计算平台。

图灵机器人对中文语义的理解准确率高达90%，可为智能化软硬件产品提供中文语义分析、自然语言对话、深度问答等人工智能技术服务。[1]

图灵机器人要应用场景包括智能客服、虚拟机器人、智能手表、智能车载和智能家居。其中虚拟机器人可接入微信、QQ等平台，搭建聊天机器人，与用户流畅交流。图灵机器人提供自然的中文对话能力，精准的中文语义分析能力，准确判断用户意图，同时还具有丰富的上下文场景及强大的自我学习能力。[1]

四、人工智能标记语言(AIML)概述（Dr.理查德S.华勒斯Richard S. Wallace）

AIML Overview概述

By Dr. Richard S. Wallace理查德S.华勒斯博士

AIML或人工智能标记语言，使得人们输入知识、转化为基于ALICE自由软件技术的聊天机器人。

AIML是在1995-2000期间，由Alicebot自由软件社区和我共同开发的。它最初是改编自非XML语法也叫AIML，并且形成了第一个艾尔博特机器人（Alicebot）Alice机器人的基础——A.L.IC.E.人工语言网络计算机实体（the Artificial Linguistic Internet Computer Entity）。

AIML描述一种称为AIML对象的数据对象的类（class），并部分描述了处理他们的计算机程序的行为（behavior）。AIML对象是由所谓的主题（topics）和类型（categories）的单元组成，其中包含任何解析或未解析的数据。

解析数据（Parsed data）是由字符，其中一些形成字符数据（character data）、一些形成AIML元素（AIML elements）。AIML元素封装在包含在文档中的刺激-反应知识（stimulus-response knowledge）。在这些元素中的字符数据（Character data）有时由AIML编译器（AIML interpreter）解析，有时由响应器（Responder）稍后出处理其余未解析的。

五、人工智能标记语言(AIML)基本知识、知识库、应用公司列表

90年代科学家华莱士将“人工语言在线计算机实体”艾丽斯Alice聊天程序安装到网络服务器，观察网民对它说什么，然后对艾丽斯升级。艾丽斯聊天经验日渐丰富，也越来越厉害，在2000年、2001年、2004年三夺勒布纳奖。艾丽斯一度被认为是最聪明的聊天机器人，文本类聊天机器人大都是基于此机器人原型进一步研发的。国内，赛科智能机器人技术支持的小黄鸡微信版免费聊天接口终身免费开放，微信营销公司多用此聊天接口。我们是不是可以开发一个聊天机器人呢？这就需要大家对NLP/AIML技术相当熟练，且要有多样性语库支撑。免费的人工语言在线计算机实体ALICE人工智能标记语言（ALICE AIML）类知识库（knowledge base）可以实现聊天机器人功能。

1、AIML：人工智能标记语言(Artificial Intelligence Markup Language)

AIML（人工智能标记语言）是一种XML兼容的语言，很容易学习，并且可以开始定制艾尔博特（Alicebot）或分分钟创建一个scratch机器人。AIML最重要的单元有：

: 开始和结束一个AIML文档的标签（tag）

: 标志着一个艾尔博特知识库（Alicebot's knowledge base）的“知识单元”标签<类别>

: 用于包含匹配用户给艾尔博特（an Alicebot）机器人可以说或键入字符的一个简单模式（simple pattern）<模式>

人工智能标记语言AIML聊天机器人：产生、种类、应用、实例、AIML概述、知识库、公司、业界（20k字经典收藏版）

AIML Overview概述

你可能感兴趣的:(实战3:聊天机器人)