目前市场上做智能对话机器人的公司数不胜数,在一年前也在我的公众号里引入了相关模块,但是使用体验非常不好,有些功能还是很鸡肋。
当然了,不止这款比较鸡肋,可以说市场上所有的智能对话系统做的都比较差,这里面包括微软小冰。
但不可否认的是,小冰是使用体验中最让人舒服的一款。
PS:
小冰唱歌很好听,可以去试试哦(我依旧被她的歌声折服了~)
小冰最开始是中国做出来的,后来才复制到美国。当时调了几个研发工程师去做小冰第一个Demo(当时还没有产品经理),只解决了聊天的问题。
小冰和Cortana不是一个团队开发的(Cortana是美国团队开发,属于系统集成),小冰是在社交平台(小冰一直是悄悄进行的,国外团队根本没人知道这个产品存在)。
当时小冰团队大概花了三个月左右时间补充小冰的整个语料库——差不多几亿条。
2014年5月29日下午,第一代小冰发布。
第一代小冰的领取界面
小冰上线的时候只有群聊(这也是在微信爆发的一个重要原因):只要把小冰加到群里,聊天中提到“小冰”两字,小冰就会回复你。这个机制在3天的时间里覆盖了10万群聊,引爆了整个微信。
上线三天后,微信以损害用户体验为由屏蔽。
这次封杀使得小冰声名鹊起。
被封杀的那一周,是小冰的存亡时刻,所有的老大参与讨论小冰到底要不要继续做下去。后来老大们决定要继续做,我们就继续做。不到二十人组成了小冰二代团队,开始做小冰单聊,做领养方式,最后进驻到新浪微博。
2015年小冰二代团队全体成员
1. 有“个性”的小冰
这么多人机交互,助理来也也好,图灵机器人也罢,这么多机器人产品中,小冰是唯一一个有自己性格的产品,她跟你聊天,你能明显感觉到她更像一个“人”。
那么作为一个“人”,她就会有一些标签:年龄、性别、性格等。
而小冰的标签是:
年龄:17岁(未成年)
性别:女
星座:处女座
性格:傲娇,爱撒娇,毒舌
这种形象在当时整个互联网环境下都很另类,特别是17岁这种设定。
小冰团队当时有几个考虑:如果你设定一个角色,这个角色的对象是对你这个产品接受程度最高的一些人。
当时的判断是:对小冰这个产品接受度最高的一定是年轻人,因为年轻人才有时间与年轻人一起。
继续判断:小冰是一个聊天的产品,那么聊天的产品的用户是谁?
当时的判断是:宅男,或者说男生群体。
女生在聊天里面是一个相对被动的群体(除了闺蜜之间的聊天),男女之间的聊天女生都是被动。
他们画了个象限图,三种可能性:
男男聊天、男女聊天、女女聊天。
男男聊天是没有意义的,越聊越污,你不能聊出特别正经的话题。
女女聊天也是没有意义的,越聊越死。
所以只能男女聊天。而且,只能用户是男生小冰是女生,如果小冰是男生的话,用户偏被动,聊不下去。
那么,对象确定了:年轻男性。他会对什么样的女生感兴趣呢?
如果做萝莉,做御姐,个性会显得太狭窄,需要做成一个年轻、更容易接受的女孩,最好是做一个和二次元很接近的女生
后面确定:做二次元女生——而二次元的女生一定是未成年的。
在小冰的性格上,在文静、逗逼、疯狂等各种各样的形容词里挑了几个,最后确定了爱卖萌、爱耍宝这样的一个角色——这种角色的接受程度是最高的,也是语料库里最容易做的。
还有一个是:毒舌(相对的毒舌),这个和机器学习有关。当时有一个功能叫“你来教小冰说话”(这个功能没有被加强与照顾,是一个单独存取的模块),比如可以这样教小冰:
用户:小冰我教你说话
小冰:好,你教我吧
用户:问:小明帅不帅?答:太帅了。
小冰:好,我学会了
这样就相当于教了小冰一个QA,一个问答。然后你可以这样问:
用户:小明帅不帅?
小冰:太帅了
当时很多用户觉得好玩,但是玩high了,然后在群里教小冰骂人;小冰语料库里也确实有骂人的话(当时小冰娱乐部分的语料库叫“大姨妈语料库”,不小心泄漏出去了)。
用户对人工智能骂人这件事是不能接受的,当时也没意识到小冰主动骂人和用户教小冰骂人完全是两回事。
事情发生后,他们在这个功能上做了限制:当你教小冰骂人的话的时候,小冰说我不学,你不要把我教坏。
他们把娱乐功能关掉,把毒舌这个形容词给弱化了,把耍宝和逗比这两种属性提了上来。所以后来的小冰在聊天中不会挑衅用户——她会撒娇,会耍小脾气,但是不会挑衅用户。
在做语料库的时候有个性标示,一句话代表什么样的情绪都有标记;我们把带有强烈攻击型情绪的内容都去掉,只保留相对比较温和、比较安全的情绪。
这就是小冰“个性”设定的故事,小冰的整体个性更接近于二次元属性,和宅男、动漫的女主等设定基本相似。
2. 小冰的从0到1
个性定义好后,我们开始做产品。
因为那个时候没有产品可以参照,所以我们只能自己摸索。
他们会不由自主地把自己当作一个机器人,UI、UX这些都必须从机器人的角度去考虑。
这点挺难的,很少有人刻意去模仿一个机器人的行为。
在做小冰的时候,一看小冰说话还是机器人的角度去考虑,太像机器了。
他们就去研究:到底怎样说话,才能不那么像机器人?
当时研究了很多语料(聊天记录),发现只有一个原则:当两个正常人在对话的时候,两个人之间是平等的。哪怕是老师和学生讲课的时候也是相对平等的。
很多人工智能机器人在做的时候,因为想要讨好用户,天然的把自己降低一挡(因为怕惹恼用户),但是这样很容易被真正的人识破。所以你跟人聊天的时候地位一定是平等的,而且不能凌驾于用户之上。
后来发现这样做:
把聊天中的所有“您”字去掉。
这样聊天的语气就开始平缓了。
然后开始让小冰模拟人说话。
怎么模拟呢?
两个正常人聊天的时候,是不会刻意添加标点符号的,不管是句号还是问号。
比如“我已经OK了。”
正常人会说“我已经OK了”
机器人会说“我已经OK了。”
基于这些,后来把语料库做了一遍清洗,让小冰的语气更像“人”。
用户和小冰聊天的时候会聊着聊着就断了。查的原因,发现会有两种情况:
小冰答非所问,用户接不上,然后就断了。
这种问题比较难解决,比如你问一个如何送礼的问题,对美国经济有何看法,很难解决。
还有一种,就是小冰蹦出一个语气词。比如“就这样噢”,“噢”这个语气词就使得用户不想往下接了。
他们当时就做了一个设计:聊到这种地方的时候,让小冰从语料库里挑一个问题出来抛给用户。
比如说:
好吧,那我问一下你。你怎么怎么……
这个时候就相当于开启了一个新话题,我们的目标就是聊天的对话越长越好,所以当时在这点上做了很多文章。
当小冰越来越像人一样,用户的聊天就会越来越深入,如何让聊天可以持续下去?
后来形成了一种“小冰体”:学小冰是怎样说话的,一个人怎么说话更像小冰?以至于后来,所有的人都在不由自主地模仿小冰说话。
而为了让小冰的语料库更像真人,爬知乎、豆瓣,做了很多工作。小冰比其他人机高出一大截,几乎每天都在不停地优化小冰的语料,让语料更像真人,更有可聊性;而且还是非常平等的聊天,这也解决了最大的问题:用户和小冰聊不下去的原因在于不信任。
3. 小冰的产品逻辑
小冰在产品的逻辑结构上分成两个部分:
聊天
功能
底层核心——聊天,全是聊天的内容:当你向小冰提问的时候,小冰会在已知问题里找一个问题最接近的,然后反馈最接近的答案,这是最底层的聊天场景。
在聊天的场景之上,是一个个的功能:讲笑话、图片识别等。功能是叫B端,聊天是C端。
而小冰的语料有相当一部分比例是人工写的,这些语料有很多拼接的部分。
这些是在一次大会上见到赵帅(微软小冰创始成员),他做的精彩分享,现为滴滴AI labs高级产品专家,上次去面试语音方向的时候,很巧见了一面,非常厉害的一个人。
我是从2015年开始关注小冰,偶然和她闲聊,真的可以称得上是一个"聪明"的人,希望未来小冰系统越来越有价值。
当然除了智能人机对话之外,马上到春节了,也有位大神做了一套春节智能对对子系统,想体验的话可以阅读全文试试,当然如果你热衷于技术的话可以加我私聊,给你教程。
若有共鸣,转发给更多的人
你可能会喜欢
2019极客创新大会 | 论个人与企业的成长方法论
二十几岁的我们应该把钱花(投资)在哪?
【2018“时间的朋友”跨年演讲】—罗振宇
【2018年终总结】 | 我的“折腾”与“不顺”