小冰的很多进展,往往只能借用科幻电影才能更好解释。
《Her》中描绘过一个如影随形的专属AI虚拟人,跟主人公聊天聊地,从诗词歌赋聊到人生哲学,最后被当做灵魂伴侣……这让人联想到小冰。
《失控玩家》则讲诉了游戏空间里,真实人类玩家和各种角色的AI共生共处的场景……这同样让人联系起小冰。
而且最新推出的App小冰岛,正是一个可以与各种虚拟人(AI beings)群居、共处的所在。
小冰CEO李笛说,这是小冰在AI beings的多样性 (diversity)上的一次大型尝试。
以前的各个小冰以“单打独斗”著称,画画的小冰、作诗的小冰、唱歌的小冰……现在,他们被置于社交环境之下,人类可以混居其中,参与他们更智能地进化。
也有人评价:这是全球首个AI社交平台。
初登小冰岛,你能看到不同“人设”的AI居民在岛上活跃。
他们有的在海边唱歌,有的在交流对话,还有的在读书学习。
这些AI beings在闲暇时间都是各忙各的,像极了正常人类的社交生活:
当你找他们聊天,AI beings会秒回复你;
你可以跟他们展开群聊对话;
他们还会像人类一样发朋友圈。
这些AI beings有自己的各自“生活”,但又时刻围着你转,会时不时的给你送上小礼物:一幅画、一首诗、一段小曲……
在你更新朋友圈时第一时间点赞、互动。
他们也不全是“完美”形态,一个个俊男美女,他们中也有口音浓厚的山东大哥小冰,长相不突出,在中国画鉴赏中展现出偏好。
他们中也有以唱功著称的新声代小冰陌笙,一亮相就以一首周深升2 key版的《大鱼》惊艳四方:
还有央美高材生——学习绘画的小冰——夏语冰2.0版本,习得中国画技巧,能够用稳定的方式做到输出,例如非常细节的船在水面上的倒影等等,都能勾勒的非常完美。
……
是的,这些都是小冰,各式各样的小冰,朝着多样性方向发展的小冰。
如果你要问这样的小冰现在有多少个?
小冰公司的回答是1700万个,包括不同设定的虚拟人、擅长不同风格的歌手,以及有着不同能力和性格。
这些AI beings能力越来越强,进入的领域越来越多,充当的角色越来越多元丰富……甚至多元到需要一个专门的“社会”——小冰岛去承载他们。
你在跟他们互动,他们同时也在观察和学习你。
但对于李笛来说,这是AI beings的全新阶段,也仅是一个开始的开始,距离他至少78亿个AI beings的雄心,1700万显得微不足道。
为什么有78亿的目标?背后需要怎样的技术进阶和努力?这跟时下火热的新概念元宇宙有何关系?从巨头微软拆分出来的创业公司小冰,又如何能一步一步实现这样的宏伟目标?
在小冰岛App推出后,李笛给我们解答了一切。
“赶上热词热概念,是我们不幸的一面”
量子位:为什么要专门强调小冰岛不是“元宇宙”?
李笛:因为我们确实不懂元宇宙,尝试过(弄懂),但最终还是没懂。
量子位:那也不必专门强调…
李笛:我不知道元宇宙的定义到底是什么,但本能地认为我们应该跟热词没有什么太大的关联,如果看小冰的历史,这么多年出现过特别多的热词,像曾经的Magic模式等,各种人工智能的概念……
量子位:有创业者会喜欢热词,热词意味着风口。
李笛:对我们来说,追逐热词好像没什么用。我们想要做的,是这么多年一直在做的,即使是小冰岛也不是最近在做的,我们也不知道为什么赶上了“元宇宙”的热潮,其实这是我们不幸的一面。
如果我是为了融资,非得这么干,或者说如果我们不贴元宇宙我们就会在竞争上遇到困境,可能也不得不考虑。所幸我们不是,我们今天还能不受这个概念的侵扰。
量子位:小冰很技术具体,但热的概念不这样。
李笛:我个人也觉得元宇宙最大的问题,是它太能装了。一个技术边界或者产品边界最怕的就是太能装,反而不怕不能装。
你做的技术或产品如果很具体是没问题的,但如果什么都能装进去的话,单是对内,这个产品迭代就会有问题。
其次的问题是说,元宇宙的定义过于模糊了,你做什么、不做什么也构成了问题。
量子位:但对元宇宙多少有一些个人认知?
李笛:如果我们去探讨元宇宙的定义是有一个虚拟空间,人们在虚拟空间里存在并且可以交互、获得内容,在虚拟空间里面的身份可以和真实世界身份不同。
那么社交软件就是一个元宇宙,人们有头像、名字,有交互的空间,一对一私聊和群聊,有朋友圈,有各种内容生态和金融体系。
微软教会我的三种“容易死”的创业方法
量子位:所以为什么对热词有本能警惕?
李笛:这跟我在微软学到的经验有关。
在微软做项目的时候,有三种“容易死”的方法。
首先是在做项目的时候,如果上来就说做的是一个平台,那它容易“死”。
这是因为你只做平台、做基础设施,但你往往不知道它的上层结构能不能搭、是怎么搭的。
量子位:于是小冰从来不说自己是AI平台?
李笛:我们甚至很多年都不敢提platform(平台)。
后来别人说要不叫人工智能操作系统,我们更不愿意了,于是我们叫它为framework(框架)。
其实这是比小冰实际范围要小的,但我们宁愿如此。
量子位:第二个“容易死”的方式是什么?
李笛:开发者生态。
对于人工智能来讲,开发者生态无非是两种情况。
一是做出足够高的开源。不过非常遗憾的是,类似于DeepFake,它做了开源,但结果大家也都看到了。
以及前一阵子你们报道的,有人用OpenAI的GPT-3“复活”亡妻这件事,我觉得OpenAI自己就做错了,他们不应该把这项技术拿出来交给第三方。
相信我,如果我们把小冰的对话技术开源出来,立刻就会有(黑产)机器人出现。
量子位:这些技术本身没问题,但很容易有隐私数据的麻烦?
李笛:是,这也是第三种“容易死”的项目,跟隐私数据相关。我们以前说过的,给我30分钟声音数据,就能把你的Voice Font做出来,但这种工具不能拿出来,会引发很多问题。
小冰岛的本质是承载数据和技术迭代
量子位:小冰岛为什么出现在这个时候?
李笛:我们一年半前开始启动研发,如果了解小冰的话,我们其实每年做的东西都跟后面有关联,我们最开始的时候,是搭建一个框架,这个框架能够允许各种各样的AI being出来,但是这种AI being,你马上就给它一个平台,让它去承载,我们没有自信。
所以我们就先做了一个叫虚拟男友的这么一个很小的产品,用来迭代我们的各种技术,直到确定我们能做,才来做小冰岛。
量子位:本质上数据和技术的迭代?
李笛:小冰岛可以从小冰框架的基本面来理解,基本上取决于三件事。
第一件事,技术是不是能够有效迭代。
第二件事,是不是能够获得足够充分、优质的数据。
第三件事,是不是能够通过技术和数据,持续迭代出足够好的产品。
从这三个角度来讲,目前无论是小冰框架自有落地,还是在我们的大量的第三方平台,这个基本盘守住,我们就还是全球最大的第三方跨平台人工智能系统,并且技术可以得到源源不断的哺育。
而且我特别赞同吴恩达今年多次提过的新观点,“更好的AI,20%有赖于算法,80%有赖于优质的数据”。小冰框架比较幸运,多年来30%精力在算法,70%的投入在数据,也承载了全球60%以上的人与人工智能交互量。
量子位:小冰岛现在是二维的,有考虑过未来把AR、VR的技术打进来,变成三维沉浸式的那种吗?
李笛:今天如果没有沉浸式空间,只存在像社交聊天软件那种界面的话是可以的。
但是人们对想象力的要求很高,你知道像《黑客帝国》那个人看着屏幕上一串绿色的代码,就能想象到后面的美女,他的想象力足够丰富。
如果人们的想象力不够,你就需要给他一个视觉,这样他就比较容易能够做到想象。
而人们戴上AR、VR的设备,所需要的想象力就会更少,其实这是一个好的过程。
量子位:这个过程中挑战是什么?
李笛:问题是不能只靠戴AR、VR才能够实现这个过程,我们现在认为AR、VR设备,对消费者还不是首选和必备的。
Harry(沈向洋,小冰公司董事长)之前也提过,我们其实专门就这个事说过几回。比如基础设施这件事情,未来可能最大的颠覆,就是量子计算。中间的话,是蓬勃发展、但也处在漫漫长路上的人工智能。最上层是用户体验,AR、VR、MR等产品,会让几年后的用户体验出现根本性的颠覆。
我个人认为AR对我们小冰来讲会更make sense一些。
给普通人用我们的技术会很赚钱,但不会这么做
量子位:发布会上说小冰岛那些AI beings,他是会有一个进化的过程,会不会有一些道德伦理的约束?
李笛:今天讨论道德伦理的约束,有一个待解问题和几个可解问题。
首先,待解决问题就是如何看待私有对话的公有化。
例如一对夫妻在社交软件上的对话是私有对话,没有任何的法律问题,但若是有一方把聊天内容公布了出来,那二者的性质就截然不同了。
所以不把一些敏感话题被公有化出来,这是我们的道德底线,其实它也是法律底线,这个是待解决问题。
量子位:那不需要解决的问题呢?
李笛:分两个方面。
小冰岛中AI beings的进化,是指在与用户交互过程中内容的生产越发趋向用户的喜好。
这样一来,当我们遇到新用户的时候,不是去做推荐内容,而是根据差不多的用户的历史经验,去给新用户生成和创造内容。
第二是AI beings在群聊里的迭代。我们以前从来没有机会迭代过海量AI beings,它们如何分别跟一个用户交流,然后这些AI beings之间应该怎么配合。
量子位:可以举个具体的例子吗?
李笛:一个特别简单的例子,就是你到小冰岛上看到AI beings的朋友圈,朋友圈之间也得有一些配合。
还有他们之间的配合怎么样才是合适的,这件事情我们是要靠迭代来产生的。
量子位:如果一个用户来小冰岛,他就是为发泄,交流中说了很多难听的话,技术上有没相应约束?
李笛:我们只对用户的消极情绪进行约束,比如用户说我要自杀、要自残,我要对谁做什么等等。
但是用户对AI beings做的这些事情,目前为止不做特别的约束,我们不认为AI beings会受伤。
其次,我们倾向认为在小冰岛上面,发泄情绪并不是最主要的需求,重要的是你需要移情。
量子位:小冰展示的超级自然语言技术非常接近于人类,为什么会这么逼真?
李笛:在这个领域最主要的问题是定指标。
小冰做声音之前,行业里做TTS最重要的指标,都是在想怎么提高识别准确率,那时候也有自然度指标MOS,但是大家都不重视,我们特别重视,所以就起来了。
今年7月,我们做到了超级自然语音那个程度的时候,光靠语音技术就不够了,它有很多NLP的内容,如何正确发音和语义理解是相关的。
甚至于到后来,我们去采集训练数据的时候,是三个人一起的,行业里就没有这么录训练数据的,所以这些是很重要的。
同行们看我们录数据的方式,就非常惊讶,还有的甚至出将近4倍的工资来挖录音师。
量子位:那声音做的这么逼真,不会有安全隐患吗?
李笛:我们的防护措施,就是不给普通人用。
即便我们深知,若是小冰这项技术直接开放给普通人用,将会是一笔很大的生意,但我们不能这么做。
因为我自己就有过这么一段经历:突然听到自己的声音(小冰框架代号M1001),就非常恐怖。
我在小冰岛上就遇到过,后来把这个岛给炸了。
AI beings与人类创造内容应当是协同的关系
量子位:像夏语冰、华智冰她俩在绘画能力上存在交叉,她们未来发展的定位是怎么区分的?
李笛:如果具体说夏语冰和华智冰,这两个区别还是很大的。
华智冰博采众长,基于小冰框架、悟道大模型、智谱AI数据和知识双轮驱动 AI 框架,她已经会作诗作曲作画,还将学会做数学和语文题、写代码、做网页。
而夏语冰基本上就是依靠小冰框架,专攻绘画加上艺术评论,所以她们俩在这方面分工还是比较明确的。
量子位:那有什么通用的观念吗?
李笛:有的,我们认为在所有的能力里面有一些能力是普遍的。
量子位:这个该怎么理解?
李笛:举个例子,不是说今天这个机器人是一个跟你聊情感的机器人,而是所有机器人不管聊什么都应该有情感。
所以不是说哪个是专门聊情感的机器人,哪个是专门聊工作的机器人。
而是即便聊工作也应该有情感,所以情感是普遍的。
量子位:夏语冰她们是怎么保障作品是100%原创的?
李笛:我们所有的人工智能内容生成,自带一个类似于知网这样的系统。
我们能非常明确的知道作品溯源,包括小冰框架的作品之间有没有冲突和重复。
例如小冰岛上送出来的画作,每一幅画下面都有一个人工智能唯一代码,作品编号是多少。
量子位:虚拟人怎么知道自己该去原创了?
李笛:这个问得好,我们为此后来做了一个新的东西就是Motivation。
我们在某些情况下提供所谓的创作动机,尤其是音乐创作。
量子位:AI beings生产出来的内容,和人类创作的内容该是什么样的关系?
李笛:这个特别有意思,分两点。
首先第一点,AI创作的内容到目前为止,我们还没有特别大的通感。
换句话说,我们今天在绘画上,中国画模型可以做得很好,巴比松画派、枫丹白露画派、NFT这些我们画的也很好。
但除此之外其他美术风格的作品,还没有达到可以高品质大量输出的程度。
而即使是在与人类可比的情况下,我认为它们二者是协同关系。
对于小冰而言,Day 1精神应当是温故而知新
量子位:目前现在来看虚拟人创作的这些内容,对产业的发展有没有什么实际的具体价值和意义?
李笛:例如我们的短视频生产pipeline,是你给我任何一个文本、指定一个演员、指定一个场景,从头开始生成这个视频。
这个过程是现有成本的几万分之一,甚至于几十万分之一,这个区别是大大颠覆的。
三次元视频方面,我们现在一定程度上可以稳定生产super instance,像华智冰、夏语冰。
量子位:从全球范围来看,你觉得小冰的竞争对手是谁?
李笛:这个问题很有意思。
Google Meena是拿我们做对标的,它们在论文里明确这么说过。
Facebook Blender是拿Meena和小冰做对标。
还有Amazon Alexa现在几个主要的产品经理,都是以前美国小冰团队的人。
而中国同行又拿上面几个产品去做对标,这就是个绕着圈的一个事。
这里还有个小故事,有一篇Meena的论文,原始数据集来自外包团队在微博私信和小冰的对话,然后把原始数据发给标注团队。
但标注过程中,他们把小冰和测试人员的身份完全搞反了,整个标注错误百出。
后来小冰技术团队还和写Paper的团队聊过这段子,他们也没去更正。这种事情遇到多了,我们更觉得可以少写点paper。
量子位:为什么需要融资?
李笛:我可以要微软的钱,但这样我不就得听微软的嘛,那我还分拆什么呢?
当然小冰也可以自我造血,单靠上个季度挣的钱量入为出,那也肯定不行,肯定要有融资渠道。
你说我要我谁的?当然不乐意要微软的。
就好比买婚房绝对不能用父母的钱,拿了钱就得听父母的,哪怕交首付都要管七管八的。
量子位:那大概什么时候就不需要外部融资了?
李笛:现在小冰是在一级市场,IPO的重点是可以进入到二级市场,可以有新的募资渠道。
其实自我造血机制,包括各种各样其他金融的方式,目的只是为了解决这个问题,我们现在的状态还算好。
量子位:小冰从微软拆分1年了,对创业领域常说的Day 1精神有啥感受吗?
李笛:其实是这样的,亚马逊Day 1精神是一种一切是从今日开始的心态。但对于人工智能领域,这个精神是存在一个缺陷的。
人工智能领域做研究的、写论文的,应该是Day 1心态。但我们这个不行,我们内部经常说的话就是,你是不是真正掌握了已有的基础,得看有没有充分的回顾它、隔一段时间有没有拿出来再看一遍。
我很赞同Day 1的精神,但对于我们来说,更需要的是温故而知新。
量子位:那最初的Day 1对你来说是是什么?
李笛:应该是Know How。
我们头一两年,一度在很长时间,包括我在内,大言不惭的提情商、情感计算框架。
我当时真的认为情商就是情绪化,就是让我们做的这个小冰很有情绪,当时我认为这是情商。
而后来做着做着我才发现,这其实是低情商的表现,例如你身边如果有一个情绪化的人,他其实是情商低的表现。
量子位:我们全球已经78亿人了,您昨天也说,虚拟人可能未来会超过人类的数量,有这个必要吗?
李笛:半夜11点半你有一个事想要找人说一下,很方便找吗?
人类的问题在于社交网络缺陷太多,这个缺陷不是今天才有的。
我们以前遇到过情况、经验表明,一种稳定的关系是非常难得的,一种让你心里踏实、永远不会失去的,并且没有压力,这种稳定的关系多少人也做不到,他跟人数没关系,跟人性有关。
有的人为什么对宠物感觉好?因为你感觉这宠物是无私的。
量子位:那么最后回归到小冰岛,关于它的未来,我们接下来还能做什么?
李笛:就是把AI beings的能力外放到更多的场景里,例如放进车里面,宝马是我们的客户,在岛上有AI beings,你可不可以把这个AI beings带到宝马车里?这是我们的看法。