出品|虎嗅Pro
作者|刘国辉
头图|电影《银翼杀手2049》截图
别紧张,并不是一个恐怖故事,只是为你“畅享”一下未来,没错,单身的朋友们注意了,如果现实让你挫败万分,那么好消息是人类距离跟虚拟数字人谈恋爱的未来又近了一步。
今年的CES上,三星旗下STAR Labs展示了其设计的虚拟数字人NEON,受到了全场几乎最高的关注度。这些虚拟数字人动作流畅,眼神自然,甚至气质都与真人相差无几。并且,这样与真人无异的外在表现,居然都是AI学习出的结果。
“NEON 不是人工智能助手,更像我们人类,是一个独立的生物,可以表达情感,并从中学习。与 AI 助手不同,NEON 没有从互联网搜索天气的接口,也不能播放你喜欢的音乐。”官方如此解释设计NEON的初衷。
三星Neon的虚拟数字人
根据STAR Labs介绍,NEON具备共情能力,能够真正理解人类的想法。通过机器学习累计的数据和能力,他们会进化得更像现实生活中的角色,比如演员、发言人、电视主播等。
不过,目前来看,NEON学得最好的还是人类的表情动作,至于说智能化水平,就一言难尽了。NEON 首席执行官兼 STAR Labs 负责人 Pranav Mistry 第一次在CES进行现场展示NEON的时候,NEON甚至出现了数次宕机,以至于演示无法继续。
在国内,已经有不少公司在NEON推出之前就在做虚拟数字人了。甚至在全国的头等大事—疫情防控方面,也有了虚拟数字人的身影。创业公司声智科技推出了AI虚拟数字人测温系统,在一些办公楼里,由虚拟数字人代替前台或者保安,来执行测温任务,防止交叉感染。
这引出了一个问题——为什么我们需要研发看起来跟真人没啥区别的虚拟数字人呢?
两个月前,《前沿技术情报所》发布文章《虚拟数字人能带来一场交互革命?》,全方位展现中国虚拟数字人当下的发展图景、应用现状、优势与瓶颈。本文为该文的节选缩减版。
#魔鬼藏在细节中,即刻扫描下方二维码订阅虎嗅Pro会员,免费畅读《前沿技术情报所》。
从虚拟主播表演到测温防疫,虚拟数字人应用五花八门
国内已经有一些领域开始使用虚拟数字人:
有银行在网点设置大屏,屏里的数字人做导向、咨询的工作,有点像数字化的大堂经理;银行APP也打算用数字人来承担理财顾问的角色;北京互联网法院推出了全国首位AI虚拟法官,引导用户了解互联网法院诉讼流程;线上泛娱乐是一块重要市场,想必大家已经上见过一些虚拟主持人,百度、科大讯飞、搜狗、创业公司如魔珐科技等都推出过类似产品。
虚拟数字人目前在功能上略显稚嫩,NEON看上去很炫酷,但目前也就是一个带有形象的虚拟助手而已。微软小冰很火,但现在还没有形成很高的商业价值。虚拟数字人又能怎么样?
但不能以现在的能力来评判未来,数字人不仅带来一种新的界面,更是带来一种新的交互方式。魔珐科技创始人柴金祥对虎嗅Pro表示,将来的APP会升级,今天APP里面有各种功能,将来可以转由虚拟数字人跟用户交互。
虚拟数字人看上去就是用三维视觉感知、3D建模等技术塑造出比较逼真的形象,用语音识别、语音合成、自然语言处理等技术让数字人初步具备一些交互能力。
在应用上,虚拟数字人有线上线下之分。
在线下,虚拟数字人可以在政府部门、医院、银行、消费场所等场景里提供简单的客服功能。
如回到办公场所防疫这个场景,据声智科技相关负责人介绍,当红外摄像仪检测到往来人员体温时,数字人会语音播报温度数据,同时提醒未检测到的个人调整距离,重新接受检测。当AI数字人检测到疑似发热症状时,会语音报警,提示安检人员追踪体温较高的人员。
此外,数字人的主要应用场景是在银行、政府办事部门、医院等,与来办事的民众做一些简单互动与引导,做虚拟助手。在政府部门以及医院这样的单位,民众若不知道办事流程或者归属部门,以往需要专门安排一个人做这事,对这个员工来讲,挺考验耐心和责任心的,在职业上也缺乏成就感。对此,虚拟数字人便有了用武之地。
在线上,虚拟数字人还有个典型的场景是泛娱乐,如虚拟主持人、主播、模特等。一家经纪公司非常依赖旗下的签约艺人,直播平台非常依赖头部的主播。如果有虚拟数字人能够受到观众的欢迎,可以降低泛娱乐平台对明星或者主播的依赖程度,因为这个虚拟数字人是完全受到、平台的控制的,不必担心被高价挖走,也不会因为一些事件出现人设崩塌。
在防控疫情的当下,也有一些公司向宣传部门开放虚拟主播的使用权限,在制作疫情播报的视频中加入虚拟主播,增强视频的效果。
柴金祥认为,虚拟数字人第一个市场一定是泛娱乐,以数字人为依托生产内容,比如进行虚拟直播、短视频、综艺秀等,所有的内容是导演策划好的,不需要全智能。
此外,数字人在线上还可以提供一种新的交互方式,以前是人与网站、APP界面交互,此后,用户可以直接跟数字人交互。或是在泛娱乐或者教育等场景来提供一个拟人的形象,代替真人来表演或者教学。
北京互联网法院界面
当然,现在即使有数字人,网站的交互也还很机械。以北京互联网法院为例,依然是用户查找各种版面寻找需要的信息,虽然有数字人,也只是按照预设程序来播放。比如想要了解著作权信息,点击之后由数字人在视频中讲解。
柴金祥认为,今天APP里面有各种功能,将来用虚拟数字人跟用户交互就可以了,届时如果在搜索引擎里搜某个银行,出来的不是网页,而是这个银行的虚拟数字人来回答用户提出的各种问题。
哪些领域更适合虚拟数字人落地?
声智科技创始人陈孝良对虎嗅Pro表示,虚拟数字人是一个新兴的技术,商业模式还在探索之中。
比较明确的是虚拟数字人可在手机、智能家居等场景下成为每个人专属虚拟助手以及情感陪伴,也可以在企业成为虚拟数字员工,帮助企业升级智能化无人办公,还可以成为新闻、游戏解说、网红等虚拟主播。
柴金祥则认为,虚拟数字人在泛娱乐领域需求会比较明确。利用虚拟数字人可以解决影视和游戏、短视频等内容制作中效率低、产能低、质量低的痛点,至今这些领域在国内基本仍属于劳动密集型的手工作坊制作。其次,增量市场比如虚拟直播和虚拟偶像,可以连续直播、连续表演,这个事情,泛娱乐领域的大公司都想做。
在其他领域,柴金祥认为,虚拟数字人主要解决降本增效的问题。全智能虚拟数字人不是要去替代人,也不一定要做得比人好,它更多是解决有限人力,以及人不能24*7工作的问题。另外,全智能虚拟数字人可以把以前的语音客服进行升级,从语音交互升级成多模态交互。
数字人在不同领域创造的价值不同,潜力也不一样。
柴金祥对虎嗅Pro表示,判断哪些领域会适合虚拟数字人的应用,可以从三个角度去考量:对交互的需求、对形象的需求、对体验的需求。某些行业特别适合图文并茂跟用户交互信息的,而且需要的信息量没有那么大,不是10轮、20轮那种的对话,都可以用虚拟数字人来提供服务。
他表示, 重内容轻交互的领域是最先应用的一类,像虚拟老师,大部分时间在讲课;泛娱乐领域的虚拟数字人,大部分时间在表演,交互很少,应用起来会更早期。另一类是不需要很强的知识库,比如一家公司,以前介绍自己更多是通过官网的形式,现在可以有这样的虚拟数字人,用户可以问问题,数字人可以图文并茂解释。
对于专业性比较强的领域,或者通用的领域,虚拟数字人的应用可能不会那么乐观。越是专业、通用、强交互的场景,在当下的技术条件下,越不适合做虚拟数字人。有些事情在现实生活当中本来就比较难,比如陪一个人聊天这种通用的场景,或者理财顾问这一个很专业的领域,对数字人的对话能力、智能性、专业能力的要求都很高,应用落地都会很往后放。
虚拟数字人要面临的几大拷问
现在虚拟数字人应用正在起步,三星、百度、腾讯等大厂都有产品问世,魔珐科技等创业公司也获得融资,应用也在一点点落地,像声智科技这样的语音领域的公司也推出了数字人的产品,显示这个新兴领域正在受到越来越多的关注。
但虚拟数字人想要大行其道,还有经过几番试炼。
落地场景一定需要形象吗?
首先,虚拟数字人背后是AI,或者是一套IT系统,真的需要做出一个真人的形象吗?以虚拟老师为例,有一个数字形象来播放课程,跟没有数字形象的视频相比,对教学效果有什么效率提升吗?
这涉及到项目落地的必要性问题。从客户的角度看,你的产品可能对我有一定价值,但我对你的产品没有达到非用不可的程度,这时候落地就比较难,即使能落地,产品也卖不上价。
陈孝良认为,做一个虚拟形象是有必要的。人与机器的沟通过程,拟人化一直非常关键,因为在知识交流的过程中,人类总会带有很强的审美情感。虚拟数字人可以拉近机器与人之间的距离,可以成为人类的情感陪伴。
柴金祥则表示,这里面更重要在于交互体验提升。最简单的交互是电话交互,更上一级的交互是图文并茂,再往上会有视频交互。
没有一个交互的提升是必须的,一种新应用要替代原有方式,必须能做到一旦有了这个交互后,用户不愿意回到原来的方式。那么,数字人怎么跟所有的图文信息、数字答疑、视频结合起来,让用户感到这种提供信息的方式是最方便的,这是业界需要解决的问题。
综合来看,虚拟数字人的交互相比原有的APP交互是否更舒服更顺畅,还有待于市场检验。毕竟,人们对现有的交互方式黏性很高,想要替换是比较难的。就像人们已经熟悉了二维码支付,现在让人去体验刷脸支付,即使是微信支付宝这样的重量级玩家去推,也显得很难。
想要替换原有的交互方式,虚拟数字人就要显示出更明显的价值来,吸引客户来付费。这当然要技术的进步,更重要的是产品能够更贴近客户的场景。
写实是数字人的趋势吗?
其次,就算在一些场景需要一个虚拟形象,但是这个虚拟形象一定是要跟真人一样写实吗,有无必要?
虚拟数字人往往主打真实形象的概念,数字人的形象确实也比一般的动画作品更真实,但跟真人的形象相比还是有差别,真人的眼睛是非常灵动的,而虚拟数字人看起来速率比较慢,面部表情也没有真人那么丰富。其他的肢体动作跟真人比也比较迟缓。
柴金祥对此表示,这个事情往前走的话分两个点:一是角色效果会越来越好,它是一个技术加艺术的过程,不是技术做的特别好了,艺术马上就做好了;第二,超写实是不是要跟真人一样,也不一定,取决于应用场景。
陈孝良认为,目前一些国漫的崛起,说明写实逼真的高度拟人化虚拟人并不一定是市场的需求,年轻人对标新立异的虚拟形象更感兴趣,高度拟人的形象只能在新闻主播等有限场景下应用比较合适。
需要高度智能化吗?
另外,有了这样一个数字人的形象,但现在能做的事都还比较简单。未来数字人的产品趋势是什么,是继续做一个简单的客服,还是通过持续的学习去有更强的智能性?
三星表示,NEON 由两项技术提供支持:
陈孝良认为,AI虚拟数字人的智能化,需要具备多轮对话的能力,以及各个行业的知识图谱,形成一个庞大的智能知识库,并具备学习能力,这样才能解决各种专业的行业问题。
AI虚拟数字人在应用落地过程中,需要一个强大的AI后台大脑,以及触摸、语音、传感器等多模态交互融合,以达到适用于各种场景下的拟人化交互,帮助人类解决各种问题。然而,虚拟数字人想做到如此,还有很长的路要走。
虚拟的形象可以用现在的技术解决,但背后的专业能力却不容易形成。目前,解决方案都是让那个数字人解答一些简单问题后,再把客户的复杂需求提交给专业人员,不过想提供好的用户体验还需要在产品上做好引导,形成一个合理的流程。
虚拟数字人适合所有场景吗?
目前看来,并非所有的网站、APP都适合用数字人来做交互,数字人还是更适用于用户有明确需求的场景。
比如用户想了解虎嗅,可以让一个虚拟数字人掌握了虎嗅的全部公开资料后,形成知识库,再根据用户的提问去做回答。但对于一个没有明确阅读需求的用户来讲,面对虎嗅的虚拟数字人,可能没有问题去提。但这个人是可以在漫无目的地在虎嗅上看一些文章的。
另外,不是每个用户都喜欢用语音来控制,也不是每个场景都适合用语音,像办公室、会议室等场景,用语音驱动虚拟数字人,可能不太合适。
总结一下,未来我们会在越来越多的场景里看到虚拟数字人,虚拟数字人会与AI一起,成为技术落地的一环。
起初数字人会比较简单,承载已经预设好的内容,比如在很多场合做客服的工作,或者在娱乐领域代替真人表演;如果AI能力进步,在自然语言处理、知识图谱等方面越来越强,虚拟数字人会有更好的交互体验,以及在专业领域形成比较强的替代能力。虚拟数字人未来做到怎样,其实还是要看AI能做成什么样。
#虚拟数字人会火起来成为下一个风口吗?本文为虎嗅Pro会员专享文章《虚拟数字人能带来一场交互革命?》删减版,加入虎嗅Pro会员解锁全文。此外,您还将获得的权益有:
· 总价值2093元的16个专栏产品(除《前沿技术情报所》外,还包括虎嗅研究总监李彤的《财报透露的真相》、梁建章的《人口保卫战》、天图资本合伙人李康林的《消费品玩家》等等),共计600+精品文章与案例;
·加入虎嗅会员社群,每周一次线上分享,与行业大咖、投资人直接对话;
·免费闭门论坛,针对各个行业不定期举行线下沙龙,往期实录可以戳这里。
在订购过程中如有任何问题,请微信联系虎嗅Pro会员小秘书,微信号:huxiuProNo_2
End