在上世纪50年代,当电脑还是一台重达28吨的庞然大物时,没有人奢求它能够「说话」,更没有人想在嘈杂的运作环境中和它聊天,语音技术在那个年代还是空白。
时间来到70年后,电脑经历了半个多世纪的发展,已然从庞然大物变得小巧玲珑,而在这半个多世纪的漫长变身中,语音技术也随着电脑和互联网的发展持续取得突破。
自动语音识别、语音合成等语音技术的搭载成为了一台智能手机不可或缺的部分,一款好的语音助手甚至能够实现与手机主人有效沟通的功能,足以见得语音技术具有强大的影响力。
作为人工智能技术当中关键的一环,智能语音技术的发展不仅影响着电子科技产业,对传媒业的影响也极为巨大,语音播报、语音助手等在传媒领域功勋卓著,并不断推动着传媒产业的发展。
语音技术助传媒「三点开花」
在语音识别技术发展的大背景下,传媒产业正借助着其独有的文字、语言传播特点增强语音技术所带来的影响力。
法国哲学家帕斯卡尔在《思想录》里曾说:「最轻微的运动可以影响整个自然,一块岩石可以使大海发生变化。」
如果把语音技术比作海边的岩石,那它翻腾起的便是传媒行业的整片大海,它所翻腾出的不仅传媒业浅海的细沙,也翻腾出了海底的万种宝藏,让传媒行业在语音技术的介入下变幻莫测。
而在诸多的变化中,传媒行业中最具代性的变化体现为三方面,接下来笔者将为大家一一赘述。
变化一:新闻行业改头换面
传媒行业当中时效性最强、变化性最小的新闻产业成为了语音技术介入的第一高地。
作为传统媒体关注的重中之重,新闻行业也在逐渐脱离传统媒体意义下的系统性播报,而是转而由新媒体、短视频、音频和车载电台来提升其影响力,由此,更具变化性的语音技术在新闻播报产业落地生根。
首先求变的是新闻语音服务类产品,语音深度新闻+语音助手的模式成为近几年的新闻播报的热点。
现代人阅读新闻的模式已经转变成「跳跃式」,因为网络新闻内容既没有固定时间,也没有固定数量,同一条新闻源会经过加工在千百个网站上播发,所以,让用户选择自己想看的新闻变成为了待需解决的痛点。
智能手机的智能语音助手通常只会播放非常简短的新闻摘要,如果在用户很忙的情况下,比如做家务,健身,做饭的时候,而语音深度新闻即可以让用户成功解放双手,又可以让用户有选择性的听取内容,可谓是一石二鸟。
最为典型的语音新闻服务便是亚马逊计划在美国推出的Alexa的深度新闻功能,它可以提供来自彭博、CNBC、CNN、Fox news、Newsy和NPR的长篇新闻。当用户说出「Alexa,告诉我新闻」或用其它渠道播放新闻时,就会从所有提供商那里得到详细的音频,甚至可以从CNBC和Newsy那里观看到新闻视频。
新闻音频可以在任何装有Alexa驱动的设备上工作,而视频则需要配备显示屏的智能设备,比如Echo Show。如果用户不愿意仔细阅读每一篇,可以选择语音控制跳过,只听自己感兴趣的新闻。
这种语音助手能够实现人机互动,同时让新闻的听众具有通过语音选择所听内容的权利,发挥了语音技术在识别和人机互动上的功能。
新闻载体从报纸到电视到网络,随着智能音箱的优化发展,众多传统媒体推陈出新,利用AI技术和算法为用户提供围绕⽣活场景的整合资讯服务,构建「语音头条」联合运营体系,把以用户体验为核心的探索发挥到极致。
在中国,也已经有如此人性化的服务了,天猫精灵携手传统媒体推出了「语音头条」智能资讯产品,用户只需要发出「早上好、晚上好」或类似「来段新闻」这样的语音指令,即可获取本地资讯信息。
在AI语音交互不断进步的⼤环境下,天猫精灵的「语音头条」技术不仅实现了新闻收听用户量的增长,还提升了用户收听新闻的完整度,实现了新闻作品在受众中的有效传播,语音智能终端也与转型中的传统媒体展现出了跨界合作的巨大可能性。
在软硬件结合上,语音技术发挥了巨大的优势,而在传统媒体的新闻播报上,语音技术更是回到了自己的主场,展现出了强大的「抢饭碗」实力。
近几年,国内AI主持人的兴起让很多人刮目相看,纷纷赞叹我国在AI主持人技术上的突出成就。而对于传统新闻播音从业者来说,新闻播音似乎不再是香饽饽,而是成为了人工语音技术试水的新天地。
2018年5月,科大讯飞旗下的讯飞智声平台的AI语音合成技术对康辉老师的声音进行合成模拟,打造出全球第一个虚拟主播形象「康晓辉」。在CCTV 13的特别报道《直播长江》中,「康晓辉」凭借绕口令、记者对话连线等表现深受大众喜爱。
除了模仿声音以外,科大讯飞还在智能硬件结合方面做着积极的探索,借助个性化的语音合成技术能够模仿任何一位主持人的声音,而通过AI赋能,科大讯飞可以使机器摆脱机械化发音,发出和真人一样抑扬顿挫的声音,这对于传统的人工主播来说是一种巨大的职业「威胁」。
而在国外开发的智能语音硬件上,语音合成技术也在不断地进步。比如,亚马逊的关联小程序中有多家致力于为智能音箱市场提供解说新闻的公司,而且基本都使用感情充沛的人工播音代替冰冷的Alexa标准声音。
在未来,传媒产业的新闻领域将是和语音技术连接最紧密的,未来的语音技术也会更多运用到新闻产品的软硬件及播报当中,促进传统媒体转型下新闻业的发展。
变化二:互动语音时代的媒体娱乐
如果说语音技术进军新闻界绰绰有余的话,那么语音技术进军媒体娱乐则需要研发者和媒体从业者动一番脑筋。
在娱乐行业,率先尝试加入语音技术的是老牌传媒巨头BBC。BBC在深思熟虑下推出了适配亚马逊Echo和谷歌Home互动广播《检查室》,一个卡夫卡式的科幻题材有声戏剧,区别于传统听书节目。《检查室》的最大亮点在于其极高的自由度,听众可以听一段故事,然后在给出的诸多选项中选择自己的故事情节。
在这段20分钟时长的故事里,故事大框架不变,细节从用户与语音助手的一问一答产生。换句话说,每个人收听出的故事不一定相同。互动式的语音戏剧给了听众极大的好奇感,也很容易让人沉浸其中,让听众能够紧跟故事发展。
2017年12月,BBC又宣布了一项酝酿5个月的语音计划,Alexa用户可以直接发出指令,收听BBC 56个广播频道内容,把包括《阿澈一家》《女性时间》等在去年一年下载量超2.4亿的节目搬到了语音设备上,但是,智能语音原生内容还有待进一步开发。
BBC和其它品牌一样,也面临着同类化的激烈竞争,以求建立起品牌认知。据高级编辑Devichand说:听众群的建立能帮助他们搜集到用户的日常指令,收听内容和时长,以便创作原生内容。至于商业化,刚刚涉足语音领域的BBC或许还来不及考虑。
此外,BBC还计划今年创作一些儿童节目,这也是BBC公共服务职责的核心部分。不过,语音设备会如何影响儿童身心发展,卫报作者Stuart Heritage有自己的担忧:「现有的语音识别形成了固有理念,即我们必须礼貌对话,逢句必说『请』和『谢谢』,但当孩子意识到哪怕大喊大叫也能让语音设备执行指令时,可能会对儿童产生新的影响。」
在智能语音技术的发展基础上,更多的利用语音的可操控性可以增强受众的沉浸感,也会拉近受众与作品的距离,加快受众吸收知识的速度,也是互动剧之后语音技术所创造出的娱乐新方向。
相信在未来,如果互动剧能够加入语音识别技术的话,观众便可以语音参与剧中,体验更真实的互动感。
变化三:语音智能大屏背景下的媒体
5G将至,智慧家庭新时代正在扑面而来。从以单品为中心的单品智能阶段,到以家庭为中心的互联智能阶段(一家一景),再到以用户为中心的智慧家庭阶段(一家多景),随着技术的演进,智慧家庭已几经更迭。
对于家庭来说,电视的形态没有因为新媒体、流媒体的发展而改变,变化的是电视所具有的功能。大屏,依然是家庭智慧联动的入口,所以未来的电视大屏展示和语音技术的关联度是最高的,也是语音技术在智能互联家庭背景下影响媒体最深刻的。
在国内媒体当中,率先做出语音技术结合大屏尝试的还是科大讯飞。
早在2018年4月,广东广电网络已与科大讯飞签定了战略合作协议,双方基于电视大屛的人工智能语音交互平台开展合作,用户拿着语音遥控器按住语音键,语音的需求任务被采集、解码、识别并操作。经过近一年的深度运营,广东广电已拥有超过百万的电视语音用户,用户整体活跃率高达82%,用户的反响也不错。
而在2019年,科大讯飞和广东广电再度合作,双方联合发布融合更多人工智能技术的AI电视助手2.0,带给电视用户前所未有的智能体验。将科大讯飞手中的语音技术资源和广东广电手中的用户资源有效整合,这种方式也能更快速的推进语音大屏普及,使更多观众能够适应和习惯新时代电视的发展。
此次广东广电全新发布的AI电视助手2.0可以实现「通过声音猜你喜欢」,通过对用户年龄、性别的声纹识别,准确判断家庭成员角色,再结合大数据和用户搜索习惯,基于用户画像与内容的个性化推荐协助广东广电实现增值业务内容包的精准推送。
AI电视助手2.0还可实现「方言输入随心切换」,该语音识别技术可实现普通话和粤语双引擎随心切换,同时首发上线被网友评为「中国十大最难懂方言」的客家话识别,助力传统文化的保护,方便当地用户使用。
除了上述功能外,AI电视助手2.0还实现了语音多轮对话识别、明星角色识别等特色能力,例如说「孙俪老公的电影」,系统即可快速找到邓超所参演的影片,用户说法更自由。
在语音技术的加持下,媒体的发展竞争会更加激烈,在语音智能电视的环境之下,观众的选择更多变、目的性更强,如何在浩如烟海的片库当中让观众选择一个栏目、一个影片考验的是制片方的制片能力和创造力;多种选择下,当红娱乐明星和爆款综艺、娱乐、影视IP也会成为媒体市场的宠儿,从而倒逼影视媒体行业的质量升级、创意更新。
未来语音技术给传媒产业带来的革新
在媒体领域,语音技术已经与传统的媒体传播碰撞出了激烈的火花,媒介作为人的延伸,语音交互技术与人工智能的进步无疑创造了媒体与用户接触的更多场景,也通过语音技术在媒体的内容生产、经营、运营等方面带来了深刻的变革。
那么,在未来的发展中,语音技术还会如何影响媒体发展呢?
颠覆传统传播模式是语音技术给未来传媒产业带来的革新之一。
在语音技术领域,人工智能的发展与其相辅相成,语音技术的出现从根本上就是未来实现人与电子产品交流的目的。而在人与电子设备交流的过程中,便产生了以用户为核心的内容推送和选择服务。
在传统媒体时代,用户进行内容消费的逻辑是隔断式的「确认—阅读」,而智能语音则提供了一种全新的交互式内容消费方式,即连续性的「询问—聆听」。
一方面,这意味着用户可以发挥主动性,通过语音交互随时获取自己感兴趣的内容;另一方面,它让用户与智能语音产品之间进行新闻内容的讨论成为可能,从而提升了内容消费的深度。这得益于智能语音技术在「整体逻辑」上的进步。
在未来,更多为用户服务的内容将被生产,更具爆点、有社会影响力、具有专门性的节目会被推出,未来节目的制作也会更多为用户考量、为选择让路。
为媒体内容生产和经营赋能也是语音技术背景下传媒生产方式革新的体现。
目前,智能语音中的语音转文字技术已经达到极高的应用水准。以科大讯飞为例,新版讯飞输入法在语音输入上的准确率已经提高到98%,方言准确率均已达到80%以上,且支持中英语音混合输入,这为推动智能语音技术在新闻内容采写上的应用奠定了基础。
十三届全国人大一次会议召开期间,人民日报就是通过引入类似的人工智能语音识别系统,实现了对直播音频的中英文同步文本翻译,极大地提高了新闻采写速度,减少了人工耗时,提高了新闻传播的效率。国家级媒体的示范作用也推动了智能语音技术在新闻媒体行业中的应用。
而在运营和经营方面,人机语音对话数据能极大地丰富用户画像,人工智能+营销、人工智能+用户调研等方向前景广阔。未来的媒体栏目在语音技术数据的支撑下,可以创造出更贴近用户需求,更能吸引大众眼球的节目,大大提升广播、影视等作品的影响力和吸引力。
最后,增强传媒产品的互动性是语音技术与传媒结合的更高层次要求。
在英国BBC推出的语音互动广播剧率先垂范语音技术与传媒产品结合后,笔者认为,近几年风头正劲的互动影视剧未来也有与语音技术结合的机会。
在国内的教育领域,互动影视与智能语音已经开始结合并应用。
今年,百度智能云利用AI技术帮助教育平台立思辰打造虚拟名师。借助虚拟视觉能力和语音合成技术,打造特定真人或动漫形象的声音、表情作为名师形象,通过亲切的语音、动作、文字等方式与学生进行互动。
这款虚拟名师,通过定制专属的智能语音对话系统,配合知识图谱网络,可实现更智能的课前预习和课后答疑,让课前、课中、课后的教学机制真正有机融合、互相赋能。
而在国内的互动剧市场,例如《古董局中局之佛头起源》《他的微笑》等等,完全可以利用语音互动的方式让观众体验更加真实的互动场景,让互动剧在未来被更广泛的接收。
1号结语
可以看到,语音技术和语音交互产业正在快速的发展,在这趟快车当中,传媒行业成为了必不可少的座上宾。
未来,无论是在影视娱乐硬件开发,还是媒体内容制作营销上,语音技术都将成为未来传媒影响未来受众的关键一环,相信在未来,语音技术一定会推着传媒向前走,也会倒逼产业升级,提升媒体发展的质量、增强媒体的影响力,为媒体的蓬勃发簪添砖加瓦。