元宇宙作为当前热门话题之一,受到了业界广泛地关注,不少企业纷纷开始依托现有业务与技术能力布局元宇宙领域,迎接这个新的风口。本次,我们很荣幸地邀请到了 ZEGO 即构科技 解决方案开发专家 许明龙接受采访,一起聊一聊 ZEGO 即构科技在推进元宇宙建设过程中的策略和布局,以及在元宇宙引擎构建和实时互动RTI领域的探索与成果。
主要负责泛娱乐场景下的元宇宙解决方案的开发和落地,包括 Avatar 虚拟形象以及虚拟场景在各类泛娱乐 App 内的集成开发、性能优化、多平台兼容优化支持等。在虚拟世界结合 RTC 以及虚拟场景环境音在各个平台的落地上积累了丰富的经验。
LiveVideoStack:许老师好,很高兴能邀请您接受采访。先跟LiveVideoStack的读者朋友们简单介绍下自己吧。可以说说目前重点关注的一些技术、工作内容等等。
许明龙: 大家好,我是 ZEGO 即构科技的解决方案开发工程师许明龙。在公司主要负责 RTC SDK 相关的研发工作,给公司多家头部客户做过解决方案,也针对不同的客户需求开发过很多定制方案,涉猎教育、娱乐、游戏、金融等多种场景。参与过虚拟世界相关能力底层的开发,客户对接集成落地经验丰富。目前在开发 Unity 相关的元宇宙能力、以及小游戏相关的平台建设。
LiveVideoStack:当前许多企业纷纷开始布局元宇宙,但构建元宇宙从技术实现到场景应用是一项极为复杂的工程。在您看来能够快速入局,迎接元宇宙这个风口的关键路径和可能在哪里?
许明龙: 当下的元宇宙距离人们想象的去中心化、用户生产并拥有数字资产以及能够实现跨平台玩耍的“终极形态”还有相当长的路要走。受困于硬件、技术的壁垒,元宇宙初期应用方向将以服务于普罗大众的轻度娱乐为主,而非面向核心玩家的硬核内容。所以在元宇宙推进的过程中,不应急功近利,而是将元宇宙拆解,徐徐图之。
泛娱乐社交玩家能否靠元宇宙突围,其核心并不在于“元宇宙”三个字对自身的加持如何,而在于是否能搭建出击中用户的娱乐化/功能化场景,一个成熟的元宇宙场景,并非简单地将表现形式由二维切换至三维,光影、场景规划乃至声场的远近都将时刻影响着场景氛围。这意味着,企业无法简单地套用过去的产品设计方案来搭建场景,而是需要相应的元宇宙引擎来处理涉及技术底层,细密繁杂的问题,元宇宙引擎就像是工具箱,让开发者快速进入核心工作,不必由发明工具开始从零起步,节省了宝贵的时间及金钱人力成本。发掘这样的“元宇宙引擎”可能就是迎接元宇宙这个风口的关键路径。
LiveVideoStack:就在前不久,即构科技正式对外发布了“元宇宙智能互动引擎”,能否为我们具体介绍下它是什么?
许明龙:“即构元宇宙智能互动引擎”是一站式的元宇宙搭建平台化服务,即构将提供有针对性的产品、工具和服务,满足企业不同的搭建需求,帮助企业低门槛快速打造元宇宙场景玩法。我们会提供丰富的素材库,同时连接国内数家 top 美术公司,打造开放的内容生态,满足开发者对多元素材内容以及高定制的需求。助力开发者低门槛快速打造元宇宙基础设施,整合强大的音视频能力衍生多元玩法,助力企业快速搭建元宇宙场景。
LiveVideoStack:为什么要打造元宇宙智能互动引擎,有哪些实际价值?
许明龙: 即构科技打造“元宇宙智能互动引擎”秉持的初衷是要成为其中的技术实干家,让更多的行业先行者更快更简单地打造元宇宙场景,协助他们去挖掘元宇宙未来不可估量的实际价值。
1、ZEGO Avatar 助力与帮助开发者和个人打造极具个性化的虚拟化身。Avatar,即构虚拟人,通过素材、风格的多元化的形象,实现栩栩如生的虚拟人,用户可以构建自己的虚拟形象,企业可以打造IP类数字资产,通过强大的AI驱动能力,仅需一台千元机即可流畅实现极低延迟表情随动或肢体随动。
2、核心产品即构虚拟世界,ZEGO Metaworld。提供了丰富且强大的组件库,包括可交互的桌椅,聊天气泡,粒子特效,大到虚拟语聊,虚拟换装,当前的超极屏就是 metaworld 的核心组件之一,通过即构的畅直播方案为大家带来低延迟的直播体验。
3、场景化的 RTC 能力。包括低延迟音视频、直播、3D 音效、范围语音,在开放世界中提供更加沉浸式的语音视频体验。
4、多元化内容。即构沉淀了大量多元化能力和内容,包括自研的白板、屏幕共享、文件分享,以及强大的内容生态:百万级别的音乐版权,上千部电影版权,多种类型的优质小游戏,通过这些能力和内容,可以轻松构建不同类型的业务场景。
LiveVideoStack:即构科技这么多年来一直在深耕探索音视频通信、实时互动,音视频处理、AI 算法等多方面的技术与能力。在此次构建元宇宙智能互动引擎的过程中,这些积累提供了哪些助力?我们又遇到了哪些难点与挑战,是如何克服的?
许明龙: 元宇宙概念的出圈本身代表着各行业技术储备到了一定规模,足够支撑行业去想象未来的虚拟空间会如何呈现。电子游戏几十年的发展摸清了 3D 空间打造、物理交互反馈以及如何带给人更强的沉浸感。同时线上社交领域的 RTC 技术足够支撑更加高质量的音视频传输、在实时的场景下去做到接近现实世界的视听体验效果。
元宇宙的核心元素可以分为:身份、关系、沉浸感、低延迟、多元化、经济体系,事实上,其中核心元素和即构的愿景“共建更好的实时互动世界“不谋而合。元宇宙的兴起,也正好成为了即构的一场技术能力大考。
从 2015 年开始,借着连麦、直播、音视频通话的能力,切入到实时互动赛道。到 2019 年之后,我们注意到人工智能技术工程化逐步成熟并在众多场景中落地开花,语音视频的前后处理算法和能力也得到了广度与深度兼具的发展。与此同时,数字人、虚拟客服这类内容的呈现,包括网友们熟知的二次元歌姬演唱会,多年来仍以离线生产的方式在行进,以实时互动方式实现的案例偏少。能否给用户带来更多元化的内容和玩法,增强线上的实时互动,多做一些可玩性更强的输出?即构开始投入大量资源和人力,专门研究 AI、音效处理、视觉处理、大规模线上人机交互和数据同步等多种算法和技术,寻求线上互动的能力突破。2021 年初,元宇宙概念兴起,这与我们正在做的事情恰好一致,前期牢固的技术积累也为我们迅速切入元宇宙赛道提供了极大助力。
LiveVideoStack:今天,基于互联网的线上交流互动,已经不仅限于语音视频这种你一句我一句的对话式通讯体验。从“线上交流”到“共享时空”已经成为当前互联网演进升级的方向。我们发现即构强调的实时互动 RTI,与这个趋势不谋而合,可以给我们介绍下即构实时互动RTI的内涵么?
许明龙: 随着能力的拓新与服务的进步,我们意识到即时通讯 RTC 已经无法概括所有的线上交流。今天我们提出以实时互动RTI(Real-Time Interaction)来总结概括 ZEGO 的能力,这并非是对未来的描绘,而是对当下现实的陈述。
10月28日,即构科技的 Express SDK3.0 全面上线,基于 RTI,我们发布了多项能力分别对应智能逼真的画质「Intelligence」、身临其境的音质「Immersion」以及无限互动的玩法「Infinity」,用可靠的技术实力为 ZEGO 实时互动 RTI 打上了生动的注解。
多人状态实时同步&大规模连麦为元宇宙空间内的大规模用户互动提供了坚实的基础,空间音频能在虚拟空间中还原现实世界的声音反馈。移动端实时超分借助 AI 算法让画质高清的同时,能极大地控制传输成本。场景化降噪让突发性噪声消弭殆尽,为用户带来沉浸式的音质体验……
实时互动RTI(Real-time Interaction)即代表 ZEGO 能力的总和,同时也昭示着未来钻研的方向:相较于RTC,并非以信息交互为唯一目标,而是通过数字化的方式,让人与人共享时空,用可视化服务体系保障更好的互动体验,在高效准确的基础之上,满足精神需求。
技术与需求在互相牵扯中不断前进,作为数字化时代的卖水人,我们将不断钻研,力求为所有前行者提供更强大便捷的助力。ZEGO 所期望的,是用实时互动技术与所有人共建让工作生活更加轻松有趣的世界。
【相关释义补充】:
RTI(Real-Time Interaction)代表一切为实现媲美甚至超越现实的实时互动场景下所需要用到的所有产品和技术组合,除了核心的 RTC、IM、直播之外,还包括 Avatar、Al 视觉、状态同步等等,相较于 RTC 更强调互动,不以信息的交换为唯一目标,旨在以数字化方式,创造用户所需的共享时空,满足其精神需求,并辅以配套的可视化服务体系保障更好的互动。
LiveVideoStack:对于真正意义上的“元宇宙”,目前我们所能看到的可能只是冰山一角。能否总结和展望下元宇宙应用或产品当前所面临的一些困境和挑战,以及未来的一些可能性?
许明龙: 随着元宇宙产业走入大众视野,相应的“承建”需求亦将激增,毕竟元宇宙并非能够简单复刻的商业模式,而是涵盖众多前沿技术的集合。这意味着,工业化很可能将成为这场科技革命的必经阶段,而即构这类的玩家,正扮演“流水线”的角色,为元宇宙而筑基。
LiveVideoStack:最后,接下来您也会参与今年LiveVideoStackCon 2022北京站大会,能否在这里先剧透下,您会在现场分享哪些精彩内容?
许明龙: 元宇宙作为当前热门话题,引发各厂商纷纷布局,实时互动作为搭建元宇宙场景的底层技术分支,是不可或缺的关键技术,如何在短时间内高效、迅速的获取实时互动 RTI 技术能力,是占领市场的关键动作之一,这次分享我会在现场分享 ZEGO 即构科技在实时互动 RTI 领域的最新研发成果,再结合具体实践案例,聊聊包括虚拟人、元宇宙场景状态同步、大规模连麦等热门技术。
LiveVideoStack:感谢,期待接下来您在北京站大会现场的精彩分享。
*封面图来自Pexels