编者按:在讲到金山云的直播业务演进的问题时,朱岩形容过程像“开着飞机修飞机”。当直播业务逐渐变得复杂,其背后需要更高性能、更高标准的边缘场景去支撑。从2014年开始,金山云就坚持All in cloud战略,全面布局云业务。如今,九年的成长让金山云能够依托强大的CDN能力,全面支撑边缘计算和直播架构的发展。技术立业不仅仅是一句口号,而是金山云十年如一日的坚持。以下是朱岩的讲述——
LVS:朱岩老师您好,按照惯例,还是请您先介绍下自己以及您所负责的职务。
朱岩:各位好,我是金山云边缘云的高级技术总监朱岩,主要负责边缘计算相关产品线。金山云边缘计算是金山云近些年来打造的云计算服务,依托金山云领先的云和CDN能力,可以为客户提供高质量、低成本、低延迟、大带宽的云服务能力。能够给客户在CDN、本地覆盖、低延迟计算等场景下提供更多的想象力。
LVS:您加入金山云也有四年的时间了,这四年来,您觉得金山云有着怎样的变化?
朱岩:金山云在这四年多发生了很多变化。在这个过程中,我见证了一些同学有了明显的成长,也见证了很多产品越做越强。无论是金山云也好还是边缘计算也好,经过这些年的打磨,都还在不断思考,不断地尝试,不断经受市场考验。公司整体上朝着更加务实和聚焦的方向发展,越来越朝着成为客户所需要的、为客户提供重要价值的云厂商前进。
金山云的企业文化一直是技术立业。技术是金山云非常重视的一环,也可以说是最重要的一环。毕竟老板是做技术出身,所以一直是把对技术人才的尊重放在第一位。对待技术立业要将技术当做信仰,坚信技术是改变人类的原动力。
LVS:您最近有关注哪些技术趋势,可以和我们讲讲吗?
朱岩:我最近的主要精力还是集中在边缘云以及边缘计算相关的应用场景。 边缘计算场景下,很多先前云计算解决的问题都需要被重新思考,IaaS关注的计算、存储、网络等问题都需要重新定义。
诸如像直播在边缘计算场景上的拓展、边缘组网、边缘场景下的闲时资源利用、边缘存储以及边缘场景下AIGC的应用和落地都需要被反复讨论和思考。尤其是近期的AIGC,将为交互性实时音视频提供非常多的想象力,如智能直播、数字人、游戏等场景。这些场景下特别契合边缘计算的计算能力与低延迟能力。我们也时刻在关注着这方面的动向。
LVS:在金山云直播业务演进的过程中,遇到的最大的难点是什么?
朱岩:在直播业务演进中,我们从早期的简单的流量系统逐步演变为了一个包含有弹性计算、大规模存储、算网融合等能力的复杂系统。同时,我们还要在将系统一步一步演进,领先行业发展的前提下保障好客户的服务。这相当于开着飞机修飞机。系统的复杂度和为客户提供好服务,将其变为了一个不能通过“在线上做个测试,观察一下反馈”的这种互联网似的方法。而需要在线下就做足准备工作,调研、测试、验证等一个都不能少,最终保证我们在线上是有充分信心的系统。伴随着系统的复杂度不断升级,这将带来相当大的挑战。
LVS:您在演讲提纲中提到了”直播架构的演进过程是从0到1再到10的过程“。如果说从0到1是一个从无到有的过程,那么如何理解从1到10呢?
朱岩:如上述的直播难点一样,直播业务也从一个简单系统逐步演变成为了一个高性能、高标准、足够复杂的边缘场景的产品。这个过程中其实是将简单的直播业务逐渐丰富起来,并在客户需求、业务场景、成本运营、计算、存储、网络等多个维度均进行演进和加强。如果说从0到1主要还是来自于技术上的实现。从1到10则要求团队不只是在技术层面上思考问题,而是要结合客户需求、成本运营、技术先进性、整合公司资源等一系列综合目标进行系统性的思考,并一个一个解决。
诸如为了将全国的直播节点统一起来,我们进行算网融合、部分可错峰流量我们引入边缘存储的能力、针对弹性不足,则需要更好的弹性算力、我们还与Intel进行深度合作,引入Intel的智能硬件在解码、解密等大幅提效。
LVS:让我们来聊聊边缘计算,金山云的边缘计算的优势是什么?目前在场景探索中实现了哪些效果?
朱岩:金山云边缘计算依托金山云领先的云和CDN能力,可以为客户提供高质量、低成本、低延迟、大带宽的云服务能力。同时我们也是一个比较全面的边缘IaaS产品,具备计算、存储、网络等全面能力的象限,可以在多方面给客户提供业务支撑。
金山云边缘计算基本上实践了市面上的多种应用场景,最终在云游戏、云桌面、CDN、RTC、安防、边缘组网、以及一些垂直领域等,我们实现了落地并获得了客户的认可。同时我们也在积极实践已有业务的弹性支持、边缘场景下的混合和闲时计算等原本在云场景下才更适合的案例。
伴随着边缘计算的基础设施和产品力的提升,我们还将在更细分的场景下为客户提供更好的解决方案,愿成为客户信赖的合作伙伴。
LVS:金山云的边缘计算是怎样实现成本上的节省和存储呢?
朱岩:云计算的一个重要的底层逻辑是实现规模化效应和积极的成本运营,以实现在成本上的优势。我们依托于金山云尤其是边缘云整体的规模化资源基础,能够积极地和各个流量产品配合,实现在资源上的时空复用。同样的,在成本方面,边缘计算从资源规划到线上资源运营,从vCPU复用到全面的闲置算力的整合都进行了思考和整合。
对于客户而言,边缘计算可以提供更佳的本地资源覆盖,同时由于边缘计算提供计算、存储和网络的全面支撑能力,在很多场景下可以为客户实现成本上的节省。例如BGP网络的下沉至边缘以节约带宽成本;客户对象存储的下沉,可为客户提供充足的上行带宽,并节约从存储到流量的成本;与其他流量产品配合实现更有竞争力的价格等。降本一直是客户的核心诉求,我们将在此不断优化,为客户提供更优秀但更具性价比的产品。
LVS:非常感谢您的回答。最后,欢迎您向我们剧透本次您在LiveVideoStackCon上带来的演讲内容。
朱岩:本次分享将分为三个部分,第一部分介绍金山云直播架构演进,直播架构如何从0到1再到10完成几个阶段性的跨越;第二部分介绍在直播过程引入的传输技术的讨论;第三部分介绍直播和边缘计算的结合,如何强化直播的基础设施能力以及算力弹性能力,为直播提供更好的成本与性能体验。
▲扫描图中二维码或点击“阅读原文” ▲
查看更多LiveVideoStackCon 2023上海站精彩话题