在万物互联时代,信息不局限于人与人之间的交流,大量的机器设备也需要进行信息交流。就在去年,我国率先迎来了“物超人”的历史性时刻,即物联网连接数超越了人联网连接数。边缘云的发展进入到“黄金十年”。
“要致富,先修路。”这句话在当下也是极具说服力的。边缘云的“修路”,则要依托网络,网络连接了算力,连接了数据,连接了场景,连接了多云。就像火山引擎边缘云网络产品研发负责人韩伟在接受 51CTO 采访时所说,“边缘云的发展,网络是一定要先行的。只要网络出去,算力就能出去,这也是火山引擎边缘云所持续突破的目标,即让连接和计算无处不在”。
网络是支撑边缘云的关键基础设施
边缘云的目标是在网络的边缘侧提供IT基础设施和云服务,将数据处理和计算能力从云计算中心向网络边缘延伸,在靠近客户的位置提供计算、存储和网络资源,以实现更低的延迟、更快的响应时间和更好的数据安全性。
边缘云网络是一张融合的分布式网络,覆盖了云边缘、近场边缘和现场边缘,面向客户数字化应用和业务需求提供 1ms 到 40ms 广域网络接入,相比中心云具有低延迟、低成本、广覆盖等特征,具备强网络调度属性及扩展性。由于边缘网络覆盖范围更广,用户可以选择就近接入,因此边缘网络天然具备了低延迟的优势。用户就近接入后,由于整个传输链路更短,结合云上带宽调度与复用,从带宽消耗的成本上也更加具有竞争优势。
另外,边缘云具有海量分布式节点以及丰富的业务场景,通过核心节点间的专线覆盖,可以给用户带来更好的体验。在扩展性方面,由于中心云 Region 规模大,所以扩展成本很高,建设周期也非常长。而边缘节点相对比较灵活,可以根据不同业务诉求建设边缘节点,通过网络协同海量分布式节点,快速满足业务发展的需求。
通过将网络接入、计算、存储以及智能化数据分析等工作放在边缘处理,边缘云能够降低响应时延,减轻云端压力,降低带宽成本,并基于云网智能调度能力,对外提供内容分发网络、联网与加速等网络产品服务。因此,网络在边缘云中处于非常关键的位置,是支撑边缘计算及云上产品的关键基础设施。
由内及外,内外统一的边缘云网络
火山引擎是一朵后起之秀的云,虽然发布时间相对较晚,但在内部已经服务了诸多高流量的复杂业务,积累了丰富的技术实践和业务拓展经验。这两年,火山引擎逐步完善边缘云的技术体系和产品体系,以更好地满足不断发展和变化的市场需求。
韩伟所在的技术团队,就是负责火山引擎边缘云网络的产品规划、研发设计、上线交付以及售后服务等环节,整体把控边缘云网络的需求合理性及研发交付,保障边缘云网络产品的服务能力。
韩伟表示,火山引擎边缘云网络的早期主要为抖音集团提供服务,集团所有流量的接入以及网络调度优化体系、网络优化库都是由这个团队负责。并且,集团内部图片缓存及静态文件加速、动静态混合加速等相关业务也是基于边缘云网络服务构建。
其次,火山引擎边缘云网络与中心云的业务有较好的互补,互相联动。例如,CDN 流量主要是下行,存储业务更多是上行,通过对象存储 TOS 和边缘云结合,通过带宽上下行复用的方式,可以极大地降低成本。
再者,火山引擎边缘云网络也在持续向端及更广的地域进行延伸,持续向近场与现场边缘覆盖,并提供全链路的体验优化。例如,在集团抖音业务上,边缘云流量接入体系中会有较多的网络传输及调度优化策略,业务在接入过程中可以进行网络诊断及配置调优,从而让用户得到更好的服务体验。在游戏相关场景中,通过在端侧 SDK 的网络诊断及配置优化,结合云上加速能力,可以给游戏业务及用户提供更好的网络传输服务。
此外,火山引擎边缘云也是内外统一的云,内部业务和外部业务看到的产品和技术是一致的。韩伟表示,“集团业务实际上也是我们的客户,只不过集团客户相对体量会比较大。也正是因为边缘云经过了集团业务规模化的验证,才有了今天具备一定规模并且经历了充分安全与稳定验证的火山引擎边缘云”。
据了解,火山引擎边缘云在全球有 1300 多个节点,覆盖了 50 多个国家,全网的带宽储备已经达到 110T 以上,并建设了覆盖中国大陆、东南亚、及欧美等主要区域的全球骨干网络,可以帮助用户实现全球业务就近接入。
基于全球丰富的边缘算力与网络资源覆盖,火山引擎边缘云网络团队通过智能选路、协议优化等技术,提供内容分发网络、全站加速、全球加速、游戏加速、SD-WAN+ 等场景服务,助力企业实现高可用、高品质、高安全的全球网络连接与加速。
关键技术探索,多层面保障网络运行
边缘云是能够在靠近用户的地方提供高效、可靠的计算和存储服务。然而,边缘云网络的建设和管理也需要一系列的关键技术支持。韩伟将火山引擎边缘云网络的关键技术总结为三类。
第一类是支撑边缘云网络的技术底座,是支撑边缘云的关键部分,负责底层数据转发。火山引擎边缘云提供了多种形态的数据面转发组件,包括主机网络、融合网关和负载均衡等。
- 在主机网络层,向上支撑了多种虚拟机和容器,以及场景化的算力服务,并提供了租户隔离、网络虚拟化、安全防火墙等能力,以确保用户网络的安全隔离及自主可控;
- 在融合网关层,火山引擎边缘云将所有公网流量的入口、安全以及跨域互联等相关场景进行了小型化设计,并融入到融合网关中实现,通过融合技术来满足边缘云上不同节点之间的场景需求、灵活性需求及成本需求;
- 在负载均衡层面,火山引擎边缘云采用软硬一体的技术策略,研发了P4公网导流网关,单机可以跑到 3.2T ;单个负载均衡设备可以达到 800G 的吞吐,解决了像 CDN 大带宽以及文件存储等大流量的问题。
- 在安全领域,火山引擎边缘云团队与安全团队协同支撑了边缘云的所有安全相关需求,例如在基础设施层面,实现了 DDOS 能力,高级威胁检测和 WAF 相关能力,以满足边缘计算节点、CDN及 DCDN 等产品的安全需求。
在数据转发的同时,为了解决路径择优的问题,火山引擎边缘云在基础转发平面之上构建了网络加速和调度平台,这是边缘云分布式节点之间互联互通的核心技术。为了解决网络不稳定时快速发现和定位问题,火山引擎边缘云实现了路径探测和端探测,设计了基于成本、质量、水位和容量的多维度调度体系,满足不同业务场景的需求;此外,火山引擎边缘云设有 Netlab 网络优化实验室,基于 Netlab 的技术储备将传输优化、私有协议等相关技术融入到加速体系中,并在应用代理和协议栈传输等方面进行了较多创新与探索,从而提高了公网传输加速能力,以及因丢包产生抖动时快速恢复能力。
最上层则是面向业务的配置中台体系,火山引擎边缘云将网络配置抽象成分层架构,称为网络配置中台,包括面向用户侧的业务语义转换,面向设备侧通用的高性能配置下发通道、设备水位检测等,以及围绕集团中间件抽象出的配置通用服务。通过网络配置中台,可以有效降低网络产品研发过程中南向配置下发、设备管理、弹性伸缩等很多重复工作,帮助火山引擎边缘云实现新产品的快速上线。
从面向用户侧的控制台到 OpenAPI,再到整个数据转发面进行配置下发,从而确保网络配置下发的一致性及高效性。此外,火山引擎边缘云还在外围搭建了智能网络服务体系,帮助用户更好地用好云,管好云。
解决复杂网络挑战难题,保障用户体验
面向海量数据的爆发,新的应用形态对时延和成本的极致要求,边缘云已逐步成为新一代应用的基础设施。从分布式的属性上看,边缘云强调的是更低的成本、更低的延迟及更广的覆盖。如果边缘节点覆盖的密度更高,接入的用户将会得到更好的体验。
然而,随着节点覆盖面的增加,网络也会更加分散,节点之间的协同也会变得更加复杂。于是,火山引擎边缘云会根据业务的覆盖面以及节点建设情况,采用专线、BGP多线进行边缘节点建设,从而形成一张融合的分布式复杂网络。
融合的分布式复杂网络,也对火山引擎边缘云团队带来了不小的管理难题。例如,用户从源节点到目标节点时,可能会经过不同的路径,由于许多节点间转发时公网传输是不可控的,因此如何快速定位问题成为了挑战难题。
其次,不同节点规模、网络线路覆盖都有会有较大差异,节点协同及网络转发上会面临更高的复杂度。如何保障用户的体验,实现快速定位、快速发现、快速恢复的能力呢?
火山引擎边缘云团队逐一来破解这些难题。站在服务的角度来看,私网是相对容易可控的,所以目标是能直接定位问题。而对于公网,有一段是不可控的,所以需要在可控范围内定位问题,在不可控范围内尽量做到快速定界,即判断是私网的问题,还是公网的问题。确定是云上问题还是网络运营商问题,从而对应地进行解决。
韩伟指出,为了快速判断问题,火山引擎边缘云在网络层、传输层和应用层采用了不同的方法,并将三者结合使用。
在网络层,火山引擎边缘云将云上所有场景的网络路径、网络节点、网络组件等环节进行埋点、着色、路径跟踪和诊断,从而直接定位问题所在。
在传输层,火山引擎边缘云通过刻画全链路网络传输,快速定位问题。由于代理场景可能会将一个连接分为几个部分,火山引擎边缘云通过应用请求的日志监控、协议栈五元组信息及刻画连接期间的传输行为,在请求发出后,可以将代理前后的五元组信息、传输行为及应用侧请求关联到一起,一旦发生丢包问题,就可以快速分析多阶段连接及请求传输行为,从而确定问题所在。
在应用层,通过丰富的应用日志聚合用户的客户端信息、接入地域、请求资源及响应延迟等情况,结合网络层和传输层的路径跟踪以及传输刻画,直接定位问题。
此外,为了提高用户的体验,韩伟团队做了很多边缘云网络的调度以及传输协议的优化。
一是让用户可以就近地接入,降低延迟等带来的影响;二是在互联调度方面,火山引擎边缘云通过节点间 full mesh 探测,掌握每个节点的网络延迟及健康情况,并根据成本、质量、节点容量、水位等情况编排最佳的转发路径。
持续突破,让连接与计算无处不在
火山引擎边缘云的未来发展策略是更深的融合和更广的连接。更深的融合则是从纵向强调云边端的融合,将边缘云下沉到边缘、近场,乃至现场,解决更多的场景问题,实现云边端调度一体化、数据一体化、运维一体化和安全一体化。更广的连接则是从横向覆盖更广的场景,更广的区域,甚至覆盖全球。
在火山引擎边缘云整体的发展前行中,网络需要更好地满足边缘云在融合和连接两方面的需求;同时,未来的网络需要具备更高的弹性、调度能力和加速能力,这些会成为边缘云的核心竞争力。韩伟所在的边缘云网络团队也将持续布局网络基础资源的建设,并在传输优化和调度方面进行持续探索,通过网络实验室进行更多的创新与业务实践。此外,火山引擎边缘云网络团队还将在可观测领域发力,将网络传输路径刻画得更加细致,并期望将这些能力输出给外部用户,让用户也具备可观测的能力;最后,构建网络生态是边缘云网络发展的关键,需要解决网络开放和应用透明接入等问题。火山引擎边缘云网络团队将与更多的产业伙伴协同配合,在边缘云上输出更多的产品和解决方案,覆盖更丰富的场景,满足用户多样化的需求。
韩伟指出,边缘云的发展中,网络一定是先行的;无论是生态还是场景的构建,网络都会先行一步。“我们也会在网络自身上发力,让边缘云在连接与计算两大方向上变得更加扎实。只要网络出去,算力就能出去,这是我们持续突破的目标,最终实现'让连接与计算无处不在'”。
关于火山引擎边缘云:
火山引擎边缘云,以云原生技术为基础底座,融合异构算力和边缘网络,构建在大规模边缘基础设施之上的云计算服务,形成以边缘位置的计算、网络、存储、安全、智能为核心能力的新一代分布式云计算解决方案。