6 月 18 日,龙蜥社区(OpenAnolis) “走进系列” 第 3 期——走进 Intel MeetUp ,于线上开展并圆满结束。本次走进 Intel MeetUp 线上观看人次上万,收回调研问卷近 500 份,直播间上万人参与互动。汇集了众多龙蜥社区 SIG 开发者及 Intel、统信软件、浪潮云、移动云和阿里云的大咖们,和我们分享 Intel 在龙蜥社区的前沿技术、优化实践、创新动态等,包括 Intel Arch SIG 合作成果、基于 Intel 硬件全场景国产化迁移解决方案、下一代新平台新特性等技术干货。具体有哪些干货技术解读,请随小龙一起往下看!
首先,龙蜥社区理事长马涛做开场致辞:
首先,感谢 Intel 对本次龙蜥社区 MeetUp 活动的大力支持,Intel 作为龙蜥社区的理事单位,为社区做出了非常卓越的工作。概括起来,Intel 在龙蜥社区围绕 Intel 芯片等方面的工作,我认为主要有以下 3 个比较重要的特点:
第一个是全面性。龙蜥社区在整个场景方面是非常丰富的,无论是云原生、机密计算、应用加速等等。这些丰富的场景以及如何在这些场景下去围绕操作系统、Intel 的芯片来进行场景化、定制化的加速是龙蜥的核心的技术。
第二 Intel 在龙蜥社区参与的很多工作是非常深入的。针对刚才提到的场景,Intel 在龙蜥社区做了非常多的定制和优化。所以说龙蜥在如何使用 Intel 芯片去加速应用,让应用跑得更快、更稳和更好等方面是积累丰富的经验。
第三 Intel 在龙蜥社区做出的很多工作也是在全球领域非常领先的。
所以总结来看, Intel 在龙蜥社区贡献的三个关键词是:全面、深入和领先。
随后,龙蜥社区理事、Intel 技术总监杨继国发表开场致辞:
Intel 是龙蜥社区首批理事成员单位,多次参加技术委员会和运营委员会的工作,创建并维护 Intel 架构兴趣小组,将 Intel 的新平台、新特性、新优化都贡献并集成到龙蜥社区发行版中,使得广大平台用户能第一时间在龙蜥操作系统上获得对新平台的支持,进而使得龙蜥操作系统在全球范围内的操作系统发行版本中走在前列。
龙蜥社区自成立以来吸引了众多业界生态伙伴以及广大开源开发者的广泛参与。我觉得以下两方面特别重要:
第一点是不同领域的生态伙伴的加入,整个生态结构更加多样和完整。龙蜥社区生态伙伴已超过两百家,涵盖了不同的领域,生态更加丰富健壮。
第二点是广泛的开发者参与,社区更具生命力和活力。龙蜥社区已经建立了多个技术方向的特殊兴趣小组,不断吸引着广大开发者加入到社区,推动社区在各个技术领域上的创新。
致辞结束后,进入线上技术分享阶段,11 个议题、12 位技术大咖围绕 Intel Arch SIG 目前工作进展、虚拟化技术、AI 性能优化、SPDK、分析 SSL/TLS 带来的性能问题等展开技术分享。
胡潇借助本次 MeetUp 分享了Intel 的实质性技术投入。这里面,特别强调了与龙蜥社区中几个特殊兴趣组(SIG)相对应的重点领域,包括:
1.在人工智能领域,贡献Intel 全栈、全流程的 AI 软件体系,打造龙蜥操作系统中的 AI 基础架构平台。
2.在机密计算领域,通过 Intel 的芯片级安全技术,进行平台使能和业务赋能,并帮助龙蜥社区构建有亲和力的开发者生态。
3.在云原生基础架构领域,将与新成立的云原生 SIG 中的合作伙伴一道,打造更加高效的资源调度和业务加速平台。
4.在云系统及工具领域,重点发力于基于傲腾 TM 数据中心非易失性内存及固态硬盘的基础软件和工具链,尤其是分层内存的创新和落地。
5.在核心系统领域,则致力于合作打造适应云时代需求的高性能网络子系统、高性能存储子系统、以及下一代高扩展性的虚拟化技术。
另外,将进一步强化在龙蜥操作系统内核领域的技术研发和联合创新,并与社区合作伙伴一起,建构更加灵活的硬件认证体系和软件交付方式。
丁宁介绍了龙蜥社区发展现状,讲解了 Intel Arch SIG、Anolis 内核 ANCK 以及商业发行版 Alibaba Cloud Linux 内核之间的上下游关系,并分享了阿里云选择 Anolis OS 作为上游的原因。随后,介绍了 Intel Arch SIG 目前的工作进展,对 Intel 主流服务器平台支持的情况。最后,通过解决方案在阿里云应用场景的最佳实践对 Intel Arch SIG 合作成果进行的展示。
李崇(Aubrey)首先对 Intel Arch SIG 的工作目标以及近期的规划做了简介,然后总结了 Intel Arch SIG 自创建以来,往龙蜥操作系统里面贡献了 Intel 下一代可扩展至强处理器平台上的 12 大特性,700 多个补丁,这其中主要介绍了 Intel®Advanced Matrix Extensions(AMX)技术,Intel®Data Streaming Accelerator(DSA)技术和 Intel ®Scalable I/O Virtualization(SIOV)技术。最后李崇还分享了 Intel Arch SIG 的下一步工作计划,包括高可靠性,机密计算,可扩展性和无缝热升级四大方面,希望用 Intel 技术帮助龙蜥操作系统成为一个业界先进、技术领先的操作系统。
李小平首先介绍了由于CentOS停服事件对国内各相关企业用户造成的主要影响,并从安全补丁、版本更新和系统维护等几个方面进行阐述,然后针对国内大量服务器应用软件与云平台基于CentOS开发和适配的环境,从CentOS停服将对这些应用软件与云平台带来重大的安全隐患,最后从国内各企业用户的角度,建议相关企业用户需在停服前急需抓住最佳替换期予以系统替代,从而防范因重大安全漏洞带来生产系统不稳定、业务数据丢失等潜在风险。最后介绍了统信软件不仅有成熟的服务器操作系统产品可供用户使用,而且在基于Intel(x86_64)为用户提供全周期的迁移解决方案,可以有效保障基于Intel2代&3代芯片服务器开发的应用软件,能够平滑切换到Intel基于5.10内核发布的最新硬件服务器资源上。
黄文欢介绍了基于英特尔®深度学习加速(Intel®DL Boost)技术的 AI 性能优化相关内容。首先介绍了英特尔®AVX-512 及深度学习加速技术在各代英特尔®至强®处理器上的演进,包括第一代深度学习加速技术 VNNI;第二代®深度学习加速技术 BFloat16;及下一代深度学习加速技术 AMX。接下来,和大家一起分享了这些深度学习加速技术在龙蜥社区 AI SIG 中的应用及带来的性能提升,包括对深度学习框架 TensorFlow 和 PyTorch 的优化,及用于模型压缩的优化工具 INC。最后介绍了下一代至强可扩展处理器Sapphire Rapids 上 AMX 技术,并分享了其理论性能提升及相关应用场景。
李肖瑶介绍了未来 Intel 在虚拟化技术方面的新功能。新功能可以分为两类,一类为需要做虚拟化支持的新功能,即由 hypervisor 将新功能正确地虚拟化给虚拟机,使得虚拟化系统可以使用,如 CET、AMX、Arch LBR、PKS、UI。另一类为针对虚拟化的新功能,由 hypervisor 支持使用来增强 hypervisor 的能力或安全性,如 SVA、SIOV、TDX、 Bus Lock Detection、 Notify VM exit、IPI virtualization。
当前安全越来越重视的前提下,越来越多的网站由 HTTP 转为 HTTPS,更多的服务之间会由 SSL/TLS 来建立安全通道进行通讯,在带来安全的同时,性能问题也随之而来。张力在本次演讲中,将从这类场景中的问题介绍开始,分析 SSL/TLS 带来的性能问题,介绍英特尔第三代志强处理器中的密码学加速特性是如何帮助解决这些问题的,并概览该特性在龙蜥系统及部分业务场景中的加速实践,供大家参考使用。
胡风华首先介绍了傲腾技术产生的背景与傲腾技术的特点,以及基于傲腾技术的产品及路线图,然后通过一些具体项目和案例,展示了在云环境中如何应用傲腾持久内存,这些案例包括用 Linux Memory Tiering 实现 DRAM 与 PMem 的自动化分层、BTT driver 性能优化、使用 PMem 构建虚拟机并为容器提供高速存储、Redis 兼容的数据库 TieredMemDB、RocksDB 的读写优化、面向 KV 存储的引擎 KVDK 以及利用 PMem 来加速消息队列 Pulsar 等。
吴保锡分享了浪潮在云数据中心操作系统高效能、安全可靠、开放可扩展方面取得的成果、并重点介绍了云数据中心场景下可信计算技术应用研究所做的工作。介绍了浪潮云操作系统安全可信方案架构、重点阐释了在服务器可信(Intel 硬件可信技术应用及固件主动可信验证技术等)、虚拟化平台可信(信任链的构建与传递、虚拟可信根池构建等)、工作负载可信调度(可信资源池构建)等方面所做的探索与成果。
OceanBase(简称OB)作为一款分布式 HTAP 数据库,主要解决海量数据存储和混合负载数据处理场景。与 Oracle 和 SQLServer 等实时 HTAP 数据库系统类似,OB 的用户场景除了OLTP 类的简单查询,还有报表分析,业务决策等复杂 OLAP 查询。OLAP 查询具备数据处理量大、计算查询复杂、高 CPU 消耗的特点。为解决混合负载下数据查询效率难题,OB 采用了业界通用的向量化技术,设计了向量化查询引擎,实现了一套 SQL 引擎同时支持 TP 和 AP 两种负载,OLAP数据处理的性能倍增,TPCH 场景提升约 2.5 倍。曲斌在本次分享中介绍 OB 向量化引擎的技术特性和设计细节。
主要涵盖以下几个方面:
1.为什么引入向量化。
2.引擎向量化引擎技术特点。
3.OB 向量引擎的技术实现细节。
童坤坤对 SPDK 的概念原理做了介绍,包括 SPDK 实现高性能的核心要点、SPDK 线程模型、通道模型等。结合 SPDK 在移动云虚拟云主机应用场景,阐述了虚拟化技术、I/O 虚拟化、虚拟化分类、virtio 原理、vring IO 请求流程、基于 qemu-vhost 的半虚拟化存储。并介绍了移动云在 SPDK 实践中遇到的问题以及应对与优化,包括 SPDK 可运维监控、SPDK 存储热迁移、SPDK 热更新、SPDK 快速恢复。最后介绍 SPDK 演进历史并对 SPDK 未来做出展望。
崔龙一开始介绍了多核心服务器上,由于资源共享带来的云上服务 QoS 波动,以及 Intel RDT特性对于内存带宽和 L3 cach e用量的监测和分配技术对于保证 QoS 的保障作用 ,intel RDT 特性在上游 Kernel 的支持情况。接着详细介绍了如何通过 pqos 和 Kernel resctrl 接口使用 Intel RDT。同时还以 speccpu 为例,说明了不同负载,对资源的敏感程度差异较大。最后介绍了一系列 Intel RDT 在实际业务混部中部署的实例。
当然,本次走进 Intel MeetUp 不仅有干货满满的技术分享,社区也为线上观看人员准备了抽奖环节,抽奖互动环节共有 4 轮,数百份大奖,有龙蜥定制筋膜枪、Intel 数据线、龙蜥社区吉祥物小龙抱枕等等,中奖率高达 60%,线上直播氛围感拉满。
(图/本次抽奖奖品合集)
最后,感谢龙蜥社区及 Intel 工作人员:金美琴、Jane、金运通、孙林林、Jessica、Albert Hu、Pauline Chen、蔡佳丽、崔开、夏敏琪、张梦瑶、袁艳桃等人的组织与配合,也特别感谢 InfoQ 媒体工作人员的支持,有各位的辛苦付出,使得本次走进 Intel MeetUp 活动圆满结束。
课件、视频获取:我们将在本周内上线视频回放至龙蜥官网(首页-动态-视频)。更多相关的活动内容将在这里或者龙蜥社区交流群剧透推送,记得持续关注龙蜥社区公众号,谨防走丢哦!
—— 完 ——