7 月 22 日,龙蜥二度走进 Intel 举办「龙蜥社区“走进系列”MeetUp」,活动于上海圆满结束。来自开放原子开源基金会、浪潮信息、Intel、阿里云等企业的 21 位专家和教授,分享了 11 场精彩主题演讲,为大家带来“融合+创新”的全面展示。现场来自统信软件、麒麟软件、浪潮信息、中兴、联通软件研究院、阿里云等超 50 位开发者参与了“关于 Intel 至强可扩展处理器在人工智能、安全保护以及性能加速方面的应用实践等”技术讨论,大家围绕着依托 Anolis OS 衍生出来的 Intel 优势技术方案,手把手体验了龙蜥及英特尔的硬核技术,线上超 5 万人观看并参与了互动。
(图/活动现场合影)
会议伊始,主持人龙蜥社区运营委员会委员、英特尔软件和先进技术事业部技术经理吕荟晶介绍了本次 MeetUp 的全程安排,她表示接下来将侧重全面展示新一代至强可扩展处理器和龙蜥社区结合的技术优势。
(图/英特尔软件和先进技术事业部副总裁谢晓清)
活动开场,英特尔软件和先进技术事业部副总裁谢晓清发表了开场致辞:看到各领域专家、教授和开发者汇聚上海,参加本次龙蜥社区走进 Intel MeetUp,与我们一起探讨前沿技术感到非常荣幸。现阶段,国内的开源蓬勃发展,有很多的工作要做,而龙蜥社区成立到现在发展十分迅速,已经成为国内开源的中坚力量,我也非常高兴的看到开发者们的创新力量在龙蜥社区里得到了充分展示。在我从业多年的经验来看,做好开源社区有两点特别重要,第一是包容性,第二是互相帮忙、互相成长,我在龙蜥社区中充分的感受到了这两点。希望大家在这个美好的周末有所收获,也欢迎大家多多参与龙蜥的共建,使我们的社区更加多样化,更加有活力!
(图/龙蜥社区技术委员会主席、阿里云操作系统技术总监杨勇)
龙蜥社区技术委员会主席、阿里云操作系统技术总监杨勇说到:Intel 作为龙蜥社区理事单位,也一直是社区的核心贡献者之一,特别是龙蜥在 Intel 的新一代处理器上支持,不仅在技术,也在产品化、商业化上都走在前沿位置,我个人认为已经是业内标杆的存在。今天大家就有机会听到 Intel 在龙蜥的前沿成果分享,也是我觉得非常自豪的一件事。今年,龙蜥有两个技术工作重点:第一个是进一步增强社区在技术治理的透明、公开化,更好的帮助大家了解龙蜥社区的规划及重要的技术决策和讨论;第二个是龙蜥社区技术委员会会协同 24 家理事单位的技术委员,就社区发生的重大事项、合作伙伴的重要反馈做一些技术方向的决策。最后希望社区的新技术会得到更多的反馈,通过系列的 MeetUp 活动让社区的发展更加蓬勃。
(图/开放原子开源基金会资深行业研究员郭晧)
开放原子开源基金会资深行业研究员郭晧发表致辞:很荣幸能代表开放原子开源基金会来到本次 MeetUp 做分享,今天我和大家分享三个感受:第一个,过去主要看到的是国内的企业和开源社区参与举办活动,今天看到的是由国际企业 Intel 联合龙蜥组织,国内外头部企业共同参与的国际化、多样化、包容性的 MeetUp。第二个,站在行业研究方向和大家分享下开放原子开源基金会对整个的开源生态所做的工作。我们发现今天的开源社区已不仅仅是光靠兴趣爱好去驱动,而是形成了先进的协作模式,龙蜥就是其中的代表,拥有更广泛的生态参与。第三个,国内的开源时代已经到来,我们不仅要学习国外先进开源社区的优点,同时把国内成熟的开源社区,像龙蜥社区一样输出到全球,与全球的开源生态形成协作的关系,产生更大的化学反应。
以下是技术干货分享:
(图/龙蜥社区 CNCC SIG Maintainer 张佳)
(图/英特尔高级软件工程师朱运阁)
龙蜥社区 CNCC SIG Maintainer 张佳、英特尔高级软件工程师朱运阁两位分享了《基于 Intel® TDX 部署云上人工智能方案》主题演讲。
本方案结合英特尔® Trust Domain Extension (TDX), 基于 Confidential Data Hub、TEE Network Gateway 和公共 Attestation 服务三大核心组件来部署LLM(Retrieval Augmented Generation , RAG),为终端用户、推理服务提供者、模型数据提供者和审计者等多个参与方提供端到端的可信部署能力,存储、传输和计算全生命周期中都保持密态。
(图/英特尔高级软件工程师朱运阁)
英特尔高级软件工程师朱运阁做《基于 Anolis OS 部署 Intel® SGX-based 端到端安全解决方案》主题演讲。
本方案基于 Anolis OS,结合 Intel SGX 提供的可信机密计算环境,部署端到端的在线推理服务,可以保证数据传输的安全性、数据盘的安全性、数据使用的安全性、以及 AI 在线推理应用程序的完整性。
传统的防火墙、入侵检测系统都是基于物理边界的,默认墙内安全,墙外不安全,这种安全模型存在天然的缺陷,已经不再适用于当今复杂的网络场景。英特尔高级软件工程师黄菊分享了《Intel® 零信任网络访问参考架构》技术演讲。而“零信任”脱离了这种传统的安全模型,不再区别对待墙内墙外,所有接入的设备、人或系统都要经过认证/授权,先鉴权,后连接再访问。采用零信任方案可以统一身份管理,构筑身份边界,实现动态和细粒度授权,是当今网络安全的重要基石。
在本次活动中,Intel 展示了零信任网络访问参考架构(简称ZTNA RA),该架构基于热门的开源组件所构建,并结合了 自身硬件特性(如 Intel SGX/TDX,QAT, AVX512 等)对零信任进行优化和增强保护,希望给业界提供更安全、更高性能的可参考架构。
(图/英特尔高级软件工程师高逢骞)
(图/阿里云开发工程师胡坤)
阿里云开发工程师胡坤、英特尔高级软件工程师高逢骞两位向大家介绍了《Intel®第四代至强® 可扩展平台 DSA 和 IAA 加速器在 Linux 内核中的应用》。
英特尔® Data Streaming Accelerator(英特尔® DSA)和英特尔® In-Memory Analytics Accelerator(英特尔® IAA)是集成在英特尔第四代至强可扩展平台中的两个重要加速器。DSA 旨在优化高性能存储、网络、持久内存和各种数据处理应用常见的流数据移动和转换操作。IAA 可以提供高性能的压缩和解压能力,结合其数据分析功能,有助于更快地运行数据库和分析工作负载。本次活动着重介绍 DSA 和 IAA 在 Linux 内核中的典型应用场景并分析它们带来的性能收益。
(图/英特尔云软件工程师严尚朋)
英特尔云软件工程师严尚朋分享了《Intel® 第四代至强® 可扩展平台 IAA 存内分析加速器在业务中的应用》。他介绍了英特尔存内分析加速器(IAA)对分析业务能够带来的提升,以及 IAA 从用户使用到底层所涉及到的软件栈,并以一个例子(RocksDB)演示了 IAA 在数据库解压方面带来的强大提升。
(图/英特尔 AI 应用软件工程师刘凯旋)
英特尔 AI 应用软件工程师刘凯旋做了《Intel® 第四代至强® 可扩展平台上运行 stable diffusion 5 分内微调,5 秒内推理》主题演讲。
刘凯旋介绍了在英特尔第四代至强可扩展平台上利用 AMX 等新特性优化 stable diffusion 的尝试。经过这些优化,将文生图的耗时从 40 秒以上降到了 5 秒以内;同时,为了满足用户定制化模型的需求,将模型微调的时间降到了 5 分钟以内。利用 4 个 SPR 节点,让用户在一杯咖啡的时间内定制自己需要的模型,并取得很好的输出结果。
(图/英特尔 AI 软件开发工程师王杜毅)
英特尔 AI 软件开发工程师王杜毅分享了《基于Intel® AMX 技术加速 DeepRec 训练性能》。
AMX 是第四代英特尔® 至强® 可扩展处理器内置的一种 AI 加速器,能有效提高 CPU 的 AI 训练和推理性能。DeepRec 是阿里巴巴开源的大规模稀疏模型训练推理引擎,在淘宝、天猫、阿里妈妈和高德等业务中得到广泛应用。龙蜥操作系统是龙蜥社区发行的开源 Linux 发行版,它支持多计算架构,也面向云端场景优化。DeepRec 以及龙蜥操作系统对 AMX 技术进行了深度适配, 分别从框架和系统层面为 AMX 提供了完善的软件支持,方便开发者和运维人员享受 AMX 技术带来的 AI 训练加速。DeepRec 提供 BF16 的混精优化,使得用户能够在享受 AMX 性能加速的同时,还尽可能的减少了对精度的影响。
(图/英特尔高级软件工程师邱堃)
传统的流量分析方法正在被人工智能(AI)的算法所取代。英特尔高级软件工程师邱堃分享了《AI 助力网络安全——使用 TADK 构建智能网络应用防火墙》演讲。本次演讲介绍了基于 AI 的流量分析开发工具包(TADK)的设计,DEMO 了基于Anolis OS、并使用TADK网络应用防火墙(WAF)插件。TADK 可以将每个 HTTP 请求的检测时间从数毫秒缩短至数微秒,并且比传统 DPI 解决方案具有更高的准确性。
(图/浪潮信息研发工程师亢宇飞)
(图/英特尔解决方案架构师吴国安)
浪潮信息研发工程师亢宇飞、英特尔解决方案架构师吴国安分享了《浪潮信息 KeyarchOS 基于 Intel® 第四代至强® 可扩展平台的优化实践》。
浪潮信息云峦服务器操作系统 KeyarchOS(简称 KOS),通过软硬协同的一体化设计,在 Intel 第四代至强可扩展平台上面向 QAT、RDT 等新特性完成优化实践,增强了以 KOS 为底座的云原生、人工智能、虚拟化等产品的开发效率、运行效率和扩展性,同龙蜥社区共建操作系统开源生态。
(图/龙蜥社区 Cloud Native SIG Maintainer 胡伟)
(图/龙蜥社区 Intel Arch SIG Maintainer 尚旭春)
龙蜥社区 Intel Arch SIG Maintainer 尚旭春、龙蜥社区 Cloud Native SIG Maintainer 胡伟做了《基于Intel® 第四代至强® 可扩展平台 QAT 功能加速服务网格和云原生网关中的 TLS 性能》主题演讲。
当前 TLS 已经成为了互联网安全的主要传输协议,TLS 带来更高的安全性的同时,也带来了更多的性能开销,特别是在建连握手阶段,TLS 的 CPU 开销,将大大延迟系统服务响应时间。尚旭春、胡伟介绍基于 Intel 第四代至强处理器平台集成的最新 QuickAssist Technology(QAT),简称 Intel QAT 技术的 TLS 加速技术方案,在云原生领域的服务网格和服务网关场景中的技术栈中如何实现减少 CPU 的负载,提高系统吞吐量和响应速度。
(图/英特尔技术专家倪红军)
英特尔技术专家倪红军分享了《高密度可拓展负载均衡器HDSLB性能加速实践》技术演讲。
高密度可拓展负载均衡器(HDSLB)是定位于单节点 200G-400G 吞吐的软四层负载均衡实现。它充分利用 Intel CPU 和网卡的硬件特性,在软件层面进行定制化优化,实现了业界领先的负载均衡器关键性能指标。包括亿级并发链接,单核 800 万 PPS 转发,80 万 TCP 链接新建,并实现线性拓展。
最后,感谢本次活动各位嘉宾的精彩演讲,也感谢龙蜥社区伙伴及 Intel 工作人员:金美琴、孙林林、蔡佳丽、吕荟晶、李崇、徐国振、张百林、 袁艳桃、夏敏琪、丁宁、尚旭春、刘敏、胡捷、李崇、古今、胡潇、王晨光、严力科、胡志明、施爱春(以上排名不分先后)等人的组织与配合,也特别感谢 Linux 中国、InfoQ、思否、51CTO、阅码场等媒体的支持,有各位的辛苦付出,使得本次走进 Intel MeetUp 活动圆满结束。
课件、视频获取:
视频回放:https://openanolis.cn/video/#853274053972967448
技术 PPT :关注龙蜥公众号【OpenAnolis 龙蜥】,回复“龙蜥课件”获取。
更多相关的活动内容将在这里或者龙蜥社区交流群剧透推送,记得持续关注龙蜥社区公众号,谨防走丢哦!
—— 完 ——