SIG Cloud Provider Alibaba 网研会第 2 期顺利召开 | 云原生生态周报_第1张图片

作者 | 高相林、陈俊、孙健波

业界要闻

  1. Gartner 报告:阿里云与 AWS 并列入选容器产品最完善

近日,国际知名调研机构 Gartner 发布 2020 年容器公有云竞争格局报告,阿里云再度成为国内唯一入选厂商。Gartner 报告显示,阿里云容器服务在中国市场表现强劲,产品形态丰富,在如 Serverless 容器、服务网格、安全沙箱容器、混合云和边缘等领域,具备良好的技术发展策略。

  1. Dragonfly 晋升成为 CNCF 孵化项目

4 月 9 日,由云原生计算基金会(CNCF)技术监督委员会投票,Dragonfly 正式晋升为 CNCF 孵化级别的托管项目。

  1. SIG Cloud Provider Alibaba 网研会第 2 期

4 月 16 日(周四) 19:00 将举办 SIG Cloud Provider Alibaba 网研会第 2 期,本次网研会为自办直播,直播主要有两种形式:视频直播+文字直播。视频直播将在云栖社区、开发者社区、开发者钉群进行,文字直播将联合 DockOne 社区在 10+ 微信群内进行文字直播。

  1. TiDB 4.0 发布

4 月 8 号是 PingCAP 成立五周年的日子,其开发团队也在当天发布了具有里程碑意义的 TiDB 4.0 首个 RC 版本。

上游重要进展

  1. Fix client watch reestablishment handling of client-side timeouts

解决了当客户端的 watch 发生超时,会重新 list 全量资源,而非重建连接的 bug。

  1. Make PodInfo (a v1.Pod wrapper) a first class type in scheduler framework

通过一系列 PR 将 PodInfo 升级为 scheduler 框架的一等对象,这样可以提高性能和可观测性。

  1. preserve integers decoding raw JSON values

解决了在拥有 scale subresource 的 CRD 中,关于 replicas 字段默认值的一个 bug。

  1. Add etcd WithRequireLeader option to API watches

在 api watches 中添加 etcd WithRequireLeader 选项。如果没有该选项的话,当 etcd 集群选举失败的话,在 apiserver 中面向 etcd 的 watches 会永远 hang 住。

  1. Add GRPC probe

改 KEP 提议使用 GRPC 作为探活协议,因为 grpc 提供了官方的健康检查方法。

开源项目推荐

  1. corefile-migration

不同版本的 CoreDNS 所支持的 Corefile 可能会有所不同,该项目可以帮助开发者迁移 corefile 的版本。既可以采用二进制的方式使用,也可以作为三方库引入。

  1. script

该项目为 Go 语言三方库,主要提供类似于 shell 脚本中命令类似的函数。

  1. KPT

简单来说是基于 Kustomize 做的一款类似 helm template 的工具,包含了参数设置、打包、管道式串行渲染、自定义函数(镜像)渲染等众多功能。 与 OAM 天然互补,两者均是为了 Infrastructure as Data 理念的直接产物,kpt 是 Data 的操纵工具,而 OAM 是 Data 的格式。kpt 可以作为应用产出 终态 OAM yaml 前的参数渲染、打包、分发命令行工具,更深的可以结合 GitOps 模式使用。

  1. krustlet

krustlet 为使用 rust 语言编写的 kubelet 项目。

本周阅读推荐

  1. 《专访 OAM 和 DAPR 创始人白海石:一位 33 年资深程序员的朴素想法》

OAM 与 DAPR 的宗旨是要为开发者,特别是企业级的开发者,在设计和实施分布式系统时能够更简单更高效。他们位于分布式系统中的两个不同层面:OAM 在部署态,用来描述应用程序整体的拓扑结构以及部署交付过程;而 DAPR 则工作在开发态,使得开发者可以通过简单标准化的方式发现和调用外部的资源。本文中白海石对两者进行了更丰富的阐述,同时也对未来的分布式应用形态进行了展望。

  1. 《3 个减小 Docker 镜像的简单技巧》

文章借助详尽的用例介绍了 3 个减少 Docker 镜像体积的技巧。

  1. 《阿里云容器服务团队实践——Alluxio 优化数倍提升云上 K8s 深度学习训练性能》

Alluxio 是一个以内存为中心的分布式存储系统。在本文中,作者总结了 Alluxio 在高性能分布式深度学习模型训练场景中落地的挑战点,以及优化云上模型训练性能的实践。进一步地,作者介绍了如何从多个层面提升 AlluxioFUSE 在高并发读场景下性能优化的经验。最后,作者实现的基于 Alluxio 优化的分布式模型训练方案,并在 4 机 8 卡的 ResNet50 场景下进行了性能验证,取得了很好的效果。

“阿里巴巴云原生关注微服务、Serverless、容器、Service Mesh 等技术领域、聚焦云原生流行技术趋势、云原生大规模的落地实践,做最懂云原生开发者的公众号。”