ODCC2018阿里分享记录

ODCC2018,重点听了阿里的分享,感觉在SONiC研发与推动部署中,做了大量值得借鉴的工作。

首先是阿里讲了他们选择SONiC的原因:

1. 他们做公有云,大量部署白盒,能有效降低成本、加速feature开发、统一控制平台、使用可编程等新技术。

2. 选择SONiC做白盒,优势在于:

1). 面向超大规模
2). 原生支持芯片标准SAI
3). 基于DB的模块间解耦与基于容器的模块部署
4). 活跃的社区支持

劣势在于:

1). CLI、增量配置不支持,只支持DB配置
2). 缺少部分feature,例如tacas、vlan trunk
3). 热重启支持不够

其次分享了阿里部署的计划,基本与大家类似:

1. 3-tier CLOS架构,单上联开始,渐进双上联;ToR开始,渐进leaf、spine。

2. 25G、100G。

3. 支持50K+ server;支持RDMA。

然后分享了在配置方面的演进:

1. 从minigraph开始,进而使用config_db。

2. 逐渐开发CLI支持运维增量配置;开发gMNI支持监控方案。

最后重点分享了测试方面的心得:

1. 划定测试平台场景:日常迭代、版本更新、上线发布、平台引入、问题复线。

2. 目标与挑战:功能全覆盖、自动化的测试;挑战是性能测试,借助厂家力量。

3. 测试、灰度、线上运维、开发的流程场景:介绍了很多点,对我比较重要的是BGP的测试场景。

你可能感兴趣的:(云计算)