摘要:2022 年 7 月 25 日,云上自动化运维 CloudOps 系列沙龙_第二弹正式开启!阿里云弹性计算技术专家杨红军带来了首个分享《应用管理:云上资源 DevOps 最佳实践》,以下是他的演讲内容整理,本篇内容主要分为三个部分:
- 云上资源管理和运维的工具
- 应用分组维度资源的管理
- 应用分组维度资源的运维和监控
01 云上资源管理和运维的工具
目前,围绕 ECS 的管控和运维出现了五大问题。
第一,随着业务的发展,企业云上资源数量和种类不断增加,对管理带来了挑战。
第二,资源的使用方、财务方对根据管理视角分账,以及成本优化的诉求明显。
第三,随着越来越多的业务方使用、如何安全的使用云账号和资源,对资源管理者带来了挑战。
第四,随着资源规模的增加,如何高效的管理运维提升效率,为运维人员带来挑战。
第五,云资源管理、运维的入口过多,无法找到最佳实践。
为了解决云上资源管控和运维的痛点,必须实现标准化、自动化、数据化、流程化。要实现分组分权管理,打通账号权限,加快实现审批流程化。
在自动化方面,要进一步提升效率,减少人肉操作,保证定时告警运维,时刻注意资源的使用情况。
02 应用分组维度资源的管理
应用分组主要涉及三个概念。
第一,应用分组的配置。在每个应用下,创建一些不同的分组们可以根据不同的环境或地域,创建不同的应用分组。从而实现多部署环境、多架构的分组。
第二,资源管理。支持在分组资源里,导入需要的资源,导入应用分组场景化、支持弹性扩缩容。
第三,资源运维。当在资源分组时,出现漏洞或安全风险,通过安全和风险管理,触发监控和事件机制。除此之外,还支持 CICD 代码的编译部署能力。
为了解决云资源数量多,种类多,管理难度大,管控入口不好找等问题。阿里云支持三十多种云资源的导入,对云资源进行统一管理。
为了解决众多产品割裂的问题,阿里云通过分组管理,把最佳实践放在一起,方便大家快速使用这些能力。
为了解决资源分权、分账问题,阿里云通过标签能力,把所有的资源关联到一起。用户可以在账号的费用中心,查看你当前资源的费用分布情况,每月账单等。
以钉钉场景为例,把一部分 ECS 挂载到负载均衡上。通过应用分组,选择钉钉应用,直接创建应用。在创建过程中,所有关联关系以资源站的形式,自动创建。然后,这些资源会自动导入到应用分组,方便用户后续的管控。
接下来,讲一讲弹性扩缩容。应用管理把弹性伸缩进行集成。每个应用分组可以直接关联一个弹性伸缩组。用户可以根据业务,制定弹性伸缩的规则。系统会按照伸缩规则,进行扩缩容。
除此之外,弹性伸缩支持自动加入 RDS,自动关联 SLB/ALB,伸缩配置、生命周期挂钩。
03 应用分组维度资源的运维和监控
自动化运维支持分组级别的资源运维,能够关联资源事件和告警,用户可以任意编排运维任务,灵活可扩展。
在实例管理方面,常用的运维任务有发送远程命令、上传文件、磁盘清理、启动实例、停止实例等。在镜像管理方面,主要支持更新镜像、删除镜像、创建镜像。
在 OOS 运维编排的自定义模板中,自动化运维支持定时开关机、带宽临时升级、定时执行任意模板。自动化运维支持 120 多种云产品阈值告警,40 多种云产品系统事件告警。
接下来,讲一讲监控和事件。如果把某些资源,导入到应用分组,可以查看所有的监控,比如某分组下 CPU 的利用率,负载均衡指标等等。印象特深,用户还可以配备告警相关的能力,云监控能力等。
除此之外,事件运维集成了五个系统事件。包括计划内运维事件、非预期运维事件、实例费用事件、实例安全事件,以及实例因底层升级需迁移事件。
在安全风险管理中,主要包括漏洞扫描,基线和云平台的配置检测。其中,漏洞扫描会定期自动扫描 Linux 软件漏洞,windows 软件漏洞,应用漏洞,以及应急漏洞。
如上图所示,用户在代码构建时,需要绑定云效企业,新建流水线,授权发布 ECS,然后关联流水线,进行代码扫描、构建、部署、测试。最后,发布到 Kubornetes 集群,阿里云容器服务,阿里云 ECS 或自有主机。
本节课帮助大家,从一个新的角度思考与理解运维及管控。让大家从资源维度,转化到应用分组视角,重新认识运维及管控。
应用分组可以导入所有资源,并对这些资源进行管控和运维。除此之外,应用分组支持弹性伸缩,自动化运维,监控告警,资源管控等能力。
Q&A 环节,用户问答
Q1 有哪些因素会促使一个组织或企业考虑引入 DevOps?
答:如果企业资源管控的数量较大,业务较复杂,运维成本较高。可以使用 DevOps 的自动化工具,实现降本增效。
Q2 在 DevOps 中会遇到哪些安全相关的问题?
答:如果跟用户权限相关,可以让不同的权限的用户去执行自动化相关的工作。可以通过标签,赋予不同的权限。
Q3 自动化功能的 API 是否开放?
答:是的。包括资源导入,云监控,弹性扩缩容等能力,都是 Open API 的能力。可以直接通过阿里云或者 SDK 调用。
Q4 在业务增长的过程中,可能遇到哪些难以解决的问题?
答:随着业务成长,用户分权分账,可以通过分组或不同的标签,关联不同的角色。随着资源的增长,可以在应用分组或者用户编排控制台,设置一些自动化的工作。通过可视化,监控告警,弹性扩缩容等能力,提高资源的利用率,节约成本。
近期活动预告
高效能 才经济 | 云上自动化运维 CloudOps 系列沙龙_第三弹!即将开启!
资源效能与研发效能是企业运营过程中必须关注的话题,高效能甚至能成为一家企业的核心竞争力。充分利用云的弹性和自服务工具,企业将能大幅度地优化成本、提升资源与研发效能。因此,阿里云弹性计算云上自动化运维 CloudOps 系列沙龙,将以“效能提升与成本优化”作为第三弹的主题,分享相关思考与实践。
本次系列沙龙第三弹由三位阿里云弹性计算技术专家们带来,分别是:
8 月 16 日 19:00 阿里云弹性计算技术专家 高庆瑞 | 《如何快速搭建低成本高弹性的云上应用》
8 月 17 日 19:00 阿里云弹性计算技术专家 林小平 | 《如何实现资源高效运维与云上成本分析》
8 月 18 日 19:00 阿里云弹性计算技术专家 樊毅伟 | 《云上成本优化实践》
现在扫描文章底部海报中的二维码或点击链接即可进入“CloudOps 系列沙龙”交流群,获取最新鲜的沙龙资讯,还可以第一时间获得讲师的“干货资料”哦!
沙龙小 Tips:观看直播期间提问,被讲师抽中并回答问题的同学和填写问卷并被抽中的同学,均可获得精美礼品哦!免费邮寄到你手中!
最新鲜的讲师资料,超多的精美礼品等你获取!立刻扫码/点击链接进群报名吧!
点击这里,了解沙龙活动更多详情。