DevOps 成为越来越多的互联网职场人希望了解和学习的话题,他们有兴趣知道 2022 年DevOps要学习什么。DevOps 技能需求量很大,并且需要不断学习需要让自己与市场需求保持同步。
这篇文章是为了分享关于DevOps的一些指导。
了解 HTTP/2、QUIC 或 HTTP3、第 4 层和第 7 层协议、mTLS、代理、DNS、BGP 等概念,负载平衡的工作原理、IP 表、Internet 的工作原理、IP 地址和方案,最后是网络设计。我发现Julia Evans 的博客非常有用,当我需要以简单的方式理解事物时,我的首选之地。她在她的博客文章和杂志中涵盖了各种各样的主题。
由于大多数系统(VM、容器等)都运行 Linux,因此从上到下了解这一点很重要。学习调度、systemd 接口、init 系统、cgroups 和命名空间、性能调优,并掌握命令行实用程序 — awk、sed、jq、yq、curl、ssh、openssl 等,从Brendan 的博客学习性能故障排除。
如果你仍然喜欢詹金斯,那很好。但是,世界已经转向云原生管道。从概念上讲,这个空间没有太大变化,但你可以看看 Github Actions、Tekton 等。如何更好地发布?了解各种部署策略,例如蓝绿和金丝雀。
除了流行的 Docker 运行时,尝试 containerd、podman 等并了解如何容器化应用程序、如何实现容器安全性、如何在 Kubernetes 中运行和编排 VM,请参阅 KubeVirt 项目。
Kubernetes 现在是运行容器的事实上的标准。网上有很多学习Kubernetes的内容。专注于配置最佳实践、应用程序设计、安全性和调度。设置集群现在变得微不足道,但第二天的操作性问题,例如设置、监控、日志记录、CI/CD、如何扩展集群、成本优化和安全性是人们可能期望你提出的一些问题。
大多数工程师都知道 Prometheus Grafana 堆栈或类似堆栈。趋势表明,从性能和成本的角度来看,许多组织正在整合他们的 Kubernetes 集群和可观察性,这很有帮助。了解 Prometheus 的高级配置和架构,以及如何扩展它们。研究 Thanos、Cortex、VictoriaMetrics、Datadog 和 Loki 等技术。连续分析工具,例如 Parca、潜望镜、超跟踪和具有开放遥测的分布式跟踪。诸如 Istio 之类的服务网格是云原生配方中的一种流行成分。
平台团队的功能越来越像一个集中的产品团队,专注于他们内部的平台客户,如开发人员和测试人员。目标是改善工作方式并为团队带来一些秩序。尝试即兴解决开发人员和 QA 团队面临的问题。你是其他团队的推动者,而不是在一个中心团队中承担所有工作,而是指导开发团队承担典型的 DevOps 职责。这样你就可以扩大规模并且不会过度烧伤自己。
在许多小型组织中,安全是二等公民。产品功能被赋予了更多的优先权。但是,由于越来越复杂的攻击和各种严格的合规要求,公司正在适应左移安全策略。端到端加密、强大的 RBAC、IAM 策略、治理和审计、NIST、CIS、ISO27001 等基准的实施很常见。容器安全、策略即代码、云治理和供应链安全是热门话题。
DevOps 或 SRE 角色现在正在考虑开发人员的跨领域关注点,并创建有助于在执行标准的同时提高生产力的工具。制作高质量的平台组件需要良好的软件工程实践和技能。
我不能对此给予足够的压力。优秀的组织正在寻找具有良好编程经验的平台工程师。这在站点可靠性工程中也很重要,您需要精通编程,能够阅读、理解和调试他人编写的代码,并在必要时对其进行修复。
Python 和 Golang 是最流行的。我的建议是 Golang,因为它具有强大的并发性、严格的类型检查、在各种组织中的采用、工具链以及许多主要项目都是使用 Golang 构建的特性,因此通过 Python 学习是有意义的。
您可以尝试一些简单的事情:
Terraform 是项目中的标准。一旦你理解了这个概念,就很容易适应任何其他工具,因为它们中的大多数都是基于 DSL 的。
大多数云以相同的方式工作。因此,如果您熟悉一种云,您可以轻松地与其他云提供商合作。专注于如何以高度可用、弹性、安全且经济高效的方式使用云原生组件设计应用程序。
您可能想知道为什么我在讨论 DevOps 时要谈论技术写作。很多人对此并没有给予足够的重视,但这对于你如何与其他团队进行沟通和合作非常重要。工作的未来是远程的,电子邮件、闲散/团队、聊天是与他人交谈和传达想法的主要渠道。
您可能会定期创建诸如运行手册、事后分析、RFC、架构决策记录和软件设计文档等文档。一个清晰、易于理解的文档可以创造奇迹。它可以帮助您节省您和读者的时间并提高整体生产力。建议你阅读这篇文章。
DevOps 和 SRE 之间的界限越来越窄。在某些组织中,同一个人可能同时担任这两个角色。了解 SLI、SLO 和错误预算以及 SRE 实践背后的概念。每个组织的做法都不一样,所以我不建议将其他人的文化复制粘贴到您的团队中。参考Google SRE 文化。
服务网格——Istio、Cilium Sidecarless 网格、Tetrate 和 Solo 的 Gloo 网格产品。
如何提高开发人员的生产力?它是文化、自动化和工具的混合体。
SRE 平台——蜂窝,Last9。
DevPortals——再次与提高生产力和弥合知识差距的动机相关联。
可观测性——诸如开放遥测、超跟踪、灭霸、VictoriaMetrics、Vector等技术。
安全性——供应链安全、代码签名、加强云安全。
Golang——提高当前技能。
无服务器计算和事件驱动架构
Web3 — 了解与 DevOps 和基础设施相关的环境
----------------------------------------------------------------
“观测云”是一款面向开发、运维、测试及业务团队,适用于DevOps的实时数据监测平台,能够统一满足云、云原生、应用及业务上的监测需求,快速实现基础设施、中间件、应用层和业务层的可观测。基础设施监测、日志与指标管理、应用性能监测、用户 访问监测、可用性监测、异常检测、系统级安全巡检、场景和仪表板等是“观测云”的可观测解决方案,通过统一的数据采集、全面的数据监控、无缝的关联分析、自定义的场景搭建、高度的可编程性,敏捷的成员协作,为用户提供了最快、最轻松、最全面、最自由的系统可观测平台。
如果您想要了解学习关于DevOps和可观测性的更多内容,,快来观测云官网吧~
Reference:https://faun.pub/devops-roadmap-2022-340934d360f9