运维工程师需要掌握基础的服务,如SSH服务、NFS网络文件系统、DHCP/DNS、数据同步服务等;常用数据库;常用服务,如JavaWeb服务Tomcat、Jboss、Weblogic等;系统监控与报警;容器技术等职业技能。
首先我们从运维工程师的工作职能入手,岗位工作内容:
1、平台架构组建
运维工程师的基本工作之一,主要负责参与并审核架构设计的合理性和可运维性,以确保系统上线后,安全、高效、稳定运行。保障并不断提升服务的可用性和数据安全性,提升用户体验。
2、日常运营保障
初级运维负责运用运维技术,运维平台,确保入网设备的全面纳管和全生命周期管理,确保设备、业务及安全等状态可监可控。负责制定应急预案并组织演练,负责保障业务7*24小时稳定运行,在此期间对出现的各种问题快速定位并解决。
3、系统优化
高级运维工程师则需要考虑系统的优化问题。高水平的云计算运维工程师对系统长期稳定运行至关重要。linux服务器本身架构的局限,系统运行故障不可避免,但通过合理的设计,有效的运维大幅降低故障发生的频率,提高业务恢复效率。
二、合格的运维人员需要掌握的技能:
1、Linux系统基础,Linux基础知识和命令使用,及用户和权限等核心知识点;
2、Linux系统管理,Linux从进程、资源、任务、文件、软件包、磁盘等管理方法;
3、Linux企业级常用服务,如DNS、FTP、Http、mail;
4、Linux企业级安全原理和防范技巧以及网络和安全 Linux安全架构、安全威胁模型、以及加密、解密等原理,常见攻击和防范手段;
5、Shell编程,Shel脚本基本用法,需要学习一些企业级常见脚本用法;
6、MySQL应用原理及管理 Mysql安装、管理、授权、增删改查;
7、http服务代理缓存加,http高级协议应用、缓存、web服务nginx;
8、企业级负载集群企业级4层负载均衡LVS、和7层负载均衡nginx以及haproxy的应用;
9、企业级高可用集群高可用集群原理,实现以keepalived为核心的高可用集群,以及主从高可用、双主;
10、运维监控zabbix企业级监控体系以及zabbix流行开源监控系统的功用及架构;
11、云计算运维自动化ansible、puppet等运维自动化解决方案;
12、WEB服务体系架构 WEB服务体系架构,JSP体系、tomcat、CDN、缓存原理、压测、评估;
13、大型互联网集群架构和实战方案LB集群:nginx、Haproxy、LVSHA集群、动静分离;
14、MySQLDBA实战技能和优化数据库参数优化、分库分表、备份方案、数据恢复策略、主从复制、读写分离、连接池及sharding技术、MHA等;
15、企业级云计算0penstackKeystone、Glance、Nova核心组件、网络模块、块存储服务等;
16、企业大数据Hadoop运维实战列式数据库HBase基础原理、安装配置及其应用、Zookeeper集群构建、hadoop实现Namenode高可用;
17、企业级虚拟化KVM实战 KVM环境:KVM的安装、配置及应用;
18、NoSQL企业级应用 Nosql应用,如redis、MongoDB复制、集群等高级应用;
19、企业级日志收集系统ELK实战海量数据曰志收集系统Elasticsearch+Logstash+kibana应用;
20、可持续化集成 Jenkins+github企业级应用;
21、虚拟化容器Docker Linux轻量虚拟化Docker,Docker的原理和安装,配置以及应用;
22、企业级K8S实战组件功能、安装、配置、企业级应用场景和常见故障分析;
23、Linux系统调优实战从内存、CPU、进程调度、磁盘IO、网络参数等全面讲解Linux系统调优;
24、Python编程基础,Python安装、逻辑判断、模块使用等;
25、综合能力提升表达能力、团队协作能力、执行能力、胜任力等;
总结运维工程师需具备的技能:熟练掌握主机、网络及操作系统基本知识,在出现问题时可以及时解决问题。懂开发能实现自动化运维,将重复性的简单工作交给脚本程序处理提升工作效率。
对网络安全感兴趣的同学可以参考教程:网络安全+运维进阶教程—学以致用,得心应手