大讲台大数据运维学习笔记

运维通俗的理解即为运行和维护,来保证系统和网站的正常运行,维护它们的安全。保证7×24小时的正常运行,数据的稳定、不丢失,并持续进行系统及网站的优化。那它具体是做什么的呢?

1. 备份有备无患,总是没错的!!!从数据库的备份、程序的备份到系统的备份,通过备份的方式,来防止数据的丢失。以免数据的故障或其他原因,让数据都消失了,造成一场不小的“灾难”。

2. 监视对日常的系统进行监视和管理,避免出现不必要的问题。通常情况下,运维工程师需要根据客户系统的特点,监视各项指标。如系统资源(CPU,内存,磁盘,网络使用情况等),应用程序的响应时间即服务响应时间,日志文件及各种中间件(Apache,MySQL,Redis等等)。 全方位的监视指标,会缩短发生问题时的排查时间。

3.告警告警与监视是相连接的,在监视时候发现了问题,将问题告知于客户,现在最常见的方式就是,打电话、发短信、发邮件,现在也在逐渐发展自动化的告警系统。

4.处理问题通过对客户系统的了解,来快速的定位到问题并进行解决,这就是考验运维工程师技术的时候了!!!

5. 改善服务其实就是对系统的优化,针对现有情况的基础,从技术层面或者设备上进行改善,对总体的系统做一个提升,提高性能及服务的响应时间。从技术层面上进行提升可提高的性能仅限于10%-30%,通过添加硬件设备得到的将是100%以上的性能提高。你懂的,虽然只是才是力量,但是有的时候万恶的金钱才是根本。

6.技术支持根据客户的需求进行日常维护。如添加FTP账户,添加虚拟主机,临时备份一下数据库等等。运维的工作,像这样说一下,看起来还算是挺简单的。但是,在真正的工作中,这是一份“费力不讨好”的工作。做的很多的事情都被埋没,只要系统不出现问题,就体现不出运维工程师的价值,但是运维的价值就是系统的稳定运行,不让它出问题,是不是还挺矛盾。

链接:https://pan.baidu.com/s/1_4PIUb-Yl68aTW9Bw95iJA
提取码:tnav

你可能感兴趣的:(运维,运维,docker)