互联网运维阶段性总结
1. 一个网站运维最重要的是域名,不能被劫持,密码一定要保存好。不然就被人把你的网站黑掉了。另外要注册多个域名,一旦一个域名不能用了,就尽快换另一个域名。域名也要买防DDos***,也要买cdn(用来做缓存和代理)。dns服务商最好买云计算dns,这样可以把真正的IP地址隐藏起来。
2. 一定要用代理服务器,这样可以把真正的服务器隐藏起来,核心数据库服务器一定要做主从复制,每天dump备份,还有远程灾备,要不然用到的时候哭都来不及。数据库必备知识要会bin-log还原,也要会根据dump备份还原某一个表。
3. 根据服务器性能,看看是否需要做web服务器的负载均衡,最好用nginx服务器。apache服务器在这里提一句,模块很多,功能很多,也比较稳定,但是性能方面真的是nginx是轻量级的,nginx还是更快一些。
4. 网站安全这块,一定要注意购买机房的高防,带宽一定要大,代理服务器和核心服务器之间,往连通性很重要,要经常查看他俩之间的网络连通性,看看是服务器性能配置低,还是网络带宽不够用,还是网通电信原因导致通信慢。要有一台服务器实时监控他俩之间的网络连通性,直接就访问一个index.html页面就可以监控了。只要不丢包就没问题。如果是网通电信的问题,那么要核心服务器
要有多个IP地址,有的IP地址是网通的,有的IP地址是电信的,有的是移动的。所以肉盾机遍布全国各地,肉盾机连接核心服务器的哪个IP地址更快就连接哪个地址就可以了。
5. 密码这里要每3个月就修改一次密码,全部修改。包括邮箱的密码,因为邮箱注册的域名,还有邮箱会注册dns管理账号。所以密码管理一定要重视,可以使用keepass来做密码管理。
6. 局域网的管理一定要以稳定为主,网路一定要稳定,别让问题出在局域网这里,那就太不值得了。网络设备都用比较贵的比较稳定的设备。服务器一定要有raid配置,cpu一定要够大,内存也要多条,大内存,这样工作起来才会提高效率。电源这块一定要保证稳定,不行就使用ups设备,一个人一个ups也可以考虑。不然断电情况下数据丢了,那可就太影响工作效率了。
7. 运维要懂数据库,还有开发也要懂,硬件也要懂,网络也要懂,反正得非常全面,要不然做不好运维的。
8. 可以找一台硬件高配服务器,要品牌机,要有raid配置。然后做一个虚拟机,这样可以把不是很重要的服务器放在这台虚拟机上,这样就可以节省资源。
9. 运维一定要会写shell脚本,这样很多重复工作都不用做了,省时。还有加班的一些重复工作也不用做了,配合程序上传文件什么的,都可以让程序自己完成上传文件的工作了。
10. 所有的工作一定要做笔记,一定要做笔记,还要有每天的工作日志
11. 定期做备份的恢复测试,看看你的备份是否好用。
12. 监控:一定要有监控服务器,还要有报警,只有监控服务器才能看出你的服务器是否被***,有报警才能及时的联系到你。如果人手充足情况下,要有人24小时监控服务器。磁盘容量监控,磁盘IO监控,cpu监控,多少用户登录服务器监控,服务器某些文件否是有改动的监控,数据库的监控。等等,建议使用zabbix监控系统。最重要的是网络的监控,还有服务器存活状态的监控,还有服务是否死掉的监控。
13. 所有生产服务器的配置,都要基于测试环境充分测试成功的基础上,不然千万别动生产环境。生产服务器一定要有优化配置,内核的优化,操作系统的优化,服务的优化。
14. 访问用户量超过2000人的时候,那就是比较大的用户量,相关的配置将会不一样,但最好的优化还是硬件的优化,硬件强大了优化就好做了。我现在还没有做过在线人数超过2000的环境,需要学习。
15. 再就是作为运维人员平时的工作习惯了。首先是一定要保持清醒头脑,然后是最工作一定要仔细认真,这个工作不需要太快,除非故障排错的时候。但是一定要仔细,不能出错.


http://os.51cto.com/art/201702/532912.htm 

运维DBA的四大纪律九项注意