一.业务运维工程师的职责:
1.设计优化系统体系架构
2.系统、网络配置管理
3.面向开发部门、服务部门的服务流程和服务标准
4.故障处理
5.日常维护监控,提供IT软硬件方面的服务和支持,保证系统的稳定
二.能上QQ却打不开网页
1.DNS解析错误
2.代理服务器认证出错
3.防火墙安全策略
4.部分网络协议出错
5.浏览器的问题或者浏览器关联的系统文件问题(sfc/scannow扫描)
三.网站打开很慢的原因
1.没有域名备案
2.flash加载失败
3.死链接没有404跳转
4.图片没压缩,插件过多
5.高负荷访问
6.程序优化不足
四.访问量超载
1.网站服务器上使用LVS、Nginx负载均衡分流
2.使用varnish做cdn前端缓存,减少服务器后端处理量
3.mysql做集群,主从分带,读写分离
4.前端静态资源优化,压缩css和js,合并请求文件,开启浏览器缓存
5.图片域名服务器,数据ajax异步读写
五.平均系统负载(这里参考:http://blog.sina.com.cn/s/blog_667725170100lsus.html文章)
系统平均负载被定义为在特定时间间隔内运行队列中的平均进程树。如果一个进程满足一下条件则其就会位于运行队中中:
1.它没有在等待I/O操作的结果
2.它没有主动进入等待状态(也就是没有调用wait)
3.没有被停止(例如:等待终止)
一般来说,每个CPU内核当前活动进程树不大于3,则系统运行表现良好。
输入uptime查看负载均衡:(w、top亦可)
20:38:23 up 4:28, 2 users, load average: 2.22, 2.34, 1.58
当前系统时间20:38:23
系统已经运行的时间4:28
当前在线用户2 user
平均负载:2.22, 2.34, 1.58 (最近1分钟、5分钟、15分钟系统的负载)
六.关于IO
外部设备和设备控制器、数据总线等一起构成I/O系统。
总线是组成计算机各个部件之间进行信息传输的公共通道。微机的总线包括地址总线、控制总线和数据总线。设备控制器是CPU和I/O设备之间的接口。
七.CPU的中断处理机制
八.系统资源的监控
详情可参考:http://www.ibm.com/developerworks/cn/linux/l-cn-shell-monitoring/
1.检测进程是否存在
2.进程CPU利用率
3.进程内存使用量
4.进程句柄使用量(limit进程句柄限制)
九.不能直接kill掉的进程
a、该进程处于"Zombie"状态(使用ps命令返回defunct的进程)。此时进程已经释放所有资源,但还未得到其父进程的确认。"Zombie"进程要等到下次重启时才会消失,但它的存在不会影响系统性能。
b、 该进程处于"kernel mode"(核心态)且在等待不可获得的资源。处于核心态的进程忽略所有信号处理,因此对于这些一直处于核心态的进程只能通过重启系统实现。进程在AIX 中会处于两种状态,即用户态和核心态。只有处于用户态的进程才可以用“kill”命令将其终止。
十.云计算机制
虚拟化机制将具体的计算特性加以封装隐藏,对外提供统一逻辑接口,从而屏蔽物理设备多样性带来的差异,虚拟化是实现云计算的最重要的技术基础。
其次是海量数据分布式存储管理机制,云计算系统由大量服务器组成,同时为大量用户服务,为保证高可用、高可靠和经济性。
最后是分布式计算机制,所谓分布式计算就是把一个需要非常巨大的计算能力才能解决的问题分成许多小的部分,交给许多相互独立的计算机协同处理。
十一.DNS解析过程:
1.查询浏览器,系统缓存。
2.查找本地DNS服务器。
3.若本地DNS服务器没有命中,查找根域名服务器。
4.根域名服务器返回一个主域名服务器地址给本地DNS服务器,本地DNS向主域名服务器请求。
5.主域名服务器查找并返回域名的Name Server域名服务器地址。
6.Name Server域名服务器查找域名和IP映射表,返回IP和TTL给本地服务器。
7.本地服务器存入缓存并返回给用户。
十二.输入一个网址到打开所需要的协议:
http,html,dns,tcp,ip,icmp
十三.http常见状态码:
200 服务器成功返回网页
301 重定向(地址永久性转移)
304 服务器未修改,浏览器读取缓存
404 请求页面不存在
500 服务器内部错误
503 服务器暂时不可用