系统负载命令观察


1  CPU负载  # cat /proc/loadavg
检查前三个输出值是否超过了系统逻辑CPU的4倍。  逻辑CPU的个数可以通过以下命令获得:
# cat /proc/cpuinfo | grep “^processor” | wc -l
另外,也可以用命令uptime取得CPU负载信息
2  CPU负载  #mpstat 1 1
检查%idle是否过低(比如小于5%)
3  内存空间  # free
检查free值是否过低  也可以用 # cat /proc/meminfo
4  swap空间  # free
检查swap used值是否过高  如果swap used值过高,进一步检查swap动作是否频繁:
# vmstat 1 5
观察si和so值是否较大
5  磁盘空间  # df -h
检查是否有分区使用率(Use%)过高(比如超过90%)  如发现某个分区空间接近用尽,可以进入该分区的挂载点,用以下命令找出占用空间最多的文件或目录:
# du -cks * | sort -rn | head -n 10
6  磁盘I/O负载  # iostat -x 1 2
检查I/O使用率(%util)是否超过100%
7  网络负载  # sar -n DEV
检查网络流量(rxbyt/s, txbyt/s)是否过高
8  网络错误  # netstat -i
检查是否有网络错误(drop fifo colls carrier)  也可以用命令:# cat /proc/net/dev
9  网络连接数目  # netstat -an | grep -E “^(tcp)” | cut -c 68- | sort | uniq -c | sort -n
10  进程总数  # ps aux | wc -l
检查进程个数是否正常 (比如超过250)
11  可运行进程数目  # vmwtat 1 5
r列给出的是可运行进程的数目,检查其是否超过系统逻辑CPU的4倍
12  线程数目
13  进程  # top -id 1
观察是否有异常进程出现
14  网络状态  检查DNS, 网关等是否可以正常连通
15  用户  # who | wc -l
检查登录用户是否过多 (比如超过50个)  也可以用命令:# uptime
16  系统日志  # cat /var/log/rflogview/*errors
检查是否有异常错误记录  也可以搜寻一些异常关键字,例如:
# grep -i error /var/log/messages
# grep -i fail /var/log/messages
17  核心日志  # dmesg
检查是否有异常错误记录
18  系统时间  # date
检查系统时间是否正确
19  打开文件数目  # lsof | wc -l
检查打开文件总数是否过多
20  日志  # logwatch –print  配置/etc/log.d/logwatch.conf,将 Mailto 设置为自己的email 地址,启动mail服务 (sendmail或者postfix),这样就可以每天收到日志报告了。
缺省logwatch只报告昨天的日志,可以用# logwatch –print –range all 获得所有的日志分析结果。
可以用# logwatch –print –detail high 获得更具体的日志分析结果(而不仅仅是出错日志)。

你可能感兴趣的:(系统负载命令观察)