LINUX系统监控

1 CPU负载 # cat /proc/loadavg
检查前三个输出值是否超过了系统逻辑CPU的4倍。 逻辑CPU的个数可以通过以下命令获得:
# cat /proc/cpuinfo | grep “^processor | wc -l
另外,也可以用命令uptime取得CPU负载信息
2 CPU负载 #mpstat 1 1
检查%idle是否过低(比如小于5%)
3 内存空间 # free
检查free值是否过低 也可以用 # cat /proc/meminfo
4 swap空间 # free
检查swap used值是否过高 如果swap used值过高,进一步检查swap动作是否频繁:
# vmstat 1 5
观察si和so值是否较大
5 磁盘空间 # df -h
检查是否有分区使用率(Use%)过高(比如超过90%) 如发现某个分区空间接近用尽,可以进入该分区的挂载点,用以下命令找出占用空间最多的文件或目录:
# du -cks * | sort -rn | head -n 10
6 磁盘I/O负载 # iostat -x 1 2
检查I/O使用率(%util)是否超过100%
7 网络负载 # sar -n DEV
检查网络流量(rxbyt/s, txbyt/s)是否过高
8 网络错误 # netstat -i
检查是否有网络错误(drop fifo colls carrier) 也可以用命令:# cat /proc/net/dev
9 网络连接数目 # netstat -an | grep -e ‘^tcp’ | cut -c 68- | sort | uniq -c | sort -n
10 进程总数 # ps aux | wc -l
检查进程个数是否正常 (比如超过250)
11 可运行进程数目 # vmwtat 1 5
r列给出的是可运行进程的数目,检查其是否超过系统逻辑CPU的4倍
12 线程数目
13 进程 # top -id 1
观察是否有异常进程出现
14 网络状态 检查DNS, 网关等是否可以正常连通
15 用户 # who | wc -l
检查登录用户是否过多 (比如超过50个) 也可以用命令:# uptime
16 系统日志 # cat /var/log/rflogview/*errors
检查是否有异常错误记录 也可以搜寻一些异常关键字,例如:
# grep -i error /var/log/messages
# grep -i fail /var/log/messages
17 核心日志 # dmesg
检查是否有异常错误记录
18 系统时间 # date
检查系统时间是否正确
19 打开文件数目 # lsof | wc -l
检查打开文件总数是否过多
20 日志 # logwatch �Cprint 配置/etc/log.d/logwatch.conf,将 Mailto 设置为自己的email 地址,启动mail服务 (sendmail或者postfix),这样就可以每天收到日志报告了。
缺省logwatch只报告昨天的日志,可以用# logwatch �Cprint �Crange all 获得所有的日志分析结果。
可以用# logwatch �Cprint �Cdetail high 获得更具体的日志分析结果(而不仅仅是出错日志)。 ==========其它一句话命令========== 1.删除0字节文件
find -type f -size 0 -exec rm -rf {} ;
2.查看进程
按内存从大到小排列
ps -e -o “%C:%P:%z%a”|sort -k5 -nr|head -n 10

3.按cpu利用率从大到小排列
ps -e -o “%C:%p:%z:%a”|sort -nr|head -n 5

4.打印说cache里的URL
grep -r -a jpg /data/cache/* | strings | grep “http: | awk -F’http:’ ‘{print “http:$2;}’
5.查看http的并发请求数及其TCP连接状态:
netstat -n | awk ‘/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}’
6. sed -i ‘/Root/s/no/yes/’ /etc/ssh/sshd_config sed在这个文里Root的一行,匹配Root一行,将no替换成yes.
7.1.如何杀掉mysql进程:
ps aux|grep mysql|grep -v grep|awk ‘{print $2}’|xargs kill -9 (从中了解到awk的用途)
pgrep mysql |xargs kill -9 [网友:&FROST]
killall -TERM mysqld
kill -9 `cat /usr/local/apache2/logs/httpd.pid` 试试查杀进程PID
8.显示运行3级别开启的服务:
ls /etc/rc3.d/S* |cut -c 15- (从中了解到cut的用途,截取数据)
9.如何在编写SHELL显示多个信息,用EOF
cat Apache的并发请求数及其TCP连接状态:
netstat -n | awk ‘/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}’
15.因为同事要统计一下服务器下面所有的jpg的文件的大小,写了个shell给他来统计.原来用xargs实现,但他一次处理一部分,搞的有多个总和….,下面的命令就能解决啦.
find / -name *.jpg -exec wc -c {} ;|awk ‘{print $1}’|awk ‘{a+=$1}END{print a}’
CPU的数量(多核算多个CPU,cat /proc/cpuinfo |grep -c processor)越多,系统负载越低,每秒能处理的请求数也越多。


你可能感兴趣的:(linux,监控,CPU负载)