服务器资源不足问题排查及解决思路,shell脚本定时清理数据文件和日志文件

项目场景:

最近公司运维反馈说是服务器资源不足,触发告警了。以下排查思路及解决方案


排查思路

1、查看磁盘使用情况:

        使用 df -h 命令,查看磁盘使用情况。

        使用free -g命令 ,查看内存使用情况。如果内存满及时释放缓存数据,清缓存命令:

        echo 1 > /proc/sys/vm/drop_caches

2、排查服务生成的日志过大造成的:

        找到服务jar位置, 使用 ll -h 命令查看nohup日志大小。查看log back下日志大小。

3、排查服务器是否做为 文件资源存储。 文件资源过大,要不扩容,要不删除历史文件。


原因分析:

通过以上排查思路,最终找到问题所在。

排查发现,网关的nohup日志达到30G左右,并且还在增长。logback日志增长不大,使用按时间分割存储。


解决方案:

第一种,对代码进行优化,将打印输出控制台的删除掉,更新服务即可。

System.out.println(ret);

第二种,使用linux 定时器功能,定时清空nohup日志。

创建清空脚本 :

touch /home/weblogic/clear_log.sh

 脚本内容(可支持,多目录下的log清空):

#!/bin/sh
#可填写多个路径
workdir=("/home/weblogic/test" "/home/weblogic/test1")
for wdir in ${workdir[@]}; do
  echo -e "filepath is ${wdir}"
  # .out 文件和包含 out 标记的 .out文件
  find $wdir -regex "^.*\(\.out\)$" -and -mtime +5 -type f -exec  rm  -rf  {} \;
  if [ $? -eq 0 ]; then
    echo -e `date`" delete logs successfully! \n"
  else
    echo -e `date`" delete logs failed! \n"
  fi
done

文件授权:

chmod +x clear_log.sh

使用 crontab -e 命令,将 清空的sh,放到定时器中 (我设置的每天1点执行一次)。

0 1 * * * /home/weblogic/clear_log.sh

附录一下所有job时间格式:

基本格式 : 
*  *  *  *  *  command 
分 时 日    月 周   命令 
第1列表示分钟1~59 每分钟用*或者 */1表示 
第2列表示小时1~23(0表示0点) 
第3列表示日期1~31 
第4列表示月份1~12 
第5列标识号星期0~6(0表示星期天) 
第6列要运行的命令 
crontab文件的一些例子: 
30 21 * * * /usr/local/etc/rc.d/lighttpd restart 
上面的例子表示每晚的21:30重启apache。 
45 4 1,10,22 * * /usr/local/etc/rc.d/lighttpd restart 
上面的例子表示每月1、10、22日的4 : 45重启apache。 
10 1 * * 6,0 /usr/local/etc/rc.d/lighttpd restart 
上面的例子表示每周六、周日的1 : 10重启apache。 
0,30 18-23 * * * /usr/local/etc/rc.d/lighttpd restart 
上面的例子表示在每天18 : 00至23 : 00之间每隔30分钟重启apache。 
0 23 * * 6 /usr/local/etc/rc.d/lighttpd restart 
上面的例子表示每星期六的11 : 00 pm重启apache。 
0 */1 * * * /usr/local/etc/rc.d/lighttpd restart 
每一小时重启apache 
0 23-7/1 * * * /usr/local/etc/rc.d/lighttpd restart 
晚上11点到早上7点之间,每隔一小时重启apache 
0 11 4 * mon-wed /usr/local/etc/rc.d/lighttpd restart 
每月的4号与每周一到周三的11点重启apache 
0 4 1 jan * /usr/local/etc/rc.d/lighttpd restart 
一月一号的4点重启apache 
名称 : crontab 
使用权限 : 所有使用者 
使用方式 : 
crontab file [-u user]-用指定的文件替代目前的crontab。 
crontab-[-u user]-用标准输入替代目前的crontab. 
crontab-1[user]-列出用户目前的crontab. 
crontab-e[user]-编辑用户目前的crontab. 
crontab-d[user]-删除用户目前的crontab. 
crontab-c dir- 指定crontab的目录。 
crontab文件的格式:M H D m d cmd. 
M: 分钟(0-59)。 
H:小时(0-23)。 
D:天(1-31)。 
m: 月(1-12)。 
d: 一星期内的天(0~6,0为星期天)。 
cmd要运行的程序,程序被送入sh执行,这个shell只有USER,HOME,SHELL这三个环境变量 
说明 : 
crontab 是用来让使用者在固定时间或固定间隔执行程序之用,换句话说,也就是类似使用者的时程表。-u user 是指设定指定 
user 的时程表,这个前提是你必须要有其权限(比如说是 root)才能够指定他人的时程表。如果不使用 -u user 的话,就是表示设 
定自己的时程表。 
参数 : 
crontab -e : 执行文字编辑器来设定时程表,内定的文字编辑器是 VI,如果你想用别的文字编辑器,则请先设定 VISUAL 环境变数 
来指定使用那个文字编辑器(比如说 setenv VISUAL joe) 
crontab -r : 删除目前的时程表 
crontab -l : 列出目前的时程表 
crontab file [-u user]-用指定的文件替代目前的crontab。 
时程表的格式如下 : 
f1 f2 f3 f4 f5 program 
其中 f1 是表示分钟,f2 表示小时,f3 表示一个月份中的第几日,f4 表示月份,f5 表示一个星期中的第几天。program 表示要执 
行的程序。 
当 f1 为 * 时表示每分钟都要执行 program,f2 为 * 时表示每小时都要执行程序,其馀类推 
当 f1 为 a-b 时表示从第 a 分钟到第 b 分钟这段时间内要执行,f2 为 a-b 时表示从第 a 到第 b 小时都要执行,其馀类推 
当 f1 为 */n 时表示每 n 分钟个时间间隔执行一次,f2 为 */n 表示每 n 小时个时间间隔执行一次,其馀类推 
当 f1 为 a, b, c,... 时表示第 a, b, c,... 分钟要执行,f2 为 a, b, c,... 时表示第 a, b, c...个小时要执行,其馀类推 
使用者也可以将所有的设定先存放在档案 file 中,用 crontab file 的方式来设定时程表。 
例子 : 
#每天早上7点执行一次 /bin/ls : 
0 7 * * * /bin/ls 
在 12 月内, 每天的早上 6 点到 12 点中,每隔3个小时执行一次 /usr/bin/backup : 
0 6-12/3 * 12 * /usr/bin/backup 
周一到周五每天下午 5:00 寄一封信给 [email protected] : 
0 17 * * 1-5 mail -s "hi" [email protected] < /tmp/maildata 
每月每天的午夜 0 点 20 分, 2 点 20 分, 4 点 20 分....执行 echo "haha" 
20 0-23/2 * * * echo "haha" 
注意 : 
当程序在你所指定的时间执行后,系统会寄一封信给你,显示该程序执行的内容,若是你不希望收到这样的信,请在每一行空一格之 
后加上 > /dev/null 2>&1 即可 
例子2 : 
#每天早上6点10分 
10 6 * * * date 
#每两个小时 
0 */2 * * * date 
#晚上11点到早上8点之间每两个小时,早上8点 
0 23-7/2,8 * * * date 
#每个月的4号和每个礼拜的礼拜一到礼拜三的早上11点 
0 11 4 * mon-wed date 
#1月份日早上4点 
0 4 1 jan * date 
范例 
$crontab -l 列出用户目前的crontab.

执行shell脚本过程中,遇到的问题

错误提示: syntax error near unexpected token `$'do\r''

原因:在windows环境下编写的shell脚本的换行符CRLF和linux的LF不匹配。

解决:更换换行格式就好, 把脚本放到vsCode编辑,在窗口右下叫位置,显示切换 切换行尾序列按钮。修改行尾序列 改为LF。

服务器资源不足问题排查及解决思路,shell脚本定时清理数据文件和日志文件_第1张图片

错误提示:syntax error near unexpected token '$'\r''

原因:

  1. 因为你所处理的文件换行符是dos格式的”\r\n” ;

  2. 可以使用cat -v 文件名 来查看换行符是否是,如果是上述的,则行结尾会是^m 需要转换成linux/unix格式的”\n”;

  3. 具体转换办法就是转换换行符 。

解决:使用sed ‘s/\r//’ 原文件 >转换后文件 ;

 sed 's/\r//' clear_log_old.sh > clear_log.sh

你可能感兴趣的:(运维,1024程序员节,java,linux,cron,服务器,运维,spring,boot)