shell定时清理过期文件/日志

前言

我从事于一家游戏公司,公司有一台日志服务器,用于临时存储各游戏日志进行以便数据清洗操作。日积月累日志文件耗费大量存储空间,导致磁盘空间不足。以下是我清理过期日志的过程

需求分析

1.有做备份的日志才能清理。那些日志备份做了备份,记录在另外一个备份脚本内。最好是从备份脚本直接读取需要清理的游戏,以免备份日志与清理的日志不一致导致比不必要的问题

2.需求是清理6天前的日志。日志文件是增量写入,可以用文件修改时间筛选6天前的日志。有多个目录的日志需要删除,需要查找指定目录下的过期日志,并用循环进行清理操作

3.开启定时任务执行清理操作,节约人力成本

具体操作

1.读取文件中的变量

同步脚本 rsync_logs.sh ,内容如下 需要提取变量log_dirs的值

#!rsync_logs.sh
src="/data/xxx"
log_dirs="aktw mmga nmgf smzx sdfr sgta get asder ersr erar" 
logfile="/home/xxx/scripts/rsync.log"

a.读取文件可以用 cat
b.过滤数据可以用 grep
c.切割出文本内容用 awk

使用cat读取文件,使用grep过滤包含log_dirs的行,使用awk根据 " 切割后取出第二个值。命令如下

cat rsync_logs.sh|grep 'log_dirs='|awk -F '\"' '{print $2}' 

结果:

aktw mmga nmgf smzx sdfr sgta get asder ersr erar
2.清理6天前的日志

要清理 /data/logs/aktw/6天前的日志文件

a.遍历目录下的所有文件
b.检查日志文件修改时间
c.删除过期文件

    for file in `find /data/logs/aktw/ -type f -name "*"`   
    do
        local expired_time=$[6*24*60*60]        #此处定义文件的过期时间6天
        local currentDate=`date +%s`            #获取系统时间,所以时间格式为秒
        local modifyDate=$(stat -c %Y $file)    #获取文件修改时间
        local existTime=$[$currentDate-$modifyDate]     #对比时间,算出日志存在时间
        if [ $existTime -gt $expired_time ];
        then
            rm -rf $file    #删除文件
        fi
    done

实际环境要求
a.删除多个目录
b.在清理文件后,一并清理空目录
b.输出日志信息,以便确认/后续观察清理日志操作是否正常。

完善后的脚步如下:

#!clean_logs.sh
cd `dirname $0`     #跳转至当前目录
log_dirs="$(cat rsync_logs.sh|grep 'log_dirs='|awk -F '\"' '{print $2}')"   #读取同步脚本中的游戏配置
data_path="/data/logs/"         #文件根目录
expired_time=$[6*24*60*60]      #此处定义文件的过期时间 6天
function deletefiles {
    #跳过空目录
    if [ ! -d $1 ];
    then
        return
    fi
    #删除过期文件
    for file in `find $1 -type f -name "*"`     #获取目录下的文件,$1 第一个参数
    do
        local currentDate=`date +%s`            #获取系统时间,所以时间格式为秒
        local modifyDate=$(stat -c %Y $file)    #获取文件修改时间
        local existTime=$[$currentDate-$modifyDate]     #对比时间,算出日志存在时间
        if [ $existTime -gt $expired_time ];
        then
            echo "delete file true ,path:"$file",existTime="$existTime
            rm -rf $file    #删除文件
        else
            echo "delete file false,path:"$file",existTime="$existTime
        fi
    done
    #删除空目录
    for file in `find $1 -type d -name "*"`     #获取目录下的目录,$1 第一个参数
    do
        local dircount=`ls -lR $file|grep "^-"|wc -l`   #获取目录下文件个数 0 则是空目录
        if [ $dircount -eq 0 ] && [ -d $file ];
        then
            echo "delete dir  true ,path:"$file",dircount="$dircount
            rm -rf $file    #删除目录
        else
            echo "delete dir  false,path:"$file",dircount="$dircount
        fi
    done
}
#for循环删除多个目录。注意 空格 是linux的转译符之一,因此log_dirs 为集合,非字符串
for dir in $log_dirs
do
    deletefiles $data_path$dir/
done

3.将脚本加入定时任务

使用 crontab -e 编辑定时任务。设置每日02:00:00执行清理脚本,全部日志输出到 /data/scripts/logs/clean_logs.log

0 2 * * * sh /data/scripts/clean_logs.sh >> /data/scripts/logs/clean_logs.log 2>&1;

crontab时间格式:
{minute} {hour} {day-of-month} {month} {day-of-week} {full-path-to-shell-script}
o minute: 区间为 0 – 59
o hour: 区间为0 – 23
o day-of-month: 区间为0 – 31
o month: 区间为1 – 12. 1 是1月. 12是12月.
o Day-of-week: 区间为0 – 7. 周日可以是0或7.

4.确认脚本运行状态

a.先手动执行脚本,完成清理
b.第二天使用 cat /data/scripts/logs/clean_logs.log 查看日志是否有异常

四、相关资料

linux 文件查找 https://www.cnblogs.com/huninglei/p/5824205.html
Linux下统计目录个数、文件个数 https://blog.csdn.net/llq_200/article/details/80506447
crontab 详细用法 定时任务 https://www.cnblogs.com/aminxu/p/5993769.html

你可能感兴趣的:(shell定时清理过期文件/日志)