日志分割解决方案-django/logrotate

线上升级后,发现日志不再分割,记录以下排查过程以及所涉及的知识。

1.配置文件排查

询问老工程师,反馈是通过Python的logging模块进行分割的,其中logging模块介绍如下:
logging模块采用模块化设计思想,主要包括四种模块:

  • Logger:记录器,提供应用程序调用的各种接口;
  • Handler:处理器,处理记录器产生的日志;
  • Filter:过滤器,提供更好的粒度控制;
  • Formatters:格式器,格式化日志内容的组成和消息字段;

其中logging模块详解请见:logging模块详解(转自刘江的博客)
日志处理流程如下图所示:
日志分割解决方案-django/logrotate_第1张图片

Django中的logging配置解释如下,其中Django读取settings.py中的LOGGING配置:

LOGGING = {
    'version': 1, #版本号
    'disable_existing_loggers': False,
    'formatters': { # 格式器
        'verbose': { # 复杂格式名称
            'format': '{levelname} {asctime} {module} {process:d} {thread:d} {message}',
            'style': '{',
        },
        'simple': { # 简洁格式名称
            'format': '{levelname} {message}',
            'style': '{',
        },
    },
    'filters': { # 过滤器
        'special': { # 过滤器名称
            '()': 'project.logging.SpecialFilter',
            'foo': 'bar',
        },
        'require_debug_true': {
            '()': 'django.utils.log.RequireDebugTrue',
        },
    },
    'handlers': { # 处理器
       'logit': { # 名称
            'level': 'DEBUG',
            'class': 'logging.handlers.TimedRotatingFileHandler',# 按某一时间来分割
            'filename': '/tmp/logit.log', # 路径
            'when': 'midnight', # Roll over at midnight
            'backupCount': 10, # 备份数量
            'formatter': 'verbose', # 格式器
        },
        'console': { # 处理器名称
            'level': 'INFO', # 级别
            'filters': ['require_debug_true'], # 过滤器
            'class': 'logging.StreamHandler', # 流处理器
            'formatter': 'simple' # 格式器
        },
        'file': {
            'level': 'DEBUG',
            'class': 'logging.FileHandler', # 文件处理器
            'filename': '/path/to/django/debug.log', # 文件路径
        },
        'mail_admins': { # 名称
            'level': 'ERROR',
            'class': 'django.utils.log.AdminEmailHandler', # 邮件处理器
            'filters': ['special']
        }
    },
    'loggers': {
        'django': {
            'handlers': ['console'],
            'propagate': True,
        },
        'django.request': {
            'handlers': ['mail_admins'],
            'level': 'ERROR',
            'propagate': False,
        },
        'myproject.custom': {
            'handlers': ['console', 'mail_admins'],
            'level': 'INFO',
            'filters': ['special']
        }
    }
}

但是排查线上配置文件,并未配置TimedRotatingFileHandler处理器。并且查看文件修改记录及git记录,该文件并未修改。所以判断,日志分割使用了其他方法。

logrotate

经过排查代码,确定日志分割的方式是通过crond+logrotate进行分割的。
其中logrotate介绍如下:
logrotate用于管理系统生成的大量日志,可以自动的分割、压缩、移除或者mailing日志文件。
一般,logrotate作为daily cron job运行,除非rotate的标准是基于log文件大小,且logrotate命令明天被执行多次,即自定义了定时任务。再或者手动执行logrotate时添加了-f/--force选项;
logrotate.conf参数说明

# see "man logrotate" for details  
# rotate log files weekly: 每周rotate log文件一次  
weekly  

# keep 4 weeks worth of backlogs: 
# 保存最近4周的log日志,因为上面是每周rotate一次  
rotate 4  

# create new (empty) log files after rotating old ones:
# rotate老日志文件之后,创建一个新的空日志文件  
create  

# use date as a suffix of the rotated file:
#rotate的文件以日期格式为后缀,比如:access_log-20200422,
#如果不加这个选项,rotate的格式为:access_log.1,access_log.2等等。  
dateext  

# uncomment this if you want your log files compressed:
# 如果想压缩rotate后的文件,把下面compress前面的#号去掉就可以了。  
#compress  

# RPM packages drop log rotation information into this directory:
# RPM包的日志rotation配置信息,建议放到/etc/logrotate.d这个文件夹下,
# 实现自定义控制log文件rotate  
include /etc/logrotate.d 

# no packages own wtmp and btmp -- we'll rotate them here:wtmp和btmp
# 这两个不属于任何package,我们就把rotate的规则写到这里
/var/log/wtmp {  
   monthly #每个月执行一次rotate  
   create 0664 root utmp  #创建空文件,权限是664, 所属用户名 所属用户组  
   minsize 1M       #日志文件大小超过1M才执行rotate,否则跳过  
   rotate 1         #rotate时,只保留一份rotate文件  
  }  
/var/log/btmp {  
   missingok  
   monthly  
   create 0600 root utmp  
   rotate 1  
  }  
  
 # system-specific logs may be also be configured here.
 # 其它系统日志也可以在这里配置rotate规则

RPM包的日志配置信息,建议放到/etc/logrotate.d下,具体的日志配置信息如下:

/var/log/xxx.log { # 日志路径
    size=500M # 当日志文件到达指定的大小时才转储/分割,默认的大小单位是bytes
    dateext # 使用当期日期作为命名格式
    rotate 365 # 指定rotate日志文件保留的数量
    compress # 通过gzip压缩然后备份日志
    delaycompress # 延迟压缩旧的日志文件,先rotate,不压缩;等下次rotate时,再压缩;需要跟compress同时使用
    missingok # 如果日志不存在,不产生错误信息
    notifempty # 如果日志为空,不做rotate,与ifempy互斥
    # sharedscripts # 配合prerotate and postrotate 使用
    create 644 root root # rotate之后,创建新文件的日志文件并指定新文件的属性
    postrotate # rotate之后想要执行的脚本,需要放在postrotate 与 endscript中间,这两个选项要单独成行
        /usr/bin/killall -HUP rsyslogd
    endscript
}

为什么备份日志一天一次呢?是因为在/etc/cron.daily下有个logrotate可执行脚本,脚本内容如下:

#!/bin/sh  
/usr/sbin/logrotate -s /var/lib/logrotate/logrotate.status /etc/logrotate.conf  
EXITVALUE=$?  
if [ $EXITVALUE != 0 ]; then  
   /usr/bin/logger -t logrotate "ALERT exited abnormally with [$EXITVALUE]"  
fi  
exit 0
crond

当然也可以自定义crontab计划。
这里再介绍一下crontab的简单用法:
Linux的调度任务分为两类:
系统调度任务,由crond服务来控制,默认随系统启动;
用户调度任务,使用crontab设置任务计划;
日志分割解决方案-django/logrotate_第2张图片
crondtab配置文件如下所示:

SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin #系统命令路径
MAILTO=root # crond的任务执行信息将通过电子邮件发送给root用户
HOME = / # 执行命令或者脚本时使用的主目录
# For details see man 4 crontabs
# Example of job definition:
# .---------------- minute (0 - 59)
# |  .------------- hour (0 - 23)
# |  |  .---------- day of month (1 - 31)
# |  |  |  .------- month (1 - 12) OR jan,feb,mar,apr ...
# |  |  |  |  .---- day of week (0 - 6) (Sunday=0 or 7) OR sun,mon,tue,wed,thu,fri,sat
# |  |  |  |  |
# *  *  *  *  * user-name  command to be executed
  0  0  *  *  * root       /bin/sh /etc/cron.daily/logrotate
crontab命令详解
crontab [-u user] file
crontab [ -u user ] [ -i ] { -e | -l | -r }
  • -u user:用于设定某个用户的crontab服务;
  • file: file为命令文件名,表示将file作为crontab的任务列表文件并载入crontab;
  • -e:编辑某个用户的crontab文件内容,如不指定用户则表示当前用户;
  • -l:显示某个用户的crontab文件内容,如不指定用户则表示当前用户;
  • -r:从/var/spool/cron目录中删除某个用户的crontab文件。
  • -i:在删除用户的crontab文件时给确认提示。
crontab注意点
  1. crontab有2种编辑方式:直接编辑/etc/crontab文件与crontab –e,其中/etc/crontab里的计划任务是系统中的计划任务,而用户的计划任务需要通过crontab –e来编辑;
  2. 每次编辑完某个用户的cron设置后,cron自动在/var/spool/cron下生成一个与此用户同名的文件,此用户的cron信息都记录在这个文件中,这个文件是不可以直接编辑的,只可以用crontab -e 来编辑。
  3. crontab中的command尽量使用绝对路径,否则会经常因为路径错误导致任务无法执行。
  4. 新创建的cron job不会马上执行,至少要等2分钟才能执行,可从起cron来立即执行。
  5. %在crontab文件中表示“换行”,因此假如脚本或命令含有%,需要使用%来进行转义。

总结:

1.线上配置一般不会更改;
2.线上服务器一定不能在线做修改、删除等操作;
3.最后排查,是docker内的crond服务挂掉,重启crond服务后,日志分割正常;

参考文档:
刘江的博客
Linux自带神器logrotate详解
crontab用法与实例

你可能感兴趣的:(日志分割解决方案-django/logrotate)