1.定时任务介绍

1.1 crond是什么

crond是linux系统中用来定期执行命令或指定程序的一种服务或软件。
特殊要求:(秒级别)crond服务就无法搞定了,一般工作中写脚本用守护进程执行

[root@shellbiancheng jiaobenlianxi]# cat while1.sh 
#!/bin/sh
while true
   do
    uptime
    sleep 2
   done

1.2 linux系统crond的定时任务

(1)linux系统自身定期执行的任务操作,如轮询系统日志、备份系统数据、清理系统缓存等,这些任务无需我们人为干预。例如:

[root@linzhongniao ~]# ls -l /var/log/messages*
 -rw-------. 1 root root  206776 Aug  2 17:43 /var/log/messages
 -rw-------. 1 root root  448307 Jul  8 08:54 /var/log/messages-20180708
 -rw-------. 1 root root  742560 Jul 16 04:05 /var/log/messages-20180716
 -rw-------. 1 root root 1293433 Jul 22 15:15 /var/log/messages-20180722
 -rw-------. 1 root root  622193 Jul 30 20:14 /var/log/messages-20180730
[root@linzhongniao ~]# ll /etc/|grep cron
 -rw-------.  1 root root541 Aug 24  2016 anacrontab
drwxr-xr-x.  2 root root   4096 Jul 16 14:19 cron.d
drwxr-xr-x.  2 root root   4096 Jul 16 14:18 cron.daily
 -rw-------.  1 root root  0 Aug 24  2016 cron.deny
drwxr-xr-x.  2 root root   4096 Jul 16 14:19 cron.hourly
drwxr-xr-x.  2 root root   4096 Jun 14 05:01 cron.monthly
 -rw-r--r--.  1 root root457 Sep 27  2011 crontab
drwxr-xr-x.  2 root root   4096 Sep 27  2011 cron.weekly

2)用户执行的任务操作:某个用户或系统管理员定期要做的任务工作,例如每隔5分钟和互联网上时间服务器进行同步,每天晚上0点备份站点数据及数据库数据,一般这些工作需要由每个用户自行设置才行。
用户执行的任务工作,也就是运维管理员执行的任务工作,因此这个用户执行的任务是我们的重点。

1.3 linux系统下定时任务软件种类

linux系统下的定时任务还真不少,例如:at,crontab,anacron

at:适合仅执行一次就结束的调度任务命令,例如:某天晚上需要处理一个任务,仅仅是这一天的晚上,属于突发性任务,要执行at命令,还需要启动atd的服务才行

[root@linzhongniao ~]# chkconfig --list|grep atd
atd 0:off   1:off   2:off   3:off   4:off   5:off   6:off
[root@linzhongniao ~]# chkconfig --list atd
atd 0:off   1:off   2:off   3:off   4:off   5:off   6:off

2.定时任务使用说明

[root@linzhongniao ~]# crontab --help
crontab: invalid option -- '-'
crontab: usage error: unrecognized option
usage:  crontab [-u user] file
crontab [-u user] [ -e | -l | -r ]   《==指令语法
(default operation is replace, per 1003.2)
 -e  (edit user's crontab)  《==编辑用户的定时任务
 -l  (list user's crontab)   《==列出用户的定时任务
 -r  (delete user's crontab)   《==删除用户的定时任务
 -i  (prompt before deleting user's crontab) 《==在删除用户的crontab之前提示
 -s  (selinux context)

命令格式

crontab –u (指定用户默认是root)-[e|l|r]

2.1 指令说明

通过crontab我们可以在固定的时间执行指定的系统指令或script脚本。时间间隔的单位是分钟,小时,日,月,周及以上的任意组合(注意:日和周不要组合)。

2.2 使用者权限及定时任务文件

2.3 指令选项说明表

2.4 指令的使用格式

用户所建立的crontab文件存于/var/spool/cron中如:root用户的定时任务配置文件为/var/spool/cron/root。

crontab用户的定时任务一般分为6段空格分隔。系统的定时任务则/etc/crontab分为7段,前5段为时间设定段,第六段以哪个用户执行crontab,第七段为所要执行的命令段如下

01 * * * * root run-parts /etc/cron.hourly
02 4 * * * root run-parts /etc/cron.daily
22 4 * * 0 root run-parts /etc/cron.weekly
42 4 1 * * root run-parts /etc/cron.monthly 

系统的crontab文件是/etc/crontab

[root@linzhongniao ~]# cat /etc/crontab 
SHELL=/bin/bash
PATH=/sbin:/bin:/usr/sbin:/usr/bin
MAILTO=root
HOME=/

# For details see man 4 crontabs

# Example of job definition:
# .---------------- minute (0 - 59)
# |  .------------- hour (0 - 23)
# |  |  .---------- day of month (1 - 31)
# |  |  |  .------- month (1 - 12) OR jan,feb,mar,apr ...
# |  |  |  |  .---- day of week (0 - 6) (Sunday=0 or 7) OR sun,mon,tue,wed,thu,fri,sat
# |  |  |  |  |
# *  *  *  *  * user-name command to be executed
 分 时 日 月 周   用户  任务

2.5 crontab语法格式中时间段得含义

提示:最后一次执行任务的时间是23:30

2.6 crontab语法格式中特殊符号含义

2.7 开启定时任务服务

[root@linzhongniao ~]# chkconfig --list crond
crond   0:off   1:off   2:on3:on4:on5:on6:off
[root@linzhongniao ~]# /etc/init.d/crond status
crond (pid  1837) is running...
[root@linzhongniao ~]# ps -ef|grep crond|grep -v grep
root   1837  1  0 21:58 ?00:00:00 crond
[root@linzhongniao ~]# /etc/init.d/crond restart
Stopping crond:   [  OK  ]
Starting crond:[  OK  ]

2.8 编辑定时任务注意事项

(1)编辑定时任务分钟位上必须用00格式表示

例如,6月3日上午9:00去培训,规则为

00 09 03 06 *

(2)周和日不能同时使用

强调周和日尽量不要同时用,否则可能达不到想要的效果

例如:

每周日上午9:30去上课

30 09 * * 7或者 30 09 * * 0

2.9 服务器时间同步

(1)手动同步时间

[root@linzhongniao ~]# date
Sat Aug  4 12:08:20 CST 2018
[root@linzhongniao ~]# date -s "23:00"
Sat Aug  4 23:00:00 CST 2018
[root@linzhongniao ~]# date
Sat Aug  4 23:00:03 CST 2018
[root@linzhongniao ~]# which ntpdate
/usr/sbin/ntpdate
[root@linzhongniao ~]# /usr/sbin/ntpdate ntp1.aliyun.com
 4 Aug 12:10:21 ntpdate[1700]: step time server 52.163.118.68 offset -39052.961525 sec
[root@linzhongniao ~]# date
Sat Aug  4 12:10:30 CST 2018

(2)用定时任务自动同步

[root@linzhongniao ~]# crontab -l
#sync sys time by linzhongniao at 2018-08-04
 */2 * * * * /usr/sbin/ntpdate ntp1.aliyun.com >/dev/null 2>&1
[root@linzhongniao ~]# /etc/init.d/crond restart
Stopping crond:   [  OK  ]
Starting crond:[  OK  ]
[root@linzhongniao ~]# date -s "23:00"
Sat Aug  4 23:00:00 CST 2018
[root@linzhongniao ~]# date
Sat Aug  4 23:00:06 CST 2018
[root@linzhongniao ~]# date
Sat Aug  4 12:21:53 CST 2018   

机器少还可以和互联网上时间同步,如果有很多服务器,可以搭建一个内部的时间同步服务器ntp server。

提示:如果不加“>/dev/null 2>&1”会因产生垃圾文件导致磁盘inode耗尽的问题。

3.生产环境crontab专业案例

每天晚上12点打包站点目录/var/www/html备份到/data目录下(最好每次按时间生成不同的备份包)

[root@linzhongniao scripts]# cat httpd.sh
#!/bin/bash
cd /var/www/
tar zcfp /data/html_$(date +%Y%m%d%H%M).tar.gz ./html
[root@linzhongniao scripts]# crontab -l|tail -2
#tar /var/www/html by shell scripts by linzhongniao at 201808
00 00 * * * /bin/bash /server/scripts/httpd.sh >/dev/null 2>&1

4.书写定时任务5个基本要领

4.1 为定时任务规则加必要的注释

加必要注释,写定时任务规则时尽可能加上注释(最好是英文注释),这是个好的习惯。

4.2 执行脚本任务前加/bin/sh

执行定时任务时,如果是执行脚本,请尽量在脚本前面加上/bin/sh命令,否则有可能忘了给脚本加执行权限,而无法完成任务。

4.3 在指定用户下执行相关的定时任务

需要root权限执行的任务可以登录到root用户下然后设置,如果不需要root权限,可以登录到普通用户下(也可以直接在root下crontab –u linzhongniao –e的写法直接设置)

切换到linzhongniao用户

[linzhongniao@linzhongniao ~]$ whoami
linzhongniao
[linzhongniao@linzhongniao ~]$ crontab -l
* * * * * /bin/sh tar.sh

不切换用户直接查看定时任务

[root@linzhongniao ~]# crontab -u linzhongniao -l
* * * * * /bin/sh tar.sh

看一下crond用户的配置文件

[root@linzhongniao ~]# ll /var/spool/cron/
total 8
 -rw-------. 1 root root  25 Aug  4 14:25 linzhongniao
 -rw-------. 1 root root 222 Aug  4  2018 root

平时工作中尽量多用crontab –e和crontab –l去编辑和查看定时任务,因为会有语法错误检查。
如果给1000台服务器同时添加系统时间实时同步,不可能一个一个改,此时就需要批量分发工具或批量运维脚本。

4.4 定时任务结尾加>/dev/null 2>&1

/dev/null是特殊的设备,表示黑洞设备或空设备;2>&1表示标准错误输出和标准输出的输出的路径都一样。>/dev/null 2>&1相当于1>/dev/null,2>/dev/null

5.系统定时任务配置文件/etc/crontab

系统定时任务分七段,如果某一台服务器上的用crontab –l查看没有定时任务,就上系统定时任务里面用cat查看。

[root@linzhongniao ~]# cat /etc/crontab 
SHELL=/bin/bash   shell解释器
PATH=/sbin:/bin:/usr/sbin:/usr/bin  PATH变量
MAILTO=root  定义如果任务有输出,发给哪个用户默认是root用户
HOME=/

# For details see man 4 crontabs

# Example of job definition:
# .---------------- minute (0 - 59)
# |  .------------- hour (0 - 23)
# |  |  .---------- day of month (1 - 31)
# |  |  |  .------- month (1 - 12) OR jan,feb,mar,apr ...
# |  |  |  |  .---- day of week (0 - 6) (Sunday=0 or 7) OR sun,mon,tue,wed,thu,fri,sat
# |  |  |  |  |
# *  *  *  *  * user-name command to be executed
  分 时 日 月 周   用户          脚本

通过run-parts使得系统可以定时执行目录下的所有可执行文件

按周执行的配置文件

[root@linzhongniao ~]# tree /etc/cron.weekly
/etc/cron.weekly

0 directories, 0 files

按天执行的配置文件

[root@linzhongniao ~]# ll /etc/cron.daily/
total 24
 -rwx------. 1 root root  180 Jul 10  2003 logrotate
 -rwx------. 1 root root  927 Mar 22  2017 makewhatis.cron
 -rwx------. 1 root root  189 Jan 26  2015 mlocate.cron
 -rwxr-xr-x. 1 root root 2126 Jul 19  2013 prelink
 -rwxr-xr-x. 1 root root  563 Nov 23  2013 readahead.cron
 -rwxr-xr-x. 1 root root  433 Nov  7  2015 tmpwatch

6.生产场景如何调试crontab定时任务

6.1 增加执行频率调试任务

在调试时,把任务执行频率调快一些。如:每分钟、每5分钟执行一次,或者比当前时间推迟5分钟以后或者每2钟执行。按己想象的去执行了,如果没问题再改成需要的任务执行的时间。

强调:有些任务是不允许频繁执行的,例如:定时往数据库里插入数据,这样的任务在测试机上测试好,然后正式线上出现问题的机会就少了。

6.2 调整系统时间调适任务

用正确的执行任务的时间。设置完成后,可以修改下当前时间,改成任务执行时间的前几分钟来测试(或者重启定时任务服务)如:定时任务9:00执行,我们可以把系统时间改成8:55分,然后观察是不是正确执行了,当前时间要比任务时间提前足够长,只在测试服务器上操作,如果生产服务器不要这样处理。

6.3 通过日志输出调试定时任务

在脚本中加入日志输出,然后把输出打到指定的日志中,然后观察日志内容结果。看是否执行或正确执行,或向下面的内容把脚本结果重定向到一个log文件里。比如 tar zcvf命令加-v参数,在把输出放到日志里面,通过日志就可以查看脚本有没有执行。

 */2 * * * * /usr/sbin/ntpdate time.windows.com >>/app/ntpdate.log 

6.4 注意一些任务执行带来的问题

 */1 * * * * echo “==”>>/tmp/oldboy.log >/dev/null 2>&1

这是隐蔽的无法执行的任务配置,原因是前面多了一个>>/tmp/oldboy.log,或者去掉>/dev/null 2>&1。

6.5 注意环境变量导致的定时任务故障

在调试java程序的时候,注意环境变量,要把环境变量的定义追加到脚本里,重新export一下。一般都放在全局变量/etc/profile里面,但是用定时任务执行脚本还需要重新加载一下环境变量。

export PATH="/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin"

6.6 通过定时任务日志/var/log/cron调试定时任务

[root@linzhongniao app]# tail -f /var/log/cron
Aug  5 11:01:01 localhost run-parts(/etc/cron.hourly)[2054]: starting 0anacron
Aug  5 11:01:02 localhost anacron[2068]: Anacron started on 2018-08-05
Aug  5 11:01:02 localhost run-parts(/etc/cron.hourly)[2070]: finished 0anacron
Aug  5 11:01:02 localhost anacron[2068]: Will run job `cron.daily' in 34 min.
Aug  5 11:01:02 localhost anacron[2068]: Jobs will be executed sequentially
Aug  5 11:02:01 localhost CROND[2075]: (root) CMD (/usr/sbin/ntpdate time.windows.com >/app/ntpdate.log)

7.生产定时任务注意事项

7.1 export变量问题

crontab执行shell时只能识别不多的系统环境变量,普通变量是无法识别的。如果在编写的脚本中需要使用变量,最好使用export重新声明一下该变量,脚本才能正常执行。例如生产中和java相关的服务任务和脚本。也可以在脚本中添加PATH环境变量加完PATH环境变量就不用写执行命令全路径了。例如下面的/bin/tar,就可以不写了。

[root@linzhongniao ~]# cat /server/scripts/tar.sh
#!/bin/bash
export PATH="/usr/local/sbin:/usr/local/bin:/sbin:/bin:/usr/sbin:/usr/bin:/root/bin"
cd /server/
/bin/tar zcf backup_$(date +%Y%m%d%H%M).tar.gz ./scripts

7.2 任务路径问题

一定要用绝对路径不要用相对路径。推荐定时执行脚本。

7.3 脚本权限问题

要加/bin/sh执行,也可以不在定时任务中用/bin/sh就要给脚本可执行权限。

7.4 时间变量问题

“%”百分号在crontab任务中认为是newline,需要用“\”转义。crontab任务命令中,如果有“date +%Y%m%d%H%M”(或date +%Y-%m-%d-%H:%M),必须替换为“date +\%Y\%m\%d\%H\%M”,但写在脚本中的“%”百分号就不需要转义了。

7.5 定时任务加注释

写定时任务要加上注释如:什么人,什么时间,因为谁,做了什么事都要标记清楚如谁与2018-08-01日在http服务器上做了10分钟同步的操作。

7.6 使用脚本程序替代命令

使用脚本执行任务可以减少错误,提升效率,规范,是个好习惯。

7.7 定时任务脚本的问题

定时任务脚本中的程序命令尽量用全路径。

8.生产环境定时任务重现生产no space left

企业inode被填满的企业案例

问题:修改用户密码和添加用户时出现下面错误,但是用df –h发现磁盘没满,请问为什么?

  1、修改密码时报错 passwd: Authentication token manipulation error
  2、添加用户报错:unable to lock password file

分析思路:查看/etc/passwd和/etc/shadow的文件权限没有问题,再使用命令strace -f passwd 追踪分析原因,看到关键报错信息:“No space left on device”。最后用df -hi查看发现根分区的inode满了。

解决办法:

(1 打开邮件服务,打开邮件服务就把邮件目录清空了不要直接删除文件,生产环境邮件服务是不开的。

(2 在定时任务最后加>/dev/null 2>&1将输出内容定义到空。这样就不会产生垃圾文件了。