crontab是Unix和Linux用于设置周期性被执行的指令,是互联网很常用的技术,很多任务都会设置在crontab循环执行,如果不使用crontab,那么任务就是常驻程序,这对你的程序要求比较高,一个要求你的程序是24X7小时不宕机,一个是要求你的调度程序比较可靠,实际工作中,90%的程序都没有必要花这么多时间和精力去解决上面的两个问题的,只需要写好自己的业务逻辑,通过crond这个工业级程序去调度就行了,crond的可靠性,健壮性,是毫无疑问的。
使用者的配置
使用者想要创建循环型工作排程时,使用的是 crontab 这个命令啦~不过,为了安全性的问题,我们可以限制使用 crontab 的使用者帐号喔!使用的限制数据有:
- /etc/cron.allow:
将可以使用 crontab 的帐号写入其中,若不在这个文件内的使用者则不可使用 crontab; - /etc/cron.deny:
将不可以使用 crontab 的帐号写入其中,若未记录到这个文件当中的使用者,就可以使用 crontab 。
与 at 很像吧!同样的,以优先顺序来说, /etc/cron.allow 比 /etc/cron.deny 要优先, 而判断上面,这两个文件只选择一个来限制而已,因此,建议你只要保留一个即可, 免得影响自己在配置上面的判断!一般来说,系统默认是保留 /etc/cron.deny , 你可以将不想让他运行 crontab 的那个使用者写入 /etc/cron.deny 当中,一个帐号一行!
当使用者使用 crontab 这个命令来创建工作排程之后,该项工作就会被纪录到 /var/spool/cron/ 里面去了,而且是以帐号来作为判别的喔!举例来说, dmtsai 使用 crontab 后, 他的工作会被纪录到 /var/spool/cron/dmtsai 里头去!但请注意,不要使用 vi 直接编辑该文件, 因为可能由於输入语法错误,会导致无法运行 cron 喔!另外, cron 运行的每一项工作都会被纪录到 /var/log/cron 这个登录档中,所以罗,如果你的 Linux 不知道有否被植入木马时,也可以搜寻一下 /var/log/cron 这个登录档呢!
好了,那么我们就来聊一聊 crontab 的语法吧!
[root@www ~]# crontab [-u username] [-l|-e|-r]
选项与参数:
-u :只有 root 才能进行这个任务,亦即帮其他使用者创建/移除 crontab 工作排程;
-e :编辑 crontab 的工作内容
-l :查阅 crontab 的工作内容
-r :移除所有的 crontab 的工作内容,若仅要移除一项,请用 -e 去编辑。
范例一:用 dmtsai 的身份在每天的 12:00 发信给自己
[dmtsai@www ~]$ crontab -e
# 此时会进入 vi 的编辑画面让您编辑工作!注意到,每项工作都是一行。
0 12 * * * mail dmtsai -s "at 12:00" < /home/dmtsai/.bashrc
#分 时 日 月 周 |<==============命令串========================>|
|
默认情况下,任何使用者只要不被列入 /etc/cron.deny 当中,那么他就可以直接下达『 crontab -e 』去编辑自己的例行性命令了!整个过程就如同上面提到的,会进入 vi 的编辑画面, 然后以一个工作一行来编辑,编辑完毕之后输入『 :wq 』储存后离开 vi 就可以了! 而每项工作 (每行) 的格式都是具有六个栏位,这六个栏位的意义为:
代表意义 | 分钟 | 小时 | 日期 | 月份 | 周 | 命令 |
数字范围 | 0-59 | 0-23 | 1-31 | 1-12 | 0-7 | 呀就命令啊 |
比较有趣的是那个『周』喔!周的数字为 0 或 7 时,都代表『星期天』的意思!另外, 还有一些辅助的字符,大概有底下这些:
特殊字符 | 代表意义 |
*(星号) | 代表任何时刻都接受的意思!举例来说,范例一内那个日、月、周都是 * , 就代表著『不论何月、何日的礼拜几的 12:00 都运行后续命令』的意思! |
,(逗号) | 代表分隔时段的意思。举例来说,如果要下达的工作是 3:00 与 6:00 时,就会是:
0 3,6 * * * command时间参数还是有五栏,不过第二栏是 3,6 ,代表 3 与 6 都适用! |
-(减号) | 代表一段时间范围内,举例来说, 8 点到 12 点之间的每小时的 20 分都进行一项工作:
20 8-12 * * * command仔细看到第二栏变成 8-12 喔!代表 8,9,10,11,12 都适用的意思! |
/n(斜线) | 那个 n 代表数字,亦即是『每隔 n 单位间隔』的意思,例如每五分钟进行一次,则:*/5 * * * * command很简单吧!用 * 与 /5 来搭配,也可以写成 0-59/5 ,相同意思! |
我们就来搭配几个例子练习看看吧!底下的案例请实际用 dmtsai 这个身份作看看喔!后续的动作才能够搭配起来!
例题:
假若你的女朋友生日是 5 月 2 日,你想要在 5 月 1 日的 23:59 发一封信给他,这封信的内容已经写在 /home/dmtsai/lover.txt 内了,该如何进行?
答:
直接下达 crontab -e 之后,编辑成为:
59 23 1 5 * mail kiki < /home/dmtsai/lover.txt那样的话,每年 kiki 都会收到你的这封信喔!(当然罗,信的内容就要每年变一变啦!) |
例题:
假如每五分钟需要运行 /home/dmtsai/test.sh 一次,又该如何?
答:
同样使用 crontab -e 进入编辑:
*/5 * * * * /home/dmtsai/test.sh |
那个 crontab 每个人都只有一个文件存在,就是在 /var/spool/cron 里面啊! 还有建议您:『命令下达时,最好使用绝对路径,这样比较不会找不到运行档喔!』
例题:
假如你每星期六都与朋友有约,那么想要每个星期五下午 4:30 告诉你朋友星期六的约会不要忘记,则:
答:
还是使用 crontab -e 啊!
30 16 * * 5 mail friend@his.server.name < /home/dmtsai/friend.txt |
真的是很简单吧!呵呵!那么,该如何查询使用者目前的 crontab 内容呢?我们可以这样来看看:
[dmtsai@www ~]$ crontab -l
59 23 1 5 * mail kiki < /home/dmtsai/lover.txt
*/5 * * * * /home/dmtsai/test.sh
30 16 * * 5 mail friend@his.server.name < /home/dmtsai/friend.txt
# 注意,若仅想要移除一项工作而已的话,必须要用 crontab -e 去编辑~
# 如果想要全部的工作都移除,才使用 crontab -r 喔!
[dmtsai@www ~]$ crontab -r
[dmtsai@www ~]$ crontab -l
no crontab for dmtsai
|
看到了吗? crontab 『整个内容都不见了!』所以请注意:『如果只是要删除某个 crontab 的工作项目,那么请使用 crontab -e 来重新编辑即可!』如果使用 -r 的参数,是会将所有的 crontab 数据内容都删掉的!千万注意了!
这个『 crontab -e 』是针对使用者的 cron 来设计的,如果是『系统的例行性任务』时, 该怎么办呢?是否还是需要以 crontab -e 来管理你的例行性工作排程呢?当然不需要,你只要编辑 /etc/crontab 这个文件就可以啦!有一点需要特别注意喔!那就是 crontab -e 这个 crontab 其实是 /usr/bin/crontab 这个运行档,但是 /etc/crontab 可是一个『纯文字档』喔!你可以 root 的身份编辑一下这个文件哩!
基本上, cron 这个服务的最低侦测限制是『分钟』,所以『 cron 会每分钟去读取一次 /etc/crontab 与 /var/spool/cron 里面的数据内容 』,因此,只要你编辑完 /etc/crontab 这个文件,并且将他储存之后,那么 cron 的配置就自动的会来运行了!
Tips: 在 Linux 底下的 crontab 会自动的帮我们每分钟重新读取一次 /etc/crontab 的例行工作事项,但是某些原因或者是其他的 Unix 系统中,由於 crontab 是读到内存当中的,所以在你修改完 /etc/crontab 之后,可能并不会马上运行, 这个时候请重新启动 crond 这个服务吧!『/etc/init.d/crond restart』 |
废话少说,我们就来看一下这个 /etc/crontab 的内容吧!
[root@www ~]# cat /etc/crontab
SHELL=/bin/bash <==使用哪种 shell 介面
PATH=/sbin:/bin:/usr/sbin:/usr/bin <==运行档搜寻路径
MAILTO=root <==若有额外STDOUT,以 email将数据送给谁
HOME=/ <==默认此 shell 的家目录所在
# run-parts
01 * * * * root run-parts /etc/cron.hourly <==每小时
02 4 * * * root run-parts /etc/cron.daily <==每天
22 4 * * 0 root run-parts /etc/cron.weekly <==每周日
42 4 1 * * root run-parts /etc/cron.monthly <==每个月 1 号
分 时 日 月 周 运行者身份 命令串
|
看到这个文件的内容你大概就了解了吧!呵呵,没错!这个文件与将刚刚我们下达 crontab -e 的内容几乎完全一模一样!只是有几个地方不太相同:
- MAILTO=root:
这个项目是说,当 /etc/crontab 这个文件中的例行性工作的命令发生错误时,或者是该工作的运行结果有 STDOUT/STDERR 时,会将错误信息或者是萤幕显示的信息传给谁?默认当然是由系统直接寄发一封 mail 给 root 啦!不过, 由於 root 并无法在用户端中以 POP3 之类的软件收信,因此,鸟哥通常都将这个 e-mail 改成自己的帐号,好让我随时了解系统的状况!例如: MAILTO=dmtsai@my.host.name - PATH=....:
还记得我们在第十一章的 BASH 当中一直提到的运行档路径问题吧! 没错啦!这里就是输入运行档的搜寻路径!使用默认的路径配置就已经很足够了! - 01 * * * * root run-parts /etc/cron.hourly:
这个 /etc/crontab 里面预配置义出四项工作任务,分别是每小时、每天、每周及每个月分别进行一次的工作! 但是在五个栏位后面接的并不是命令,而是一个新的栏位,那就是『运行后面那串命令的身份』为何!这与使用者的 crontab -e 不相同。由於使用者自己的 crontab 并不需要指定身份,但 /etc/crontab 里面当然要指定身份啦!以上表的内容来说,系统默认的例行性工作是以 root 的身份来进行的。
那么后面那串命令是什么呢?你可以使用『 which run-parts 』搜寻看看,其实那是一个 bash script 啦!如果你直接进入 /usr/bin/run-parts 去看看, 会发现这支命令会将后面接的『目录』内的所有文件捉出来运行!这也就是说『 如果你想让系统每小时主动帮你运行某个命令,将该命令写成 script,并将该文件放置到 /etc/cron.hourly/ 目录下即可』的意思!
现在你知道系统是如何进行他默认的一堆例行性工作排程了吗?如果你下达『 ll /etc/cron.daily 』就可以看到一堆文件, 那些文件就是系统提供的 script ,而这堆 scripts 将会在每天的凌晨 4:02 开始运行!这也是为啥如果你是夜猫族, 就会发现奇怪的是,Linux 系统为何早上 4:02 开始会很忙碌的发出一些硬盘跑动的声音!因为他必须要进行 makewhatis, updatedb, rpm rebuild 等等的任务嘛!
由於 CentOS 提供的 run-parts 这个 script 的辅助,因此 /etc/crontab 这个文件里面支持两种下达命令的方式, 一种是直接下达命令,一种则是以目录来规划,例如:
- 命令型态
01 * * * * dmtsai mail -s "testing" kiki < /home/dmtsai/test.txt
以 dmtsai 这个使用者的身份,在每小时运行一次 mail 命令。 - 目录规划
*/5 * * * * root run-parts /root/runcron
创建一个 /root/runcron 的目录,将要每隔五分钟运行的『可运行档』都写到该目录下, 就可以让系统每五分钟运行一次该目录下的所有可运行档。
好!你现在大概了解了这一个咚咚吧!OK!假设你现在要作一个目录,让系统可以每 2 分钟去运行这个目录下的所有可以运行的文件,你可以写下如下的这一行在 /etc/crontab 中:
*/2 * * * * root run-parts /etc/cron.min
当然罗, /etc/cron.min 这个目录是需要存在的喔!那如果我需要运行的是一个『程序』而已, 不需要用到一个目录呢?该如何是好?例如在侦测网络流量时,我们希望每五分钟侦测分析一次, 可以这样写:
*/5 * * * * root /bin/mrtg /etc/mrtg/mrtg.cfg
如何!创建例行性命令很简单吧!如果你是系统管理员而且你的工作又是系统维护方面的例行任务时, 直接修改 /etc/crontab 这个文件即可喔!又便利,又方便管理呢!
有的时候,我们以系统的 cron 来进行例行性工作的创建时,要注意一些使用方面的特性。 举例来说,如果我们有四个工作都是五分钟要进行一次的,那么是否这四个动作全部都在同一个时间点进行? 如果同时进行,该四个动作又很耗系统资源,如此一来,每五分钟不是会让系统忙得要死? 呵呵!此时好好的分配一些运行时间就 OK 啦!所以,注意一下:
- 资源分配不均的问题
当大量使用 crontab 的时候,总是会有问题发生的,最严重的问题就是『系统资源分配不均』的问题, 以鸟哥的系统为例,我有侦测主机流量的资讯,包括:
- 流量
- 区域内其他 PC 的流量侦测
- CPU 使用率
- RAM 使用率
- 线上人数即时侦测
如果每个流程都在同一个时间启动的话,那么在某个时段时,我的系统会变的相当的繁忙, 所以,这个时候就必须要分别配置啦!我可以这样做:
[root@www ~]# vi /etc/crontab
1,6,11,16,21,26,31,36,41,46,51,56 * * * * root CMD1
2,7,12,17,22,27,32,37,42,47,52,57 * * * * root CMD2
3,8,13,18,23,28,33,38,43,48,53,58 * * * * root CMD3
4,9,14,19,24,29,34,39,44,49,54,59 * * * * root CMD4
|
看到了没?那个『 , 』分隔的时候,请注意,不要有空白字节!(连续的意思)如此一来, 则可以将每五分钟工作的流程分别在不同的时刻来工作!则可以让系统的运行较为顺畅呦!
- 取消不要的输出项目
另外一个困扰发生在『 当有运行成果或者是运行的项目中有输出的数据时,该数据将会 mail 给 MAILTO 配置的帐号 』,好啦,那么当有一个排程一直出错(例如 DNS 的侦测系统当中,若 DNS 上一级主机挂掉,那么你就会一直收到错误信息!)怎么办?呵呵!还记得十一章谈到的数据流重导向吧? 直接以『命令重导向』将输出的结果输出到 /dev/null 这个垃圾桶当中就好了!
- 安全的检验
很多时候被植入木马都是以例行命令的方式植入的,所以可以藉由检查 /var/log/cron 的内容来视察是否有『非您配置的 cron 被运行了?』这个时候就需要小心一点罗!
- 周与日月不可同时并存
另一个需要注意的地方在於:『你可以分别以周或者是日月为单位作为循环,但你不可使用「几月几号且为星期几」的模式工作』。 这个意思是说,你不可以这样编写一个工作排程:
30 12 11 9 5 root echo "just test" <==这是错误的写法
|
本来你以为九月十一号且为星期五才会进行这项工作,无奈的是,系统可能会判定每个星期五作一次,或每年的 9 月 11 号分别进行,如此一来与你当初的规划就不一样了~所以罗,得要注意这个地方!上述的写法是不对的喔!
转载自: http://vbird.dic.ksu.edu.tw/linux_basic/0430cron_3.php