• monit 配置详解(monitrc)


    monitrc是Monit的主配置文件(控制文件)。
    monitrc的内容主要分为全局(golbal)和服务(services)两个部分。
    默认情况下monitrc文件在/etc/monit目录下。

    ###############################################################################
    ## 配置内容书写规范
    ###############################################################################
    # 注释以“#”开头并延伸到行尾
    # 关键字不区分大小写
    # 所有路径必须完全限定路径,以“/”开头
    
    ###############################################################################
    ## Global section 全局部分
    ###############################################################################
      set daemon 120
      # 设置以守护进程的方式运行Monit,每隔2分钟检查一次服务
      #   with start delay 240    
      # 第一次启动时延迟检查4分钟(默认情况下,Monit启动后立即进行检查)
      set logfile /var/log/monit.log
      # 设置系统日志记录。如果要改为记录到独立的日志文件,请指定日志文件的完整路径
      # set pidfile /var/run/monit.pid
      # 设置Monit实例的PID文件路径,PID文件记录了Monit实例进程的进程编号(PID),默认情况下,文件放置在
      # $HOME/.monit.pid
      set idfile /var/lib/monit/id
      # 设置Monit实例的id文件路径。id文件记录了Monit实例的唯一ID(标识),id在第一次Monit启动时生成并存储。默# 认情况下,文件放置在$HOME/.monit.id
      set statefile /var/lib/monit/state
      # 设置在每个周期中保存监视状态的Monit状态文件的位置。默认情况下,文件放在$HOME/.monit.state. 如果状态文
      # 件存储在持久文件系统中,Monit在重新启动时将恢复监视状态。如果它在临时文件系统上,状态将在重新启动时丢
      # 失。
    
      # set limits {
      #     programOutput:     512 B,      # 检查程序输出截断限制
      #     sendExpectBuffer:  256 B,      # send/expect协议测试限制
      #     fileContentBuffer: 512 B,      # 文件内容缓冲区限制
      #     httpContentBuffer: 1 MB,       # HTTP内容缓冲区限制
      #     networkTimeout:    5 seconds   # 网络I/O超时限制
      #     programTimeout:    300 seconds # 检查程序超时限制
      #     stopTimeout:       30 seconds  # 服务停止超时限制
      #     startTimeout:      30 seconds  # 服务启动超时限制
      #     restartTimeout:    30 seconds  # 服务重启超时限制
      # }
      # 设置各种限制。以上示例显示了默认值。
    
      # set ssl {
      #     verify     : enable, # 验证SSL证书(默认禁用,但强烈建议)
      #     selfsigned : allow   # 允许自签名SSL证书(默认情况下拒绝)
      # }
      # 设置全局SSL选项
    
      # set mailserver mail.bar.baz,               # 主邮件服务器
      #                backup.bar.baz port 10025,  # 备邮件服务器 on port 10025
      #                localhost                   # 如果没有邮件服务器就将警报发送到本地
      # 设置要传递警报的邮件服务器列表。可以使用逗号分隔符指定多个服务器。如果第一个邮件服务器发生故障,Monit
      # 将使用列表中的第二个邮件服务器,依此类推。默认情况下,Monit可以使用port选项覆盖它
    
      set eventqueue
          basedir /var/lib/monit/events # 设置存储事件的基本目录
          slots 100                     # 可选择限制队列大小
      # 默认情况下,如果没有可用的邮件服务器,Monit将删除警报事件。如果要保留警报以便以后重试传递,可以使
      # 用"eventqueue"语句。存储未送达警报的基本目录由"basedir"选项指定。您可以使用"slots"选项来限制队列大小
      # (如果省略,队列将受到后端文件系统中可用空间的限制)
    
      # set mmonit http://monit:monit@192.168.1.10:8080/collector
      #     # with timeout 30 seconds              # 默认超时5秒
      #     # and register without credentials     # 不注册凭据
      # 设置与M/Monit通信,向M/Monit发送状态和事件(有关M/Monit的更多信息,请参阅http://mminit.com/). 默认情
      # 况下,Monit使用M/Monit注册凭据,以便M/Monit可以顺利地与Monit通信,并且您不必在M/Monit中手动注册Monit
      # 凭据。可以使用下面的注释掉选项禁用凭证注册。但是,如果安全是一个问题,我们建议在与M/Monit通信时使用
      # https,并加密发送凭据。一般不使用。
    
      # set mail-format {
      #   from:    monit@$HOST
      #   subject: monit alert --  $EVENT $SERVICE
      #   message: $EVENT Service $SERVICE
      #                 Date:        $DATE
      #                 Action:      $ACTION
      #                 Host:        $HOST
      #                 Description: $DESCRIPTION
      #
      #            Your faithful employee,
      #            Monit
      # }
      # 设置邮件格式,默认情况下,如果缺少邮件格式"mail-format"语,Monit将使用以上格式发送警报。
    
      # set alert sysadm@foo.bar                                     # 接受所有警报
      # set alert your-name@your.domain not on { instance, action }  # 不接受筛选器{}中的的警报
      # 设置警报关联的邮箱和筛选器,如果不设置任何筛选器则关联邮箱接受所有警报。
      # 当Monit启动、停止或执行用户启动的操作时,不要发出警报。建议使用上面第二个筛选器,以避免在一般情况下收
      # 到警报。
    
      # set httpd port 2812 and
      #     use address localhost  # 仅接受本地主机的连接
      #     allow localhost        # 允许从localhost访问HTTP接口
      #     allow admin:monit      # 当管理者通过WEB访问时,需要使用账号密码验证身份"admin:monit"
      # Monit有一个嵌入式HTTP接口,可用于从WEB界面查看所监视服务的状态和管理服务。如果要从命令行发出Monit命
      # 令,例如“monit status”或“monit restart service”,则也需要HTTP接口。原因是Monit客户端使用HTTP接口
      # 将这些命令发送到正在运行的Monit守护程序。如果要为HTTP接口启用SSL,请参阅monitwiki。
    
    ###############################################################################
    ## Services 服务部分
    ###############################################################################
    # 以下是一些配置示例。
    
      #  check system $HOST
      #    if loadavg (1min) > 4 then alert
      #    if loadavg (5min) > 2 then alert
      #    if cpu usage > 95% for 10 cycles then alert
      #    if memory usage > 75% then alert
      #    if swap usage > 25% then alert
      # 检查一般系统资源,如平均负载、cpu和内存使用情况。每个测试都指定一个资源、条件和测试失败时要执行的操
      # 作。
    
      #  check file apache_bin with path /usr/local/apache/bin/httpd
      #    if failed checksum and 
      #       expect the sum 8f7f419955cefa0b33a2ba316cba3659 then unmonitor
      #    if failed permission 755 then unmonitor
      #    if failed uid root then unmonitor
      #    if failed gid root then unmonitor
      #    alert security@foo.bar on {
      #           checksum, permission, uid, gid, unmonitor
      #        } with the mail-format { subject: Alarm! }
      #    group server
      # 检查文件是否存在、校验和、权限、uid和gid。除了全局部分中的警报收件人外,还可以通过指定本地警报处理程
      # 序将自定义警报发送到其他收件人。可以使用GROUP选项对服务进行分组。可以通过重复“group name”语句指定多
      # 个组。
    
      #  check process apache with pidfile /usr/local/apache/logs/httpd.pid
      #    start program = "/etc/init.d/httpd start" with timeout 60 seconds
      #    stop program  = "/etc/init.d/httpd stop"
      #    if cpu > 60% for 2 cycles then alert
      #    if cpu > 80% for 5 cycles then restart
      #    if totalmem > 200.0 MB for 5 cycles then restart
      #    if children > 250 then restart
      #    if loadavg(5min) greater than 10 for 8 cycles then stop
      #    if failed host www.tildeslash.com port 80 protocol http 
      #       and request "/somefile.html"
      #    then restart
      #    if failed port 443 protocol https with timeout 15 seconds then restart
      #    if 3 restarts within 5 cycles then unmonitor
      #    depends on apache_bin
      #    group server
      # 检查进程是否正在运行(在本例中为Apache),以及它是否响应HTTP和HTTPS请求。检查其资源使用情况,如cpu和
      # 内存,以及子进程的数量。如果进程没有运行,Monit将在默认情况下重新启动它。如果服务经常重新启动而问题仍
      # 然存在,可以使用"unmonitor"语句禁用监视。此服务依赖于上面定义的另一个服务(apache_bin)
    
      #  check filesystem datafs with path /dev/sdb1
      #    start program  = "/bin/mount /data"
      #    stop program  = "/bin/umount /data"
      #    if failed permission 660 then unmonitor
      #    if failed uid root then unmonitor
      #    if failed gid disk then unmonitor
      #    if space usage > 80% for 5 times within 15 cycles then alert
      #    if space usage > 99% then stop
      #    if inode usage > 30000 then alert
      #    if inode usage > 99% then stop
      #    group server
      # 检查文件系统权限、uid、gid、空间和inode使用情况。其他服务(如数据库)可能依赖于此资源,在文件系统变满
      # 和数据丢失之前,可能会向这些服务级联自动优雅的停止。
    
      #  check file database with path /data/mydatabase.db
      #    if failed permission 700 then alert
      #    if failed uid data then alert
      #    if failed gid data then alert
      #    if timestamp > 15 minutes then alert
      #    if size > 100 MB then exec "/my/cleanup/script" as uid dba and gid dba
      # 检查文件的时间戳。在这个例子中,我们测试一个文件是否超过15分钟,如果它没有被更新,我们会假设它有问
      # 题。另外,如果文件大小超过给定的限制,请执行脚本
    
      #  check directory bin with path /bin
      #    if failed permission 755 then unmonitor
      #    if failed uid 0 then unmonitor
      #    if failed gid 0 then unmonitor
      # 检查目录权限、uid和gid。如果目录不属于uid为0且gid为0的用户,则会触发事件。
    
      #  check host myserver with address 192.168.1.1
      #    if failed ping then alert
      #    if failed port 3306 protocol mysql with timeout 15 seconds then alert
      #    if failed port 80 protocol http
      #       and request /some/path with content = "a string"
      #    then alert
      # 通过发出ping测试检查远程主机的可用性,并检查来自web服务器的响应的内容。最多发送三个ping,并执行到端口
      # 的连接和应用程序级网络检查
    
      #  check network public with interface eth0
      #    if failed link then alert
      #    if changed link then alert
      #    if saturation > 90% then alert
      #    if download > 10 MB/s then alert
      #    if total upload > 1 GB in last hour then alert
      # 检查网络链路状态(上/下)、链路容量变化、饱和和带宽使用情况.
    
      #  check program myscript with path /usr/local/bin/myscript.sh
      #    if status != 0 then alert
      # 检查自定义程序状态输出,执行脚本"/usr/local/bin/myscript.sh",如果脚本执行完成后系统的状态值不等于0,
      # 则报警
    
    ###############################################################################
    ## Includes 附加部分
    ###############################################################################
    # 可以使用"include"包含来自其他文件或目录的附加配置文件,将部分配置独立一个配置文件,便于管理。
       include /etc/monit/conf.d/*
       include /etc/monit/conf-enabled/*
    
    
  • 相关阅读:
    网络性能测试工具iperf详解
    linux下的抓包工具tshark和 tcpdump用法
    linux下网络发包工具
    >/dev/null 2>&1 的作用
    linux screen 命令详解
    wget 命令操作实例
    Centos Linux release 7.2.15ll (core) yum 安装java环境
    日志监听
    java 身份证工具类
    java 生成微信的二维码 工具类
  • 原文地址:https://www.cnblogs.com/network-ren/p/14267613.html
Copyright © 2020-2023  润新知