确定监控的对象 指标 报警机制
硬件监控:温度 硬盘
系统监控:
CPU:上下文切换(context switchs) 运行队列(Run queue) 使用率(utilization)常用工具 top vmstat mpstat
内存:使用率 SWAP使用率 也可以通过内存的使用率曲线发现某些服务的内存溢出 常用工具free vmstat
IO:磁盘IO 网络IO 常用工具 iostat iotop iftop
TCP监控:查看tcp连接情况 常用工具 netstat ss
其它项:进程数 登录用户及历史记录 openfile
应用监控:各类服务如nginx mysql 等
以上监控集合:Zabbix
流量分析:
网络监控
安全监控
业务监控
日志监控:logstash(收集) elasticsearch(存储+搜索) kibana(展示)
自动化
可视化