一、监控体系(自底向上)
系统层监控
⚫ 系统监控:CPU、Load、Memory、Swap、Disk IO、Processes、Kernel Parameters、……
⚫ 网络监控:网络设备、工作负载、网络延迟、丢包率、……
中间件及基础设施类系统监控
⚫ 消息中间件:Kafka、RocketMQ和RabbitMQ等;
⚫ Web服务容器:Tomcat和Jetty等;
⚫ 数据库及缓存系统:MySQL、PostgreSQL、MogoDB、ElasticSearch和Redis等;
⚫ 数据库连接池:ShardingSpere等;
⚫ 存储系统:Ceph等
应用层监控
⚫ 用于衡量应用程序代码的状态和性能
业务层监控
⚫ 用于衡量应用程序的价值,例如电子商务网站上的销售量
⚫ QPS、DAU日活、转化率;
业务接口:登录数、注册数、订单量、搜索量和支付量等;
二、云原生时代的可观测性
可观测性系统
指标监控(Metrics):随时间推移产生的一些与监控相关的可聚合数据点;
日志监控(Logging):离散式的日志或事件;
链路跟踪(Tracing):分布式应用调用链跟踪;
CNCF将可观测性和数据分析归类一个单独的类别,且划分成了4个子类
监控系统:以Prometheus等为代表;
日志系统:以ElasticStack和PLG Stack等为代表;
分布式调用链跟踪系统:以Zipkin、Jaeger、SkyWalking、Pinpoint等为代表;
混沌工程系统:以ChaosMonkey和ChaosBlade等为代表