coroot 的架构设计上基于了prometheus,同时也依赖了ebpf(已经成为业界问题分析的标配了),同时官方也开源了不少
exporter,比如node,pg,aws 。。。。
包含的特性
- tcp 链接追踪
包含了tcp 事件,比如connect,listen - 日志提取
包含了/var/log,journald, docker json 文件日志, containerd (cri 日志) - Delay accounting (延迟记账)
方便分析io,以及网络的时间情况(目前基于了netlink) - oom 事件追踪
- 即时信息获取
比较适合云端服务
说明
日志的metrics 解决是一个比较有意思的东西,我们一般不会基于prometheus 直接存储日志的metrics,但是coroot 使用了,设计上还是值得学习的
grafana 的loki 是基于基于prometheus 的日志分析工具,只是使用了自己的模式(独立的存储模式,使用了类似prometheus 的查询),官方包含了
一个demo 可以体验下
## 参考资料
https://coroot.com/docs/coroot-community-edition
https://github.com/coroot/coroot
https://github.com/coroot/coroot-node-agent
https://coroot.com/blog/mining-logs-from-unstructured-logs
https://coroot.com/demo
https://coroot.com/blog