应用程序的监控:
1、指标监控;
2、日志监控。
指标监控:对一定时间段内的性能指标进行测量,然后通过时间序列的方式,进行处理、存储和告警。
日志监控:可以提供更详细的上下文信息,通常通过ELK技术栈,来进行收集、索引和图形化展示。
应用程序瓶颈
1、资源瓶颈。CPU、内存、磁盘和文件系统I/O、网络以及内核资源等各类软硬件资源出现瓶颈。可从使用率、饱和度以及错误数这三个方面来分析。
2、依赖服务的瓶颈。如数据库、分布式缓存、中间件等应用程序,直接或间接调用的服务出现了性能问题,从而导致应用成效的响应变慢,或者错误率升高。
3、应用程序自身的性能问题。包括多线程处理不当、死锁、业务算法的复杂度过高等。
查看TCP 连接数的汇总情况,使用命令ss,观察TCP的连接数:ss -s
应用程序的核心指标:请求数、错误率、响应时间。这些指标不仅直接关系用户的使用体验,还反映应用整体的可用性和整体性。
性能监控的 USE(Utilization Saturation and Errors)法
-
使用率,表示资源用于服务的时间或容量百分比。100% 的使用率,表示容量已经用尽或者全部时间都用于服务。
-
饱和度,表示资源的繁忙程度,通常与等待队列的长度相关。100% 的饱和度,表示资源无法接受更多的请求。
-