参考《全栈性能测试修炼宝典JMeter实战》第九章 性能监控诊断 第二节 系统性能分析思路和第三节 定位分析
系统在工作负载中的性能受到许多因素影响,处理器速度、内存容量、网络或磁盘I/O控制器的数量以及磁盘的容量和速度是所以工作负荷的重要性能特征组件。还有其他应用程序自身的性能特征、工作负荷的特性、应用程序间的通信行为、磁盘或网络上的数据访问模式,还有终端用户对应用程序的使用模型。对特定工作负荷调优时,常常首先要假定许多物理环境特征,例如处理器数量、处理器类型、磁盘数量等保持不变。性能分析的主要目标是识别出工作负荷中哪些组件是当前提高性能和整体吞吐率的瓶颈,以及当工作负荷已经导致硬件能力饱和时,哪些硬件配置的改进会提高该工作负荷的吞吐率和性能。主要从以下几块进行分析:
一、CPU
CPU是操作系统中运行的根本,他的执行速度与性能好坏很大程度上决定了系统整体的性能快慢,现在的cpu已经由之前的单核发展到多核,使得处理能力更强。当cpu处于满负载状态时,我们要结合系统附带的一些监控分析工具,检查系统日志等辅助分析cpu的使用情况。
Linux下查看cpu性能命令:
查看物理cpu个数:cat /proc/cpuinfo |grep "physical id"|sort|uniq|wc -l
查看每个物理cpu的核数量:cat /proc/cpuinfo |grep "cpu cores"|wc -l
查看cpu和cpu核数量的使用数量:cat /proc/cpuinfo |grep "processor"|wc -l
实时监控CPU的使用情况:top
其他命令:vmstat、sar、dstat、mpstat、ps
定位分析:
当系统利用率大于50%时,需要关注;大于70%需要密切关注;大于90%时,情况比较严重
二、内存
内存太小会阻塞进程,甚至会导致应用程序被杀死,更严重的引起系统重启。内存太大,容易浪费。同时也要兼顾虚拟内存的大小,当系统的物理内存不够用的时候,就需要物理内存释放一部分以供程序正常使用。这些被释放的空间被临时保持到虚拟内存空间中,等需要时再次从虚拟内存中恢复保存的数据到物理内存。系统总是在内存不够用的时候才切换内存。
Linux下内存查看命令:free –m
其他命令:vmstat、sar、dstat、top、ps
定位分析:
当系统利用率大于50%时,需要关注;大于70%需要密切关注;大于90%时,情况比较严重
三、网络
系统之间的通信是通过网络进行传输的,因此时间、网络延迟、阻塞等都可以影响系统性能。
在系统中,要考虑对应的网络是否到达、防火墙是否开启、端口的访问、宽带是否被限制、路由的寻址、网络的时延等
定位分析:
通过命令sar、ifconfig、netstat以及查看net的dev速率,通过查看发现收发包的吞吐速率达到网卡的最大上限,网络数据报文有因为这类原因2⃣而引发的丢包、阻塞等现象。测试过程中为了减少网络问题的影响,选择在局域网中进行。
四、I/O
磁盘数据的读写的性能也会直接影响系统程序的性能,磁盘I/O系统是系统中最慢的部分。主要是CPU处理比磁盘物理操作块好几个数量级。针对I/O的场景模型,要考虑的有TPS、平均I/O数据、平均队列长度、平均服务时间、平均等待时间、IO利用率等指标。
定位分析:
衡量系统IO的使用情况,可以用sar、iostat、iotop等命令进行系统的IO监控分析。当系统利用率大于40%时,需要关注;大于60%需要密切关注;大于80%时,情况比较严重
四、其他分析方向
硬件
数据库
中间件
程序部分(前端、后端、业务逻辑等)
系统架构
系统受到病毒感染