主要是以下几大块
1、整体系统cpu利用率
2、内存利用率
3、磁盘I/O的利用率和延迟
4、网络利用率
(一)cpu
一般我们想要系统的可用的cpu不要少于20%,如果超过这个阀值,我们应该分析为什么cpu的使用率这么高,这时可以看服务器的日志,DB的日志 结合一些命令如top、free、uptime、sar分析
之前我们看这些东西的时候,用到监控工具:zabbix,可以有一个很直观的界面去看cpu/内存等的上涨的趋势以及占用情况, 选择正确的主机,选择要查看的图形即可出图
(二)内存
当可用的内存太小时,系统的进程就会被阻塞,应用也会被变得非常缓慢,之前我在测试就碰到好多次,因为内存不够,进程数上不去,最后还是在linux下面跑的脚本,才达到足够的进程数的
查看内存的占用情况和查看cpu是差不多的方法,不多说
(三)网络
现在系统之间的交互,尤其是跨机器间的都是基于网络的,因此网络带宽,响应时间,网络延迟,阻塞等都是影响系统性能的因素。
我们要考虑的是防火墙是否开启,端口的访问是否有限制,带宽有没有被限制,网络的时延等
(四)I/O读写
I/O读写的性能是直接会影响到系统的性能,而且当比较频繁的读写的时候,如果i/o得不到满足,会导致应用的阻塞。之前有一次频繁读数据库,一直查询,导致数据库崩了,哈哈哈