性能测试分析
一、分析原则
1、根据场景运行过程中的错误提示;
2、根据收集到的监控指标数据;
3、分段排查便于快速定位问题。
分析实例一:
Error:Failed to connect to server "192.168.1.43:8080":[10060] connection Error:timed out Error:server"192.168.1.43"has shut down the connection prematurely |
A:应用服务死掉。
(小用户时:程序上的问题。程序上处理数据库的问题)
B:应用服务没有死。
(应用服务参数设置的问题)
例:在许多客户端连接weblogic应用服务器被拒绝,而在服务器端没有错误显示,则有可能是weblogic中的server元素的acceptbacklog属性值设置过低,如果连接时收到connection refused消息,说明应该提高该值,每次增加25%。
C:数据库的连接
(1、在应用服务的性能参数可能设置的太小了。2、数据库启动的最大连接数(跟硬件和内存有关))。
分析实例二:
Error:Page download timeout(120 seconds) has expired |
A:可能应用服务参数设置太大导致服务器的瓶颈
B:可能是在主页面中图片太多
C:在程序处理表的时候检查字段太大太多
二、常用指标分析方法
1、内存
1、UNIX资源监控中指标内存页交换速率(Paging rate),如果该值偶尔走高,表明当时有线程竞争内存。如果持续走高,则内存可能是瓶颈,也可能是内存访问命中率低。
2、Windows 资源监控中,如果ProcessPrivate Bytes计数器和ProcessWorking Set计数器的值在长时间内持续升高,同时MemoryAvailable bytes计数器的值持续降低,则很可能存在内存泄露。
瓶颈征兆:
1、很高的换页率(high pageout rate);
2、进程进入不活动状态;
3、交换区所有磁盘的活动次数很高;
4、很高的全局系统CPU利用率;
5、内存不够出错(out of memory errors)。
2、CPU
1、UNIX资源监控(windows操作系统同理)中指标CPU占用率(CPU utilization),如果该值持续超过95%,表明CPU是瓶颈。可以考虑增加一个处理器或者换一个更快的处理器。如果服务器专用与sql server,可接受的最大上限是80-85%,合理使用范围是60-70%。
2、windows资源监控中,如果SystemProcessor Queue Length 大于2,而处理器利用率(Processor Time)一直很低,则存在处理器阻塞。
瓶颈征兆:
很慢的响应时间(slow response time)
CPU空闲时间为零(zero percent idle CPU)
过高的系统占用CPU时间(high percent system CPU)
过高的用户占用CPU时间(high ercent user CPU)
长时间的有很长的运行进程队列(large run queue size sustained over time)
3、磁盘I/O
1、UNIX资源监控(windows操作系统同理)中指标磁盘交换率(Disk rate),如果该参数值一直很高,表明I/O有问题,可以考虑更换更快的硬盘系统。
2、windows资源监控中,如果Disk Time和Avg.Disk Queue Length的值很高,而Page Reas/sec页面读取操作速率很低,则可能存在磁盘瓶颈。
瓶颈征兆:
过高的磁盘利用率(high disk utilization)
太长的磁盘等待队列(large disk queue length)
等待磁盘I/O的时间所占的百分率太高(large percentage of time waiting for disk I/O)
太高的物理I/O速率:large physical I/O rate(not sufficient in itself)
过低的缓存命中率(low buffer cache hit ratio(not sufficient in itself))
太长的运行进程队列,但CPU却空闲(large run queue with idle CPU)
三、oracle数据库
1、如果自由内存接近于0而且库快存或数据字典快存的命中率小于0.90,那么需要增加SHARED_POOL_SIZE的大小。
快存(共享SQL区)和数据字段快存的命中率:
select (sum(pins0reloads))/sum(pins) from v$librarycache;
select (sum(gets-getmisses-usage-fixed))/sum(gets) from v$rowcache;
自由内存:
select * from v$sgastat where name ='free memory';
2、如果数据库的缓存命中率小于0.90,那么需要加大DB_BLOCK_BUFFERS参数的值(单位:块)。
缓存区高速缓存命中率:
select name,value from v$sysstat where name in ('db block gets','consistent gets'.'physical reads');
Hit Ratio=1-(physical reads/(db block gets+consistent gets))
3、如果日志缓冲区申请的值较大,则应加大LOG_BUFFER参数的值。
日志缓冲区的申请情况:
select name,value from v$sysstat where name = 'redo log space requests';
4、如果内存排序命中率小于0.95,则应加大SORT_AREA_SIZE以避免磁盘排序。
内存排序命中率:
select round((100*b.value)/decode((a.value+b.value),0,1,(a.value+b.value)),2) from v$sysstat a,v$sysstat b where a.name='sorts(disk)' and b.name='sorts (memory)'
SQL语句优化的目标
1、去掉不必要的大表全表扫描;
2、检查优化索引的使用,这对于提高查询速度来说非常重要;
3、检查子查询,考虑SQL子查询是否可以用简单连接的方式进行重新书写;
4、调整PCTFREE和PCTUSED等存储参数优化插入、更新或者删除等操作;
5、考虑数据库的优化器;
6、在多个CPU的情况下考虑并行查询。
四、问题排查方法
查找瓶颈的难以程度,由易到难:
服务器硬件瓶颈->网络瓶颈->应用瓶颈->服务器操作系统瓶颈(参数配置)->中间件瓶颈(参数配置,数据库,web服务器等)。