性能测试常见分类:
-
负载测试(Load testing)
负载测试是不断增加系统的负载,直到负载达到阈值——评估系统在预期工作负载下的性能的测试。
这里增加负载的意思是在测试中增加并发用户数量、用户交互等,通常是在可控的环境下进行。典型的负载测试包括在负载测试过程中确定响应时间,吞吐量,误码率等。
该方法可以找到系统的性能极限,可以为性能调优提供相关数据。该类方法通常要基于或模拟系统真实运行环境,且选取的业务场景也要尽可能地与实际情况相符。
举例:
对于具有预计1000并发用户负载的新开发的应用程序来说,则需要创建负载测试的脚本,配置1000个虚拟用户,然后持续运行1小时。负载测试完成后,再分析测试结果,确定应用程序将如何在预期的峰值负载下运行。 -
压力测试(Stress Testing)
压力测试是指当硬件资源如cpu、内存、磁盘空间等不充足时对软件稳定性的检查。
压力测试属于负面测试(Negative testing),使大量并发用户/进程加载软件以使系统硬件资源不能应付。这个测试也被称为是疲劳测试(Fatigue testing),通过超出其能力的测试来捕获应用程序的稳定性。
压力测试的主要思想是确定系统故障,关注系统如何优雅地恢复正常,这种质量被称为是可恢复性。
负面测试(Negative testing)是相对于正面测试(Positive testing)而言的。正面测试就是测试系统是否完成了它应该完成的功能;而负面测试就是测试系统是否不执行它不应该完成的操作。 -
尖峰测试(Spike testing)
尖峰测试(Spike testing)其实可以算作是压力测试(Stress Testing)的子集。
尖峰测试是在目标系统经受短时间内反复增加工作负载,以至超出预期生产操作的负载量时,分析系统的行为,验证其性能特征。它还包括检查应用程序是否可以从突然增加的超预期负荷中恢复出来的测试。
举例:
在电商应用程序中经常有“整点秒杀”的活动,所以在整点时间前后的两三分钟时间里,会有巨大数量的用户进入到该活动中秒杀商品。尖峰测试就是为了分析这类场景。 -
可扩展性测试(Scalability Testing)
可扩展性测试(Scalability Testing)是一种非功能的测试,它测试软件应用程序以确定所有非功能能力的扩展能力,如用户负载支持、事务数量、数据量等。 -
容量测试(Volume testing)
容量测试是一种非功能的测试,它通过向应用程序中添加大量的数据来实现。可以通过向数据库插入大量的数据或让应用程序处理一个大型文件来进行测试应用程序。
通过容量测试,可以识别应用程序中具有大数据时的瓶颈,检查应用程序的效率,进而得到不同数据量级下应用程序的性能。
举例:
在一个新开发的网络游戏应用程序中,在进行容量测试时,可以通过向数据库中插入数百万行的数据,然后在这些数据的基础上进行性能的测试。
注意,这里所说的数据一定是符合其功能场景的,不是毫无关系的数据。 -
持久测试(Endurance testing)
持久测试(Endurance testing),也被称为是浸泡测试(Soak Testing),它也是一种非功能的测试。
持久测试是指在相当长的时间内使用预期的负载量对系统进行测试,以检查系统的各种行为,如内存泄露、系统错误、随机行为等。
这里的提到的相当长的时间是相对而言的,举例来说,如果一个系统设计为运行3个小时的时间,那可以使用6个小时的时间来进行持久测试;如果设计为5个小时的时间,不妨用10个小时的时间来进行持久测试。对于现在的许多网络类应用程序,通常情况下会持续运行好多天,那么进行持久测试时可以选择更长的时间段。