[原创]阿里全链路压测学习及理解
最近,在做压测又无意间刷到之前阿里全链路压测的贴子,温习下同时结合最近的工作,也写些自己的一些见解!
1、为什么会有全链路压测这回事?
- 业务的发展太猛,技术架构变的更复杂,系统存在诸多的不确定性
- 线下测试手段不能完全的复制线上环境,无法真实模拟,有些无法去验证
2、现在的我们是如何做压测?
- 线上单机和单系统压测
- 容量规划
这种方式的压测问题在哪里?
- 单系统没有问题,但不能代表整体都ok
- 单系统没有问题,但系统之间相互调用和依赖,不能确保都ok
- 单系统没有问题,但在实际时,某个节点有问题后,传导会有一连串的问题
- 等等
3、新的全链路压测实施流程
核心思路:
- 我们要线上环境,同样的用户规模,同样的用户业务场景,同样的业务量等,简而言之,就是镜像一套
新的流程:
全链接压测准备阶段
- 梳理确定压测目标->梳理系统架构->梳理业务模型->压测脚本开发-> 生产环镜像改造->全链接环境联调->单链接压测试试跑->全链接压测试试跑-复盘总结