本文将深入探讨性能测试的重要性,介绍不同类型的性能测试,并解释如何通过性能测试来优化系统性能。从产品经理的视角出发,我们将学习如何关注关键性能指标,以及如何阅读和理解性能测试报告。
小A接到个网站设计需求,由于是感兴趣的领域,拿到手可开心了。哼哧哼哧画了好几天原型,又拿着菜刀架在开发脖子上猛干了几天,终于在一个月黑风高的晚上上线了这个网站。
然而过了不久,客服电话被打爆,所有投诉都是一句话“你xxx还让不让人用了!一直在加载是什么鬼?”于是,在第一百个投诉打来的时候,小A已经骑着电驴去送外卖了。而导致小A捡瓶盖的罪魁祸首浏览人数过多,系统直接崩了。
至今,被采访的小A都表示“现在就是后悔,非常后悔,怎么就没盯下性能测试呢?”为了避免过早和小A合伙送外卖,我们一起来学习下性能测试吧。
性能测试是验证软件系统是否能够达到用户提出的性能指标,同时发现软件系统中存在的性能瓶颈,优化软件,最后起到优化系统的目的。
在产品上线前,我们无法知道用户数量,而且用户场景也存在不确定性,一旦用户多了就可能整出各种幺蛾子,所以需要进行系统性能测试。
性能测试可以告诉我们用户数量增加、系统负载增加时,系统能承受的并发用户数量,以及带宽是否够用、cpu是否够用、内存是否够用、硬盘速度是否跟得上等问题。
性能测试的类型和划分网上有很多定义,我这取比较常见的几个
为了安稳端好产品经理的饭碗,我们需要关注这些性能点:
上面叨叨了这么多,大家对性能测试和需要关注的内容应该有所了解了,那么作为产品,我们怎么对性能测试进行验收呢?为了防止被忽悠,这里我们需要了解一些性能的关键指标:
由于我们是只用指手画脚,不用自己操刀的产品经理,我们只需要重点关注外部指标就可以了。接下来我们学习这些外部指标。
对于响应时间,我们比较关注的是它的均值、中位值、P95值、P99值等。平均值和中位值比较好理解,P分位值是什么意思呢?以P95为例,将响应时间从小到大排列,顺序处于95%位置的值就是P95值。
系统吞吐量则有几个重要参数:QPS(TPS)、并发数、响应时间:
QPS(TPS)=并发数/平均响应时间
可以看出一个系统吞吐量通常由QPS(TPS)、并发数两个因素决定,每套系统这两个值都有一个相对极限值,在应用场景访问压力下,只要某一项达到系统最高值,系统的吞吐量就上不去了,如果压力继续增大,系统的吞吐量反而会下降。
在低吞吐量下的响应时间的均值、分布比较稳定,不会产生太大的波动。而在高吞吐量下,响应时间会随着吞吐量的增长而增长,增长的趋势可能是线性的,也可能接近指数的。当吞吐量接近系统的峰值时,响应时间会出现激增。
上图便是吞吐量、响应时长、并发数几者的关系图。横坐标是并发数,绿线是CPU使用率,紫线是吞吐量,即QPS,蓝线是响应时间。
理论终归于实践,能看懂测试报告,那读这篇文章的目的才算达到了。
1.1 测试目标
本次测试的目的在于探查XXX项目二期重构环境的系统业务处理性能,以及在高负载情况下的系统表现。
1.2 指标和术语
描述本次测试中涉及到的性能指标术语
2.1 测试环境
服务器:
客户机:
2.2 测试工具
3.1 测试类型
本次性能测试将主要采用以下几种测试类型:
3.2 业务模型
针对系统接口,究竟哪些需要被纳入压测范畴?不同事务应该以何种比例被调用,这是需要建模设计的,也是性能测试的难点之一。
通过对于项目架构和业务场景分析,设计以下业务模型进行模拟和测试:
场景1:简单业务场景
场景2:混合业务场景
3.3 加密验签处理
由于系统对于所有事务请求都进行了加密验签处理,因此在本次性能测试中,需要对请求报文进行一致的加密和签名。处理逻辑如下:
3.4 压力梯度
对于3.2所述场景,分别进行梯度加压,从100并发开始,每次递增100并发数,直至到达系统瓶颈。
4.1 聚合报告
场景1-10并发-循环5次
场景1-500并发-循环1次
场景1-550并发-循环1次
4.2 系统吞吐量
场景1-550并发-循环1次
场景2-450并发-循环10次
4.3 资源占用率
最优负载条件下:CPU使用率
内存占用率
磁盘使用率
5.1 测试结论分析
经过多次测试和数据报表分析,可以得出如下结论:
5.2 问题
测试过程中发现了如下显著问题:
作者:阿宅的产品笔记;公众号:阿宅的产品笔记
本文由 @阿宅的产品笔记 原创发布于人人都是产品经理。未经许可,禁止转载。
题图来自Unsplash,基于CC0协议。
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务